推出芯片級多方安全計算方案,「紫先科技」將為大模型數(shù)據(jù)安全提供基礎(chǔ)設(shè)施
隨著 AI 大模型的興起,大模型的安全合規(guī)問題頻發(fā),逐漸引起了各國政府和行業(yè)各界對其數(shù)據(jù)安全的關(guān)注。
在意大利,由于有用戶聲稱在 ChatGPT 的歷史對話中看到了其他人的聊天內(nèi)容。隨后,意大利數(shù)據(jù)保護(hù)局于 3 月底暫時禁用大模型,并對其涉嫌違反隱私規(guī)則展開調(diào)查。
在國內(nèi),大模型相應(yīng)創(chuàng)業(yè)風(fēng)起云涌之時,數(shù)據(jù)安全保護(hù)行動已經(jīng)開始。比如,4 月 11 日,國家互聯(lián)網(wǎng)信息辦公室便發(fā)布了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,當(dāng)中提出, 生成式人工智能服務(wù)者對于用戶的輸入信息和使用記錄承擔(dān)保護(hù)義務(wù)。在征求意見稿發(fā)布的前一日,中國支付清算協(xié)會甚至給從業(yè)人員發(fā)布了倡議,要求其不上傳相關(guān)的敏感信息,保護(hù)金融行業(yè)的涉密數(shù)據(jù)和材料。
目前,還有部分公司明確規(guī)范了 Chat GPT 使用,比如三星此前還將 ChatGPT 的上傳容量限制為 1024 字節(jié);還有包括臺積電、軟銀、沃爾瑪?shù)葟S商也宣布限制使用生成式 AI 工具。
不過,隨著大模型廠商增加, 相關(guān)的數(shù)據(jù)安全賽道卻幾乎是一片空白——大模型的安全計算是一項涉及千億級參數(shù)的計算,而現(xiàn)有的隱私計算方案并沒有辦法同時滿足大模型場景下的高安全性、高性能、高通用性的保障要求。 比如,同步加密的方法在使用的過程中可能將計算性能降低五個數(shù)量級, 聯(lián)邦學(xué)習(xí)不適用于模型推理階段等等?;诎踩喾接嬎愕姆桨甘乾F(xiàn)有隱私計算方案當(dāng)中最有可能在大模型領(lǐng)域應(yīng)用落地的技術(shù)。
針對大模型的數(shù)據(jù)安全隱患,國內(nèi)已經(jīng)有了相應(yīng)的創(chuàng)業(yè)公司?!缸舷瓤萍肌咕褪且患矣晒韫?AI 科學(xué)家以及國內(nèi)高校學(xué)者聯(lián)合創(chuàng)立的、為大模型應(yīng)用方提供基于安全多方計算方案的云服務(wù)平臺廠商。
「紫先科技」CEO 周興博士向 36 氪表示,一般而言,大模型從產(chǎn)生到落地應(yīng)用包括三個階段,包括大模型訓(xùn)練階段、大模型微調(diào)階段、大模型的應(yīng)用階段。其中,數(shù)據(jù)安全問題一般高發(fā)于對模型定制微調(diào)和應(yīng)用階段。這主要源于,大模型落地的協(xié)作過程中存在著數(shù)據(jù)所有權(quán)和使用權(quán)的博弈。
一般而言,大模型的訓(xùn)練需要大量的數(shù)據(jù)、算力、AI 人才,對于頭部大模型廠商來說,未來大概率不會做出開源的決定。因此,各個領(lǐng)域的應(yīng)用廠商若要開發(fā)出有競爭力的行業(yè)專屬大模型,需要利用自身私域數(shù)據(jù)以及融合了本領(lǐng)域?qū)I(yè)知識的高質(zhì)量標(biāo)注對基礎(chǔ)大模型做定制微調(diào),以強化大模型在本領(lǐng)域的專業(yè)能力。
這種流程盡管符合大模型廠商的數(shù)據(jù)訴求,但站在應(yīng)用商公司的角度來看,用戶的私域?qū)I(yè)數(shù)據(jù)和微調(diào)后的增量參數(shù)均是其商業(yè)核心壁壘所在,并不愿意把寶貴資產(chǎn)所有權(quán)讓渡。同時在應(yīng)用階段,調(diào)用大模型的交互信息也涉及到用戶商業(yè)機密。
因此,數(shù)據(jù)安全是大模型實現(xiàn)大規(guī)模應(yīng)用的必要基礎(chǔ),要解決這一悖論所衍生出的數(shù)據(jù)安全風(fēng)險,周興博士認(rèn)為,如果能夠基于多方安全計算架構(gòu)做好大模型定制微調(diào)和應(yīng)用服務(wù),便可保證雙方的隱私安全。
" 我們希望通過隱私計算的方式,讓大模型公司和模型應(yīng)用商之間的橋梁可以順暢搭建起來 ",周興博士表示。據(jù)介紹,在商業(yè)層面,「紫先科技」所提供的數(shù)據(jù)安全服務(wù)將建立在云上,未來將與大模型廠商合作,為下游的大模型應(yīng)用商提供一站式的模型定制微調(diào)和應(yīng)用服務(wù)。
這一方案如何切實保障數(shù)據(jù)安全?周興博士表示,「紫先科技」的核心技術(shù)是一套基于 FPGA 芯片的安全多方計算方案 "PPLMAC",是目前全球唯一可滿足大模型數(shù)據(jù)安全場景對高安全性、高計算性能和高通用性要求的解決方案。
據(jù)其介紹,在保證數(shù)據(jù)安全的前提下,基于獨創(chuàng)的芯片設(shè)計,該方案可以將隱私計算性能與明文計算性能差距縮小到一個數(shù)量級以內(nèi),并可應(yīng)用于模型微調(diào)和推理環(huán)節(jié)。
周興博士表示,為了降低使用門檻,「紫先科技」還為使用該方案的算法工程師們提供了大模型編程框架平臺,可以較低成本的實現(xiàn)移植開發(fā),不用對原來的算法程序做出改變。
目前,「紫先科技」已經(jīng)完成隱私計算 FPGA 加速卡產(chǎn)品化,技術(shù)成果已提交專利申請,并于 2022 年 6 月在國際頂級計算機學(xué)術(shù)會議 ACM ISCA 發(fā)表相關(guān)論文。公司計劃從金融、企業(yè)服務(wù)等剛需領(lǐng)域切入,目標(biāo)是成為大模型數(shù)據(jù)安全基礎(chǔ)設(shè)施服務(wù)提供商。
「紫先科技」在 2022 年曾經(jīng)獲得奇績創(chuàng)壇的天使輪融資,目前正啟動新一輪的融資。團隊方面,創(chuàng)始人周興博士曾經(jīng)在 Google、Facebook AI 研究院有近 10 年的工作經(jīng)驗,在 Facebook AI 研究院帶領(lǐng)團隊創(chuàng)建隱私計算 AI 框架 CrypTen 并開源,并全程參與了 Facebook 系列大語言模型的研發(fā)。團隊其他核心技術(shù)成員大部分出自清華計算機系。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com