ITBear旗下自媒體矩陣:

字節(jié)跳動Jeddak Team在iDASH 2023隱私計(jì)算大賽上獲得優(yōu)異成績

   時間:2023-11-24 18:30:10 來源:互聯(lián)網(wǎng)編輯:瑞雪 發(fā)表評論無障礙通道

近日,2023 iDASH 國際隱私計(jì)算競賽落下帷幕,字節(jié)跳動安全研究-Jeddak可信隱私計(jì)算團(tuán)隊(duì)聯(lián)合南京大學(xué)、南方科技大學(xué)、香港城市大學(xué)組建的 Jeddak Team 聯(lián)合戰(zhàn)隊(duì),獲得機(jī)密計(jì)算賽道第一名、同態(tài)加密賽道第二名的優(yōu)異成績。在iDASH 2022大賽上,Jeddak team首次參加大賽,即入圍可信計(jì)算和區(qū)塊鏈賽道前三。

iDASH是數(shù)據(jù)隱私與安全計(jì)算領(lǐng)域的國際最高規(guī)格競賽,由美國國立衛(wèi)生研究院(NIH)主辦,歷年來吸引了全球頂尖高校和科技公司的積極參與。今年的大賽共吸引了來自12個國家的62支隊(duì)伍參賽,包括哈佛大學(xué)、耶魯大學(xué)、麻省理工學(xué)院、加州大學(xué)圣迭戈分校以及英特爾、騰訊、螞蟻集團(tuán)、阿里巴巴等隊(duì)伍。

此次比賽設(shè)置了機(jī)密計(jì)算、同態(tài)加密、區(qū)塊鏈共3個賽道,組委會根據(jù)各賽題場景篩選出滿足要求的方案設(shè)計(jì)和代碼實(shí)現(xiàn),然后從性能、精度等指標(biāo)維度對各參賽隊(duì)進(jìn)行排名。作為 Best-Performing Team,Jeddak team團(tuán)隊(duì)成員受邀在耶魯大學(xué)舉行的 iDASH Workshop 2023 上展示了參賽方案。

圖片1.png

賽題總覽

隱私計(jì)算是一種能夠保護(hù)數(shù)據(jù)隱私的計(jì)算解決方案,通過前沿密碼學(xué)、可信硬件等先進(jìn)技術(shù)手段,為用戶提供安全合規(guī)的數(shù)據(jù)流通交易與融合共享,以此發(fā)揮更大價值;同時也滿足了數(shù)據(jù)的“可用不可見”。隱私計(jì)算通??捎伞败?硬”兩類技術(shù)實(shí)現(xiàn):前者本質(zhì)是圍繞數(shù)據(jù)自身做隱私保護(hù),例如此次賽道之一的同態(tài)加密;而后者是對數(shù)據(jù)所處的計(jì)算環(huán)境做安全防護(hù),例如另一賽道的機(jī)密計(jì)算。一般情況下的常規(guī)計(jì)算都是在數(shù)據(jù)明文基礎(chǔ)上進(jìn)行的,而同態(tài)加密計(jì)算是指:在其對應(yīng)的密文基礎(chǔ)上執(zhí)行運(yùn)算。兩者分別針對明、密文數(shù)據(jù)的基本操作,如加法和乘法也都是一一對應(yīng)的、并且最終計(jì)算結(jié)果相同;區(qū)別只是其中之一被加密,所以只有該數(shù)據(jù)的所有者因掌握了密鑰才能解密獲得結(jié)果。形象地講,兩者是計(jì)算等效的“平行世界”關(guān)系,其中同態(tài)加密額外提供了隱私保護(hù)能力,因?yàn)樵谡麄€過程中數(shù)據(jù)始終處于密態(tài)。另外一類以硬件機(jī)制為代表的機(jī)密計(jì)算,可簡單理解為:構(gòu)建了一個與外界隔離的沙箱環(huán)境,于是敏感數(shù)據(jù)在里面的計(jì)算使用不受干擾,實(shí)現(xiàn)了機(jī)密性和完整性保護(hù)。

在生物信息領(lǐng)域,一方面對個人數(shù)據(jù)的隱私保護(hù)至關(guān)重要,另一方面醫(yī)療單位和研究機(jī)構(gòu)又迫切需要打通各方數(shù)據(jù)。因此,隱私計(jì)算已逐漸成為該領(lǐng)域的關(guān)鍵技術(shù),促進(jìn)多方共同參與、合規(guī)挖掘利用數(shù)據(jù)的寶貴價值:來自不同數(shù)據(jù)源的生信數(shù)據(jù)經(jīng)過加密處理后,存儲在具備隱私計(jì)算能力的云平臺上,進(jìn)而為泛在數(shù)據(jù)使用提供所需服務(wù)。例如,隱私計(jì)算能夠幫助醫(yī)療、保險(xiǎn)機(jī)構(gòu)利用個體基因數(shù)據(jù)有效地預(yù)測潛在疾病風(fēng)險(xiǎn),從而作出綜合評判。研究人員也可以通過隱私計(jì)算挖掘數(shù)據(jù)多維度價值,建立精準(zhǔn)模型輔助診療、加速新藥物研發(fā)等,推動生物信息領(lǐng)域的研究和應(yīng)用創(chuàng)新。

在本屆iDASH競賽中,機(jī)密計(jì)算賽道要求在確保全過程基因數(shù)據(jù)的安全隱私前提下,實(shí)現(xiàn)高效的基因組推斷。Jeddak團(tuán)隊(duì)提出了基于可信執(zhí)行環(huán)境(TEE)的解決方案,該方案可以有效應(yīng)對各類高負(fù)載的計(jì)算任務(wù)(如數(shù)據(jù)清洗、結(jié)構(gòu)預(yù)測、差異表達(dá)分析、突變檢測等),不但能夠準(zhǔn)確完成、同時也提供了能效更高的安全隱私保障。

同態(tài)加密賽道要求根據(jù)基因數(shù)據(jù)的密文、來識別基因樣本和基因數(shù)據(jù)庫之間的親屬關(guān)系。Jeddak團(tuán)隊(duì)通過分析基因數(shù)據(jù)的特征,提出了親屬關(guān)系判別算法,以及相應(yīng)的基因數(shù)據(jù)編碼方式和高性能密文計(jì)算方案。不僅能夠高效處理基因組數(shù)據(jù),還適用于各種高維度的隱私數(shù)據(jù)密態(tài)分析。

圖片2.png

機(jī)密計(jì)算賽道揭秘

機(jī)密計(jì)算賽題是加固并優(yōu)化現(xiàn)有的基因組推斷算法PanGenie,以提高其在處理人類基因數(shù)據(jù)過程中的計(jì)算性能與數(shù)據(jù)安全。目前,變異感知的泛基因組圖(Variation-aware Pangenome Graph)已成為一種更為有效的人類參考基因組表示形式,而短序列片段測序(Short-reads Sequencing)由于其高效性和低成本仍然是最實(shí)用的測序方式。PanGenie則是基于這兩類信息設(shè)計(jì)的一類高效基因組推斷算法。今年的iDASH競賽首次引入了基于AMD SEV技術(shù)的可信執(zhí)行環(huán)境,以確保在數(shù)據(jù)處理過程中的安全隱私性。此外,比賽還對資源使用進(jìn)行了嚴(yán)格限制,規(guī)定參賽隊(duì)伍最多使用2臺虛擬機(jī),每臺虛擬機(jī)只能使用4個計(jì)算核心,并要求可信計(jì)算基(TCB)不超過1MB。本次比賽主要考察機(jī)密計(jì)算系統(tǒng)的設(shè)計(jì)與優(yōu)化水平。

針對本次賽題的考核要求,Jeddak Team對指定算法PanGenie與其實(shí)現(xiàn)進(jìn)行了細(xì)致全面的分析,從并行化、內(nèi)存優(yōu)化、執(zhí)行流程優(yōu)化、編譯期優(yōu)化等多個角度對原有實(shí)現(xiàn)進(jìn)行了重構(gòu)創(chuàng)新,在保證方案的安全性前提下,高效發(fā)揮利用給定的計(jì)算資源、突破能效瓶頸。下面介紹Jeddak Team方案的主要優(yōu)化點(diǎn):

首先參考下圖,Jeddak Team基于賽題中最多使用2臺虛擬機(jī)的條件,將整個基因組推斷的工作負(fù)載拆分到了2個虛擬機(jī)中并行執(zhí)行。而在每個工作節(jié)點(diǎn)(Worker)中,工作流被分為了兩個階段:預(yù)處理階段PanGenie工作負(fù)載階段

圖片3.png

預(yù)處理階段

1. 在本階段,2個工作節(jié)點(diǎn)首先會對預(yù)先放置于其磁盤內(nèi)的數(shù)據(jù)文件進(jìn)行數(shù)據(jù)提取,該過程中節(jié)點(diǎn)會提取出數(shù)據(jù)中的關(guān)鍵信息,用作后續(xù)的參數(shù)選擇。

2. 在前期調(diào)研中Jeddak Team發(fā)現(xiàn):一個關(guān)鍵的哈希表的大小會對整體的性能造成極大的影響,而適當(dāng)?shù)剡x擇較大的規(guī)模會比選擇小哈希表所造成的開銷少很多。為此Jeddak Team采用了自適應(yīng)的哈希表規(guī)模選取策略,會根據(jù)實(shí)際的數(shù)據(jù)規(guī)模自適應(yīng)地選擇參數(shù)。

3. 在實(shí)際情況下,一份樣本包含了多個染色體,而不同染色體對應(yīng)的基因數(shù)據(jù)的分布并不均衡,所以簡單粗暴地按照編號來進(jìn)行分配會導(dǎo)致工作節(jié)點(diǎn)負(fù)載的不平均,為此Jeddak Team采用了貪心算法以實(shí)現(xiàn)節(jié)點(diǎn)間的負(fù)載均衡。

圖片4.png

PanGenie工作負(fù)載階段

在這個階段工作節(jié)點(diǎn)會根據(jù)分配到的染色體編號來并行化數(shù)據(jù)處理,因?yàn)槊總€染色體對應(yīng)的計(jì)算邏輯是獨(dú)立的。于是能夠最大發(fā)揮工作節(jié)點(diǎn)的計(jì)算能力。

由于任務(wù)是分配到2個節(jié)點(diǎn)上執(zhí)行,該過程中需要對統(tǒng)計(jì)信息(Read Variant、Load KMer Statistics)、計(jì)算結(jié)果(Genotyping)進(jìn)行同步,Jeddak Team對所有的通信數(shù)據(jù)進(jìn)行加密以保證數(shù)據(jù)安全。

圖片5.png

針對PanGenie的工作負(fù)載階段,Jeddak Team也采用了多個優(yōu)化方案來一并提高整體的算法執(zhí)行效率:

● PanGenie算法中使用了隱馬爾可夫模型(Hidden Markov Model,HMM)來進(jìn)行基因型的推斷,Jeddak Team針對算法中HMM的發(fā)射概率以及轉(zhuǎn)移概率進(jìn)行了優(yōu)化。具體來說,Jeddak Team通過預(yù)處理部分概率值,降低每次實(shí)時計(jì)算的開銷,從而減少了整個HMM在計(jì)算過程中的復(fù)雜度。

● 充分發(fā)揮AMD CPU提供的AVX指令集來提高對浮點(diǎn)型數(shù)據(jù)處理的效率。相較于分別計(jì)算多個浮點(diǎn)數(shù),Jeddak Team通過單指令流多數(shù)據(jù)流(Single Instruction Multiple Data,SIMD)技術(shù),實(shí)現(xiàn)了對四個浮點(diǎn)數(shù)的同時運(yùn)算,從而成倍提高了計(jì)算效率。

圖片6.png

根據(jù)主辦方設(shè)置的兩個測試樣例,Jeddak Team的方案在僅使用2臺安全虛擬機(jī)、共計(jì)8個可用線程的嚴(yán)格限制下,最多耗費(fèi)2.6小時就運(yùn)行完成了測試,成為機(jī)密計(jì)算領(lǐng)域13個參賽隊(duì)伍中唯一完賽的團(tuán)隊(duì);同時Jeddak Team的方案保證了準(zhǔn)確率在99%以上,且可執(zhí)行代碼(TCB)也僅有920KB大小。

圖片7.png

整個方案是Jeddak Team聯(lián)合香港城市大學(xué)、南方科技大學(xué)共同設(shè)計(jì)與實(shí)現(xiàn)。最終在本屆iDash大賽上取得了第一名的優(yōu)異成績。

同態(tài)加密賽道揭秘

同態(tài)加密賽題設(shè)定的場景是:法醫(yī)鑒定時,檢查機(jī)構(gòu)使用嫌犯基因、向數(shù)據(jù)機(jī)構(gòu)的基因數(shù)據(jù)庫去查詢是否存在嫌疑人的親屬,從而快速定位嫌疑人身份。賽題要求檢查機(jī)構(gòu)和數(shù)據(jù)機(jī)構(gòu)的基因數(shù)據(jù)都需要使用同態(tài)加密技術(shù)保護(hù),數(shù)據(jù)經(jīng)過加密后會交由一個第三方計(jì)算機(jī)構(gòu)進(jìn)行密文預(yù)測,最后得到的密文結(jié)果可以被檢查機(jī)構(gòu)解密作為判斷親屬關(guān)系的依據(jù)。

圖片8.png

比賽要求判別400條查詢樣本在一個擁有2000條基因數(shù)據(jù)的數(shù)據(jù)庫中是否存在親屬。其中正負(fù)查詢樣本的數(shù)量相同。在整個計(jì)算流程中,檢查機(jī)構(gòu)與數(shù)據(jù)機(jī)構(gòu)的基因數(shù)據(jù)不能被泄露,計(jì)算機(jī)構(gòu)必須在密文狀態(tài)下處理基因數(shù)據(jù),并且檢查機(jī)構(gòu)與數(shù)據(jù)機(jī)構(gòu)在數(shù)據(jù)加密前不能進(jìn)行相關(guān)預(yù)處理,即提高了系統(tǒng)能效要求。為此,Jeddak Team基于全同態(tài)技術(shù)提出了兩種安全高效的密文關(guān)系預(yù)測方案。

在第一個方案中,Jeddak Team分析了基因數(shù)據(jù)的特點(diǎn):發(fā)現(xiàn)當(dāng)一條待查詢的基因數(shù)據(jù)在數(shù)據(jù)庫中存在親屬時,它更有可能與數(shù)據(jù)庫樣本維度的中心點(diǎn)有較大的距離。進(jìn)一步講,如果將基因數(shù)據(jù)與數(shù)據(jù)庫中心、待查詢數(shù)據(jù)集中心的距離相減,這種距離差異可以更清晰地劃分有、無親屬關(guān)系的查詢樣本。

圖片9.png

基于以上數(shù)據(jù)集特點(diǎn),Jeddak Team設(shè)計(jì)了使用同態(tài)加密方案來計(jì)算樣本距離數(shù)據(jù)庫、查詢數(shù)據(jù)集中心的距離差異。Jeddak Team將距離差異的計(jì)算方法優(yōu)化成若干加減法和一次內(nèi)積運(yùn)算組成的算法。在加密數(shù)據(jù)時,Jeddak Team采用CKKS加密算法并通過系數(shù)編碼的方式將多個基因數(shù)據(jù)加密到一條密文多項(xiàng)式的系數(shù)上?;谶@種編碼方式,可以通過一次多項(xiàng)式乘法計(jì)算出兩組密文數(shù)據(jù)向量的內(nèi)積,從而得到一條樣本對應(yīng)的預(yù)測得分。查詢機(jī)構(gòu)可以解密、并根據(jù)得分大小判斷出查詢樣本是否在數(shù)據(jù)庫內(nèi)存在親屬的可能性。

圖片10.png

第二個方案則是從直觀認(rèn)識出發(fā):如果兩條基因數(shù)據(jù)存在親屬關(guān)系,那它們應(yīng)當(dāng)有更小的距離。基于此,Jeddak Team首先通過條件概率的方法,計(jì)算得到每個等位基因?qū)ε袛鄻颖居H屬關(guān)系的權(quán)重。實(shí)操中選取1000個權(quán)重值最大的基因作為判別親屬關(guān)系的依據(jù)。該方案使用了被選取的基因來計(jì)算每個查詢樣本與數(shù)據(jù)庫中心點(diǎn)的距離,從而作為每個樣本的預(yù)測結(jié)果。

圖片11.png

Jeddak Team依然采用CKKS算法實(shí)現(xiàn)了第二個方案,并利用復(fù)數(shù)的特點(diǎn)將每兩個相鄰的查詢數(shù)據(jù)加密分別加密到同一條密文的實(shí)部和虛部。在密文計(jì)算的過程中,Jeddak Team首先將被選取基因的明文掩碼作用在每一條加密數(shù)據(jù)上,然后將計(jì)算后的數(shù)據(jù)庫中心點(diǎn)和每條查詢數(shù)據(jù)均提取到密文的實(shí)部上。最終,查詢樣本與數(shù)據(jù)庫中心點(diǎn)的距離可以通過密文乘法和移位操作完成。

上述兩個方案是Jeddak Team與南京大學(xué)共同設(shè)計(jì)與實(shí)現(xiàn),最終在iDASH 2023競賽中以0.977的得分獲得了第二名的成績。

圖片12.png

Jeddak可信隱私計(jì)算平臺

iDASH競賽通常設(shè)定的是醫(yī)學(xué)場景,因?yàn)獒t(yī)療數(shù)據(jù)極其敏感,故要求使用隱私計(jì)算技術(shù)在密態(tài)數(shù)據(jù)基礎(chǔ)上執(zhí)行運(yùn)算,從而既實(shí)現(xiàn)業(yè)務(wù)目標(biāo)、又保障數(shù)據(jù)的安全隱私。此次Jeddak Team所使用的核心技術(shù)均源于自研的Jeddak可信隱私計(jì)算平臺,涵蓋機(jī)密計(jì)算、聯(lián)邦學(xué)習(xí)、多方安全計(jì)算、同態(tài)加密、差分隱私、區(qū)塊鏈等多種形態(tài)的產(chǎn)品技術(shù)。據(jù)悉,Jeddak可信隱私計(jì)算平臺近兩年在字節(jié)內(nèi)外實(shí)施了70余個隱私計(jì)算相關(guān)項(xiàng)目,典型如ToB側(cè)火山引擎和公司內(nèi)部的抖音用數(shù)管控等。

隱私計(jì)算在數(shù)據(jù)要素價值釋放過程中發(fā)揮著越來越重要的作用,但因處于早期發(fā)展階段,無論相關(guān)技術(shù)、產(chǎn)品和市場都亟待深入探索。字節(jié)跳動安全研究團(tuán)隊(duì)基于Jeddak的大量應(yīng)用實(shí)踐,總結(jié)出隱私計(jì)算基礎(chǔ)建設(shè)的三個關(guān)鍵問題:技術(shù)突破、產(chǎn)品創(chuàng)新、領(lǐng)域洞察,以下簡要介紹Jeddak Team的相關(guān)工作。

● 技術(shù)突破:核心是解決隱私計(jì)算的能效問題。例如此次iDASH競賽,不但要求分析建模精準(zhǔn)安全、而且對計(jì)算能效也提出很高要求。尤其是后者,被認(rèn)為是隱私計(jì)算大規(guī)模應(yīng)用和產(chǎn)業(yè)化的主要瓶頸。為此Jeddak Team從相關(guān)理論創(chuàng)新到工程優(yōu)化的多個層面做了大量努力,包括自主研發(fā)更高效的安全協(xié)議、硬件加速、以及特有的隱私計(jì)算網(wǎng)絡(luò)等,已全面接入內(nèi)外部業(yè)務(wù)?;谟邢拶Y源使用、端到端全鏈路執(zhí)行效果如:百億級數(shù)據(jù)的PSI隱私求交50分鐘完成;億級千維數(shù)據(jù)的XGB聯(lián)邦學(xué)習(xí)訓(xùn)練約4小時完成、十億級推理40分鐘內(nèi)完成;面向百億級數(shù)據(jù)的PIR匿蹤查詢約4小時完成;億級數(shù)據(jù)的MPC多方安全計(jì)算聚合查詢約1小時完成。這些真實(shí)業(yè)務(wù)場景下的能效突破,不但體現(xiàn)了Jeddak的技術(shù)先進(jìn)性、也奠定其成為工業(yè)級產(chǎn)品的基礎(chǔ)。

● 產(chǎn)品創(chuàng)新:現(xiàn)階段隱私計(jì)算產(chǎn)品的表現(xiàn)形式相對單一,主要面向解決數(shù)據(jù)流通共享中的一些特定隱私保護(hù)問題,缺乏廣泛賦能的平臺級和殺手級應(yīng)用。原因除了上述能效問題外,也缺乏集中呈現(xiàn)的豐富場景、以驅(qū)動更多嘗試探索。Jeddak Team充分結(jié)合公司內(nèi)外部大量實(shí)際需求不斷實(shí)踐,逐步形成了隱私計(jì)算產(chǎn)品的三類應(yīng)用范式:(1)與數(shù)據(jù)基礎(chǔ)設(shè)施融合。即隱私計(jì)算能力下沉、完整接管上游業(yè)務(wù)的用數(shù)過程。例如,針對抖音業(yè)務(wù)中臺的用數(shù)申請以滿足多源數(shù)據(jù)共享的聯(lián)合建模需求,Jeddak不但為此實(shí)現(xiàn)了數(shù)據(jù)的安全隱私保護(hù)及其所有權(quán)和使用權(quán)分離,同時也示范了隱私計(jì)算與大規(guī)?;A(chǔ)設(shè)施的深度融合實(shí)踐。(2)與數(shù)據(jù)產(chǎn)品融合。目的是把隱私計(jì)算功能集成進(jìn)數(shù)據(jù)套件以方便用戶觸達(dá),例如以插件的形式結(jié)合。于是當(dāng)使用套件服務(wù)來處理敏感數(shù)據(jù)時,便可直接開啟保序加密、同態(tài)加密等功能,完成相關(guān)密文計(jì)算,類似把ChatGPT能力與Office套件的各種應(yīng)用關(guān)聯(lián)打通。另一類創(chuàng)新是,Jeddak數(shù)據(jù)安全沙箱與一方敏感數(shù)據(jù)組合并集成進(jìn)便攜式服務(wù)器,形成數(shù)信一體機(jī)產(chǎn)品,從而滿足用戶數(shù)據(jù)不出域條件下、在TEE內(nèi)實(shí)現(xiàn)了多源數(shù)據(jù)的安全匯聚計(jì)算。(3)與數(shù)據(jù)應(yīng)用開發(fā)工具融合。目標(biāo)是輔助用戶便捷拓展領(lǐng)域應(yīng)用,例如Jeddak聯(lián)邦學(xué)習(xí)已嵌入公司AI推薦平臺、并配套研發(fā)了支持調(diào)用的SDK工具。使得平臺上游業(yè)務(wù)可同時獲取到聯(lián)邦學(xué)習(xí)能力、輕易構(gòu)建出自己的AI隱私計(jì)算應(yīng)用,從而打通利用更多敏感數(shù)據(jù)源、大幅提升建模質(zhì)量,其作用類似于大模型的領(lǐng)域開發(fā)工具鏈LangChain。從實(shí)踐效果看,這三種應(yīng)用范式基本覆蓋和滿足了公司內(nèi)外業(yè)務(wù)的相關(guān)需求,摸索出隱私計(jì)算廣泛賦能的實(shí)施方法和路徑。

● 領(lǐng)域洞察:除了技術(shù)突破和產(chǎn)品創(chuàng)新外,還需深入結(jié)合業(yè)務(wù)的屬性特征才能發(fā)揮隱私計(jì)算的最大效用。原因在于,利用這些特定約束可助力實(shí)現(xiàn)成本控制與目標(biāo)達(dá)成的最佳平衡。例如,基于可信計(jì)算的Jeddak數(shù)據(jù)安全沙箱大量服務(wù)了公司職能線(e.g.人力/財(cái)務(wù)/研效等),其業(yè)務(wù)場景特征是:數(shù)據(jù)流轉(zhuǎn)共享常見、處理邏輯靈活多變、且有準(zhǔn)實(shí)時計(jì)算要求。對此Jeddak充分結(jié)合利用了TEE技術(shù)特長和業(yè)務(wù)特點(diǎn),體現(xiàn)出較高實(shí)施效用。另一類典型案例如,一些金融行業(yè)的應(yīng)用對安全隱私提出極高要求,為此Jeddak Team基于多方安全計(jì)算MPC技術(shù)、設(shè)計(jì)實(shí)現(xiàn)了全密態(tài)機(jī)器學(xué)習(xí)系統(tǒng)以滿足數(shù)學(xué)可證安全性,并且在營銷預(yù)測建模場景中實(shí)際落地。因此,對業(yè)務(wù)領(lǐng)域的深入洞察不但能幫助提升應(yīng)用效果、甚至可挖掘和推動更多的技術(shù)服務(wù)創(chuàng)新。

對于隱私計(jì)算的應(yīng)用發(fā)展還有兩類問題特別值得關(guān)注。一是對私域數(shù)據(jù)的保護(hù)和價值重視:很多實(shí)體往往并不清晰自身數(shù)據(jù)的潛在效用,平時可能疏于積累和防護(hù),而最近GPT4 Turbo展現(xiàn)的基于私域數(shù)據(jù)的微調(diào)、能夠?yàn)橛脩魟?chuàng)建出高質(zhì)量領(lǐng)域大模型,凸顯其重要性。二是從頂層設(shè)計(jì)的高度來推動隱私計(jì)算的大規(guī)模應(yīng)用、賦能數(shù)字經(jīng)濟(jì):除了產(chǎn)業(yè)政策促進(jìn)外,AI大模型的普及很可能是重要的需求牽引。為此Jeddak Team正積極探索相關(guān)技術(shù),包括基于軟件實(shí)現(xiàn)的大模型聯(lián)邦精調(diào)、以及構(gòu)建由GPU所組成的可信計(jì)算環(huán)境。

Jeddak Team相關(guān)負(fù)責(zé)人表示:“本次iDASH競賽檢驗(yàn)了自身能力水平,同時也學(xué)習(xí)到很多先進(jìn)經(jīng)驗(yàn),期待未來與業(yè)界伙伴密切交流合作,共同推進(jìn)隱私計(jì)算的技術(shù)進(jìn)步與蓬勃發(fā)展?!?作者:范宇棟)

舉報(bào) 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version