ITBear旗下自媒體矩陣:

天翼云數(shù)據(jù)庫(kù)新突破!創(chuàng)新性Taste框架,研究界矚目!

   時(shí)間:2024-10-16 13:12:45 來(lái)源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

【ITBEAR】近日,一篇題為《Taste: Towards Practical Deep Learning-based Approaches for Semantic Type Detection in the Cloud》的論文在國(guó)際知名數(shù)據(jù)庫(kù)會(huì)議EDBT上獲得長(zhǎng)文收錄,該論文由天翼云數(shù)據(jù)庫(kù)團(tuán)隊(duì)、中國(guó)電信云計(jì)算研究院與深圳北理莫斯科大學(xué)聯(lián)合完成。EDBT作為數(shù)據(jù)庫(kù)領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議,已連續(xù)舉辦27屆,其近五年平均錄取率僅為20.8%。此次收錄標(biāo)志著天翼云的科技創(chuàng)新實(shí)力再次獲得業(yè)界與學(xué)術(shù)界的雙重認(rèn)可。

該論文聚焦于數(shù)據(jù)管理系統(tǒng)中的語(yǔ)義類(lèi)型檢測(cè)問(wèn)題,并在此領(lǐng)域?qū)崿F(xiàn)了檢測(cè)性能和安全性方面的突破。語(yǔ)義類(lèi)型,如人名、地址、身份證號(hào)等,對(duì)于人類(lèi)理解數(shù)據(jù)和輔助數(shù)據(jù)管理系統(tǒng)提供關(guān)鍵服務(wù)具有重要作用。然而,現(xiàn)有技術(shù)每次檢測(cè)均需掃描數(shù)據(jù)列內(nèi)容,導(dǎo)致I/O和網(wǎng)絡(luò)開(kāi)銷(xiāo)大、檢測(cè)效率低,且可能對(duì)云用戶(hù)業(yè)務(wù)產(chǎn)生不利影響。

針對(duì)這些不足,論文創(chuàng)新性地提出了兩階段語(yǔ)義類(lèi)型檢測(cè)框架(Taste)。該框架首先利用數(shù)據(jù)源的元數(shù)據(jù)進(jìn)行初步快速的語(yǔ)義類(lèi)型檢測(cè),減少對(duì)數(shù)據(jù)源的掃描;第二階段則按需進(jìn)行,結(jié)合列內(nèi)容與元數(shù)據(jù)完成更精確的檢測(cè)。這一創(chuàng)新不僅提升了檢測(cè)效率,還增強(qiáng)了系統(tǒng)的魯棒性,同時(shí)提供了更高的數(shù)據(jù)隱私保護(hù)。

論文還設(shè)計(jì)了一種新穎的非對(duì)稱(chēng)雙塔檢測(cè)模型(ADTD),通過(guò)多任務(wù)學(xué)習(xí)支持Taste的兩階段檢測(cè)。該模型分為metadata塔和Content塔,前者編碼元數(shù)據(jù)特征,后者結(jié)合元數(shù)據(jù)信息編碼列內(nèi)容特征。在訓(xùn)練過(guò)程中,兩個(gè)階段的輸出結(jié)合進(jìn)行多任務(wù)學(xué)習(xí),使模型一次訓(xùn)練即可應(yīng)用于兩階段推理。

實(shí)驗(yàn)表明,Taste框架在執(zhí)行效率、準(zhǔn)確性、降低數(shù)據(jù)列掃描侵入性等方面表現(xiàn)優(yōu)異,并展現(xiàn)出云端大規(guī)模部署的潛力。目前,Taste框架已在天翼云數(shù)據(jù)管理服務(wù)(DMS)中落地,助力客戶(hù)進(jìn)行高效、靈活的語(yǔ)義類(lèi)型檢測(cè),實(shí)現(xiàn)更加快捷且智能化的敏感數(shù)據(jù)識(shí)別,顯著提升云端數(shù)據(jù)管理的安全性和穩(wěn)定性。

天翼云作為云服務(wù)國(guó)家隊(duì),始終堅(jiān)持核心技術(shù)自主攻關(guān),以科技創(chuàng)新引領(lǐng)產(chǎn)業(yè)發(fā)展。未來(lái),天翼云將繼續(xù)推進(jìn)數(shù)據(jù)庫(kù)等云計(jì)算技術(shù)攻關(guān),筑牢國(guó)云智算底座,為企業(yè)充分釋放數(shù)據(jù)價(jià)值提供有力支撐。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類(lèi)資訊
全站最新
熱門(mén)內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開(kāi)放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version