近日,字節(jié)跳動(dòng)安全團(tuán)隊(duì)對(duì)外宣布開源敏感數(shù)據(jù)保護(hù)方案GoDLP,該方案能夠應(yīng)用多種隱私合規(guī)標(biāo)準(zhǔn),對(duì)原始數(shù)據(jù)進(jìn)行分級(jí)打標(biāo)、判斷敏感級(jí)別和實(shí)施相應(yīng)的脫敏處理。
據(jù)悉,GoDLP 提供了一系列針對(duì)敏感數(shù)據(jù)的識(shí)別和處置方案, 其中包括敏感數(shù)據(jù)識(shí)別算法,數(shù)據(jù)脫敏處理方式,業(yè)務(wù)自定義的配置選項(xiàng)和海量數(shù)據(jù)處理能力。
作為字節(jié)跳動(dòng)在數(shù)據(jù)脫敏保護(hù)方向成功的實(shí)踐案例,字節(jié)安全團(tuán)隊(duì)決定用開源的方式向大家分享其研究成果,與行業(yè)一同成長(zhǎng)。字節(jié)跳動(dòng)安全團(tuán)隊(duì)相關(guān)負(fù)責(zé)人表示,GoDLP會(huì)長(zhǎng)期維護(hù)更新,歡迎行業(yè)人士一起溝通交流。
字節(jié)跳動(dòng)開源的GoDLP是怎么樣?
GoDLP 能夠廣泛支持結(jié)構(gòu)化(JSON數(shù)據(jù)、KV數(shù)據(jù)、golang map)和非結(jié)構(gòu)化數(shù)據(jù)(多語言字符串)。
● 可實(shí)現(xiàn)敏感數(shù)據(jù)自動(dòng)發(fā)現(xiàn)
GoDLP內(nèi)置多種敏感數(shù)據(jù)識(shí)別規(guī)則,可覆蓋市面80%以上識(shí)別規(guī)則,最大程度識(shí)別敏感數(shù)據(jù)
● 靈活的敏感數(shù)據(jù)脫敏處理
GoDLP支持多種脫敏算法,用戶可自行根據(jù)需求進(jìn)行脫敏處理
● 業(yè)務(wù)自定義配置選項(xiàng)
除默認(rèn)的敏感信息識(shí)別和處理規(guī)則外,業(yè)務(wù)可根據(jù)實(shí)際情況,配置自定義的YAML規(guī)則,GoDLP能夠根據(jù)傳入的配置選項(xiàng),完成相應(yīng)的數(shù)據(jù)處理任務(wù)。
GoDLP的性能表現(xiàn)
下方數(shù)據(jù)是在開啟全部敏感數(shù)據(jù)類型情況下的結(jié)果
● 針對(duì)1K的文件,用時(shí)需4.1毫秒,占用128.6k的內(nèi)存
● 1M的文件,用時(shí)為4.1s,內(nèi)存占用118.6MB
(測(cè)試環(huán)境:8核虛擬機(jī),Linux,amd64,Intel(R)Xeon(R)Platinum8260CPU@2.40GHz;代碼版本:v2.0.0)
GoDLP在字節(jié)的實(shí)踐
GoDLP已在字節(jié)跳動(dòng)進(jìn)行了豐富的實(shí)踐,已接入的業(yè)務(wù)線涵蓋抖音、電商、飛書、火山引擎、云安全、財(cái)經(jīng)、教育、游戲等諸多業(yè)務(wù)線。目前,字節(jié)跳動(dòng)安全團(tuán)隊(duì)已放出GitHub上開源地址(https://github.com/bytedance/godlp)。