ITBear旗下自媒體矩陣:

螞蟻集團(tuán)發(fā)布創(chuàng)新性大模型安全解決方案“蟻天鑒”

   時(shí)間:2023-09-11 15:47:33 來源:ITBEAR編輯:星輝 發(fā)表評(píng)論無障礙通道

【ITBEAR科技資訊】9月11日消息,螞蟻集團(tuán)今日宣布推出一項(xiàng)創(chuàng)新性的大模型安全解決方案,命名為“蟻天鑒”。這一方案旨在應(yīng)對(duì)大模型在生產(chǎn)和使用過程中的安全挑戰(zhàn),包括AIGC安全性和真實(shí)性評(píng)估、智能風(fēng)險(xiǎn)防控、以及AI魯棒性和可解釋性檢測(cè)等多項(xiàng)關(guān)鍵功能。這是迄今為止首個(gè)針對(duì)大型AI模型的產(chǎn)業(yè)級(jí)應(yīng)用安全檢測(cè)與防御一體化解決方案。蟻天鑒包括兩大核心產(chǎn)品:大模型安全檢測(cè)平臺(tái)“蟻鑒2.0”和大模型風(fēng)險(xiǎn)防御平臺(tái)“天鑒”,而這兩款產(chǎn)品已對(duì)外開放。

螞蟻集團(tuán)的工作人員指出,大模型在安全方面面臨三大主要問題源,包括“用于訓(xùn)練的數(shù)據(jù)源頭有毒、推理過程不可控、外部惡意誘導(dǎo)”。為解決這些問題,蟻天鑒聚焦于大模型安全性檢測(cè)度量、智能風(fēng)險(xiǎn)防控、以及數(shù)據(jù)清洗等領(lǐng)域,以確保大型AI模型在生產(chǎn)和使用中更加安全、可控和可靠。

根據(jù)ITBEAR科技資訊了解,其中的“蟻鑒2.0”是首個(gè)支持文本、圖像等多種數(shù)據(jù)類型的產(chǎn)業(yè)級(jí)AI安全檢測(cè)平臺(tái)。它通過智能攻擊對(duì)抗技術(shù),模擬黑客攻擊的方式,生成大量誘導(dǎo)性問題,然后對(duì)大型AI模型的回答進(jìn)行實(shí)時(shí)自動(dòng)化檢測(cè),以識(shí)別潛在的弱點(diǎn)和安全問題。此外,“蟻鑒2.0”還具備了對(duì)AIGC生成的圖片、視頻等多模內(nèi)容進(jìn)行“真?zhèn)巍北鎰e和安全性檢測(cè)的能力,可快速區(qū)分內(nèi)容是否由機(jī)器生成,以及是否存在倫理和道德風(fēng)險(xiǎn)。

另一方面,“天鑒”則扮演著外部惡意攻擊的防護(hù)盾角色,借助智能風(fēng)險(xiǎn)控制技術(shù),保護(hù)大模型免受外界惡意提問的侵害,并過濾生成的回答內(nèi)容,確保整個(gè)過程安全可靠。據(jù)了解,“天鑒”平臺(tái)不僅可以在用戶輸入階段快速理解意圖和風(fēng)險(xiǎn),還能以不同的風(fēng)險(xiǎn)控制方式來應(yīng)對(duì),同時(shí)也能夠迅速提升大模型的風(fēng)險(xiǎn)認(rèn)知和防御能力,同時(shí)保障用戶體驗(yàn),確保輸出內(nèi)容合規(guī)且健康。

總之,螞蟻集團(tuán)的“蟻天鑒”為大型AI模型的安全性帶來了全新的解決方案,通過綜合考慮安全檢測(cè)、智能風(fēng)險(xiǎn)防御和數(shù)據(jù)清洗等關(guān)鍵環(huán)節(jié),為大型AI模型的應(yīng)用提供了更可靠的保護(hù)。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容