【ITBEAR科技資訊】9月11日消息,螞蟻集團(tuán)最近宣布推出了一項(xiàng)名為“蟻天鑒”的全新大模型安全一體化解決方案,為大規(guī)模AI模型的安全保障帶來了全新的突破。這一解決方案包含兩個(gè)關(guān)鍵產(chǎn)品:大模型安全檢測(cè)平臺(tái)“蟻鑒2.0”和大模型風(fēng)險(xiǎn)防御平臺(tái)“天鑒”。
據(jù)了解,蟻鑒2.0被形象地比喻為大模型的“安全診療師”。在大型模型上線之前,它會(huì)進(jìn)行全面的安全掃描,從多個(gè)維度對(duì)模型進(jìn)行評(píng)估,包括數(shù)據(jù)安全、內(nèi)容安全、科技倫理等數(shù)百種風(fēng)險(xiǎn)維度。這有助于提前識(shí)別和挖掘潛在的風(fēng)險(xiǎn)漏洞,確保模型在投入使用前達(dá)到最高的安全標(biāo)準(zhǔn)。
而“天鑒”則相當(dāng)于在大模型的周邊添加了一層堅(jiān)實(shí)的“防護(hù)盾”。它利用智能化風(fēng)險(xiǎn)控制技術(shù),不僅協(xié)助大模型抵御外部惡意提問,還對(duì)生成的回答內(nèi)容進(jìn)行風(fēng)險(xiǎn)過濾,從用戶輸入到輸出的整個(gè)過程都得到全面的安全保障。
大模型的安全問題通常源于三個(gè)主要因素:用于訓(xùn)練的數(shù)據(jù)源頭可能受到污染,推理過程可能無法控制,而外部可能存在惡意誘導(dǎo)。為了應(yīng)對(duì)這些挑戰(zhàn),螞蟻集團(tuán)還采用了數(shù)據(jù)去毒、對(duì)齊訓(xùn)練、可解釋性研究等多種手段,以確保模型的安全性和可解釋性。
螞蟻集團(tuán)的這一大模型安全一體化解決方案“蟻天鑒”標(biāo)志著大模型安全領(lǐng)域的重要進(jìn)展,為AI技術(shù)的可持續(xù)發(fā)展提供了有力保障。該解決方案已經(jīng)對(duì)外開放,有望在廣泛的應(yīng)用領(lǐng)域中發(fā)揮關(guān)鍵作用,確保大規(guī)模AI模型的安全可靠運(yùn)用。