ITBear旗下自媒體矩陣:

16家央企聯(lián)手發(fā)布,通用大模型評(píng)測(cè)有了新標(biāo)準(zhǔn)!

   時(shí)間:2024-10-12 21:00:09 來(lái)源:ITBEAR作者:馮璃月編輯:瑞雪 發(fā)表評(píng)論無(wú)障礙通道

【ITBEAR】在2024中國(guó)移動(dòng)全球合作伙伴大會(huì)上,中國(guó)移動(dòng)攜手電子標(biāo)準(zhǔn)院及16家重點(diǎn)央企,共同推進(jìn)大模型評(píng)測(cè)體系建設(shè),并發(fā)布了《通用大模型評(píng)測(cè)標(biāo)準(zhǔn)》。這一標(biāo)準(zhǔn)被視為評(píng)測(cè)體系建設(shè)的重要里程碑,旨在為產(chǎn)業(yè)界篩選優(yōu)質(zhì)大模型提供有力參考。

據(jù)透露,該標(biāo)準(zhǔn)的建設(shè)工作將圍繞通用領(lǐng)域及四個(gè)重點(diǎn)行業(yè)領(lǐng)域展開(kāi),涵蓋評(píng)測(cè)標(biāo)準(zhǔn)制定、評(píng)測(cè)基地建設(shè)、評(píng)測(cè)試點(diǎn)應(yīng)用等多個(gè)方面。通用大模型評(píng)測(cè)標(biāo)準(zhǔn)基于“2-4-6”框架構(gòu)建,具體而言,“2”代表兩類(lèi)評(píng)測(cè)視角,即以重點(diǎn)行業(yè)實(shí)際需求為導(dǎo)向,與國(guó)家標(biāo)準(zhǔn)對(duì)模型能力的要求相協(xié)調(diào),將評(píng)測(cè)任務(wù)分為理解和生成兩大視角;“4”表示四類(lèi)評(píng)測(cè)要素,從評(píng)測(cè)全生命周期中提取評(píng)測(cè)工具、評(píng)測(cè)數(shù)據(jù)、評(píng)測(cè)方式和評(píng)測(cè)指標(biāo)等關(guān)鍵要素,確保評(píng)測(cè)工作的可實(shí)施性;“6”則指六大評(píng)測(cè)維度,綜合考慮大模型應(yīng)用過(guò)程中的核心能力,包括功能性、準(zhǔn)確性、可靠性、安全性、交互性和應(yīng)用性。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類(lèi)資訊
全站最新
熱門(mén)內(nèi)容