【ITBEAR】近期,中文大模型領域的競爭格局再度迎來新變動。據(jù)最新發(fā)布的《中文大模型基準測評2024年10月報告》顯示,智譜科技自主研發(fā)的GLM-4-Plus模型在SuperCLUE測評中脫穎而出,成為國內(nèi)外43個大模型中的佼佼者。
SuperCLUE測評旨在全面評估大模型的綜合性能,通過對國內(nèi)外具有代表性的模型進行多維度、多層次的測試,實時跟蹤其發(fā)展趨勢。在本次測評中,GLM-4-Plus憑借在基礎能力和應用能力上的出色表現(xiàn),不僅在國內(nèi)大模型中位列第一,而且與國際頂尖模型ChatGPT-4的差距也縮小至2分以內(nèi)。這一成績充分展示了智譜科技在大模型領域的深厚積累和持續(xù)創(chuàng)新能力。
值得注意的是,GLM-4-Plus的優(yōu)異表現(xiàn)并非偶然。作為智譜全自研GLM大模型的最新版本,該模型在語言理解、邏輯推理、指令遵循以及長文本輸出等方面均實現(xiàn)了顯著突破。這些能力的提升,使得GLM-4-Plus在代碼計算、數(shù)據(jù)分析、圖像/視頻特征識別等多個領域都展現(xiàn)出了強大的性能,同時大幅降低了成本。
GLM-4-Plus在司南OpenCompass公布的大語言模型對戰(zhàn)榜單Compass Arena中也表現(xiàn)出色。據(jù)榜單顯示,GLM-4-Plus的競技場評級分數(shù)位居榜首,超越了包括GPT-4在內(nèi)的眾多國際知名模型。這一成績進一步證明了GLM-4-Plus在真實用戶場景中的卓越表現(xiàn),也體現(xiàn)了智譜科技在大模型技術領域的領先地位。
據(jù)悉,Compass Arena榜單致力于構建一個公正、開放、透明的競爭環(huán)境,通過用戶真實反饋和大模型間的對戰(zhàn)數(shù)據(jù),采用Elo評分系統(tǒng)對大模型進行排名。GLM-4-Plus能夠在如此激烈的競爭中脫穎而出,無疑是對其技術實力和用戶體驗的雙重肯定。
目前,GLM-4-Plus已經(jīng)正式上線智譜開放平臺bigmodel.cn,供廣大開發(fā)者和用戶試用。隨著技術的不斷進步和應用的持續(xù)拓展,相信GLM-4-Plus將在未來為更多領域帶來創(chuàng)新和變革。