ITBear旗下自媒體矩陣:

阿里Qwen2.5逆襲登頂!全球開(kāi)源大模型新霸主誕生,Meta也敗下陣來(lái)?

   時(shí)間:2024-09-19 17:06:54 來(lái)源:ITBEAR作者:江紫萱編輯:瑞雪 發(fā)表評(píng)論無(wú)障礙通道

【ITBEAR】9月19日消息,在9月19日的云棲大會(huì)上,阿里云CTO周靖人重磅發(fā)布了通義千問(wèn)的新一代開(kāi)源模型Qwen2.5。這款旗艦?zāi)P蚎wen2.5-72B在性能上成功超越了擁有4050億參數(shù)的Llama 405B,再次登頂全球開(kāi)源大模型的寶座。

Qwen2.5-72B在MMLU-redux等十多個(gè)基準(zhǔn)測(cè)評(píng)中表現(xiàn)超越Llama3.1-405B

據(jù)ITBEAR了解,Qwen2.5全系列涵蓋了多種尺寸的大語(yǔ)言模型、多模態(tài)模型、數(shù)學(xué)模型以及代碼模型,且每個(gè)尺寸都提供了基礎(chǔ)版本、指令跟隨版本及量化版本,總計(jì)推出了100多個(gè)模型,這一數(shù)字刷新了業(yè)界的紀(jì)錄。這些模型在18T tokens的數(shù)據(jù)上進(jìn)行了預(yù)訓(xùn)練,相較于Qwen2,Qwen2.5的整體性能有了18%以上的顯著提升。

在具體能力方面,Qwen2.5-72B模型在MMLU-rudex基準(zhǔn)、MBPP基準(zhǔn)以及MATH基準(zhǔn)上的得分分別高達(dá)86.8、88.2和83.1,展示了其在通用知識(shí)、代碼能力和數(shù)學(xué)能力方面的強(qiáng)勁實(shí)力。此外,該模型還支持高達(dá)128K的上下文長(zhǎng)度,并能生成最多8K的內(nèi)容。值得一提的是,Qwen2.5還具備強(qiáng)大的多語(yǔ)言能力,支持包括中文、英文、法文等在內(nèi)的29種以上語(yǔ)言。

在模型尺寸方面,Qwen2.5開(kāi)源了7個(gè)不同尺寸的模型,從0.5B到72B,這些模型在同等參數(shù)規(guī)模下都創(chuàng)造了業(yè)界的最佳成績(jī)。特別地,3B尺寸的模型被視為適配手機(jī)等端側(cè)設(shè)備的理想選擇;而32B尺寸的模型則因其出色的性價(jià)比而備受開(kāi)發(fā)者期待,它在性能和功耗之間達(dá)到了優(yōu)異的平衡。

HuggingFace數(shù)據(jù)顯示,截至9月中旬Qwen系列原生模型和衍生模型總數(shù)超過(guò)5萬(wàn)個(gè)

在專項(xiàng)模型領(lǐng)域,Qwen2.5也取得了顯著進(jìn)展。用于編程的Qwen2.5-Coder和用于數(shù)學(xué)的Qwen2.5-Math相較于前代模型都有了實(shí)質(zhì)性的提升。特別是Qwen2.5-Math,它支持使用中英雙語(yǔ)的思維鏈和工具集成推理來(lái)解決數(shù)學(xué)問(wèn)題,被譽(yù)為迄今為止最先進(jìn)的開(kāi)源數(shù)學(xué)模型系列。

此外,在多模態(tài)模型方面,備受矚目的視覺(jué)語(yǔ)言模型Qwen2-VL-72B也正式開(kāi)源。這款模型能夠識(shí)別不同分辨率和長(zhǎng)寬比的圖片,理解超過(guò)20分鐘的長(zhǎng)視頻內(nèi)容,并具備了操作手機(jī)和機(jī)器人的視覺(jué)智能體能力。在最近的權(quán)威測(cè)評(píng)中,Qwen2-VL-72B成功摘得了全球得分最高的開(kāi)源視覺(jué)理解模型的桂冠。

自2023年8月開(kāi)源以來(lái),通義千問(wèn)在全球開(kāi)源大模型領(lǐng)域的地位日益凸顯,已逐漸成為開(kāi)發(fā)者們的首選模型。其卓越的性能和不斷豐富的生態(tài)網(wǎng)絡(luò)為其贏得了廣泛的贊譽(yù)和關(guān)注。

關(guān)鍵詞:#通義千問(wèn)# #Qwen2.5# #開(kāi)源模型# #全球領(lǐng)先# #多模態(tài)能力#

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開(kāi)放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version