ITBear旗下自媒體矩陣:

通義千問升級旗艦?zāi)P蚎wen-Max,性能接近GPT-4o

   時間:2024-09-19 16:32:14 來源:ITBEAR編輯:茹茹 發(fā)表評論無障礙通道

9月19日云棲大會,阿里云CTO周靖人宣布,通義旗艦?zāi)P蚎wen-Max全方位升級,性能接近GPT-4o。通義官網(wǎng)和通義APP的后臺模型均已切換為Qwen-Max,繼續(xù)免費(fèi)為所有用戶提供服務(wù)。用戶也可通過阿里云百煉平臺調(diào)用Qwen-Max的API。

相比上一代模型,Qwen-Max在訓(xùn)練中使用了更多的訓(xùn)練數(shù)據(jù)、更大的模型規(guī)模、更強(qiáng)的人類對齊,最終達(dá)到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多個權(quán)威基準(zhǔn)上,Qwen-Max表現(xiàn)接近GPT-4o,數(shù)學(xué)能力、代碼能力則超越了GPT-4o。數(shù)學(xué)和代碼所代表的推理能力是大模型智能水平的最重要體現(xiàn)。

相比2023年4月的初代通義千問大模型,Qwen-Max的理解能力提升46%、數(shù)學(xué)能力提升75%、代碼能力提升102%、幻覺抵御能力提升35%、指令遵循能力提升105%,模型與人類偏好的對齊水平更是有了質(zhì)的飛躍,提升了700%以上。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容