ITBear旗下自媒體矩陣:

Mistral AI新推Pixtral Large,多模態(tài)模型在數(shù)學(xué)推理上領(lǐng)先

   時間:2024-11-19 15:16:33 來源:ITBEAR作者:IT之家編輯:瑞雪 發(fā)表評論無障礙通道

【ITBEAR】近日,Mistral AI 公司正式揭曉了其最新的多模態(tài)人工智能模型——Pixtral Large。這一模型在11月18日的官方公告中首次亮相,憑借1240億參數(shù)的龐大體量,專為文本與圖像的處理任務(wù)而設(shè)計。

Pixtral Large 目前已面向研究、教育及商業(yè)領(lǐng)域開放,用戶可通過Mistral提供的研究許可證和商業(yè)許可證進行訪問和使用。這一舉措無疑為各領(lǐng)域的研究者和實踐者提供了強大的工具支持。

作為Mistral AI多模態(tài)模型家族的新成員,Pixtral Large在多個標準基準測試中展現(xiàn)出了卓越的性能。特別是在MathVista測試中,Pixtral Large以69.4%的準確率脫穎而出,超越了所有同行競爭對手,彰顯了其在復(fù)雜數(shù)學(xué)問題解決方面的優(yōu)勢。

不僅如此,Pixtral Large在ChartQA和DocVQA等測試中同樣表現(xiàn)出色,超越了GPT-4o和Gemini-1.5 Pro等業(yè)界知名模型。這些測試結(jié)果進一步證明了Pixtral Large在處理圖表、文檔及視覺問答等任務(wù)時的強大能力。

Pixtral Large的技術(shù)架構(gòu)同樣令人矚目。該模型配備了123B的多模態(tài)解碼器和1B的視覺編碼器,支持高達128K的上下文窗口,能夠輕松處理至少30張高分辨率圖像。這一設(shè)計使得Pixtral Large在處理視覺數(shù)據(jù)、復(fù)雜推理以及圖表理解等方面均展現(xiàn)出了非凡的實力。

隨著Pixtral Large的推出,Mistral AI進一步鞏固了其在多模態(tài)人工智能領(lǐng)域的領(lǐng)先地位。這一創(chuàng)新成果不僅為研究者提供了強大的工具支持,也為商業(yè)應(yīng)用開辟了更加廣闊的前景。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version