滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

Kimi視覺思考模型k1問世，數(shù)理化能力領(lǐng)先OpenAI等全球標(biāo)桿

時間：2024-12-16 15:23:52 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

近日，國產(chǎn)大模型月之暗面推出了其最新的視覺思考模型k1，這一創(chuàng)新成果基于強化學(xué)習(xí)技術(shù)，實現(xiàn)了端到端的圖像理解和思維鏈技術(shù)的原生支持，并將應(yīng)用范圍拓展至數(shù)學(xué)以外的多個基礎(chǔ)科學(xué)領(lǐng)域。

k1模型已全面上線于月之暗面智能助手的Android、iPhone應(yīng)用以及官方網(wǎng)站kimi.com。用戶只需在最新版本的手機應(yīng)用或網(wǎng)頁端Kimi+頁面中找到“Kimi視覺思考版”，即可通過拍照或上傳圖片的方式，體驗這一前沿技術(shù)。

據(jù)透露，在針對數(shù)學(xué)、物理、化學(xué)等基礎(chǔ)科學(xué)學(xué)科的基礎(chǔ)能力測試中，k1模型的表現(xiàn)超越了全球知名的OpenAI o1、GPT-4o以及Claude 3.5 Sonnet等模型，展現(xiàn)了其強大的實力。

月之暗面官方表示，k1模型真正實現(xiàn)了端到端的圖像理解和思考能力，用戶輸入的圖像信息可以直接被模型處理并思考得出答案，無需依賴外部的OCR技術(shù)或額外的視覺模型進行信息預(yù)處理。這一特性使得k1模型在圖像理解和處理方面更加高效和準(zhǔn)確。

從模型訓(xùn)練的角度來看，k1的訓(xùn)練過程經(jīng)歷了兩個階段：首先通過預(yù)訓(xùn)練獲得基礎(chǔ)模型，然后在基礎(chǔ)模型的基礎(chǔ)上進行強化學(xué)習(xí)后訓(xùn)練。在預(yù)訓(xùn)練階段，k1模型重點優(yōu)化了字符識別能力，在OCRBench上取得了903分的當(dāng)前最優(yōu)成績，并在多個基準(zhǔn)測試集上表現(xiàn)出色。

在強化學(xué)習(xí)后訓(xùn)練階段，k1模型在數(shù)據(jù)質(zhì)量和學(xué)習(xí)效率方面進行了進一步優(yōu)化，并在強化學(xué)習(xí)的規(guī)?；先〉昧诵碌耐黄啤＿@是k1視覺推理模型在基準(zhǔn)測試中取得行業(yè)領(lǐng)先成績的最關(guān)鍵因素。然而，月之暗面也坦誠地表示，在內(nèi)部測試中，他們發(fā)現(xiàn)k1視覺思考模型在某些方面仍存在局限性，如分布外泛化能力、復(fù)雜問題處理成功率、噪聲場景準(zhǔn)確率以及多輪問答效果等，都有待進一步提升。

盡管k1模型在某些場景和泛化能力上與OpenAI的o1系列模型相比仍有差距，但其作為國產(chǎn)大模型的一次重要突破，無疑為圖像理解和思考技術(shù)的發(fā)展注入了新的活力。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

高德地圖紅綠燈AI領(lǐng)航：從讀秒到智能引導(dǎo)，駕車出行新體驗！

01-12

谷歌加速AI布局，AI Studio團隊并入DeepMind力促項目提效

01-11

京東健康發(fā)布“AI京醫(yī)”大模型，分診準(zhǔn)確率高達99.5%引領(lǐng)醫(yī)療智能化

01-11

微軟DirectX新動向：協(xié)作向量助力神經(jīng)渲染技術(shù)跨平臺發(fā)展

01-11

京東健康首推“AI京醫(yī)”體系，數(shù)字醫(yī)生24小時在線輔助診療

01-11

ChatGPT被用于開發(fā)自動射擊炮塔，OpenAI緊急叫停并封號

01-11

抖音重拳出擊！西藏地震后已清理2萬余條AI虛假災(zāi)害視頻

01-11

谷歌、OpenAI等巨頭搶購創(chuàng)作者未公開視頻，高價訓(xùn)練AI模型？

01-11

Meta陷版權(quán)風(fēng)波，扎克伯格被曝批AI團隊用盜版數(shù)據(jù)訓(xùn)練模型？

01-11

好大夫在線官宣：正式邁入螞蟻集團新時代！

三言科技1月11日消息，今日，在“2025好大夫峰會”上，好大夫在線創(chuàng)始人王航宣布好大夫正式加入螞蟻集團。 “我要正式向大家報告一個消息，好大夫在線已經(jīng)迎來全新的發(fā)展期，正式加入螞蟻集團，這是一場雙向奔赴，我…

01-11

螞蟻集團與好大夫在線攜手，醫(yī)療服務(wù)AI化新篇章開啟！

01-11

扎克伯格炮轟蘋果：靠舊發(fā)明吃老本，創(chuàng)新乏力？

01-11

微軟rStar-Math技術(shù)助力，小語言模型數(shù)學(xué)推理能力大飛躍！

01-11

抖音重拳出擊！AI生成災(zāi)害場景，23652條不實信息被嚴處

01-11

周鴻祎：放棄大模型執(zhí)念，專注應(yīng)用之路同樣偉大

01-11

點擊查看更多 +

全站最新

手機截圖小技巧：多種方法任你選，隱私安全需注意！

手機卡頓不用愁，這些妙招讓你手機流暢如新！

輕松掌握！手機電量顯示設(shè)置全攻略

比亞迪e7純電新車上演實力秀，簡約設(shè)計與強勁動力能否征服市場？

手機電量一目了然，設(shè)置教程來啦！輕松掌握電量情況

手機卡頓不用愁，這些妙招讓你手機重獲新生！

熱門內(nèi)容

本欄最新

高德地圖紅綠燈AI領(lǐng)航：從讀秒到智能引導(dǎo)，駕車出行新體驗！

京東健康發(fā)布“AI京醫(yī)”大模型，分診準(zhǔn)確率高達99.5%引領(lǐng)醫(yī)療智能化

ChatGPT被用于開發(fā)自動射擊炮塔，OpenAI緊急叫停并封號

抖音重拳出擊！西藏地震后已清理2萬余條AI虛假災(zāi)害視頻

螞蟻集團與好大夫在線攜手，醫(yī)療服務(wù)AI化新篇章開啟！

微軟rStar-Math技術(shù)助力，小語言模型數(shù)學(xué)推理能力大飛躍！

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

Kimi視覺思考模型k1問世，數(shù)理化能力領(lǐng)先OpenAI等全球標(biāo)桿

Kimi視覺思考模型k1問世，數(shù)理化能力領(lǐng)先OpenAI等全球標(biāo)桿