ITBear旗下自媒體矩陣:

月之暗面楊植麟:大模型發(fā)展進入新階段,強化學習成關(guān)鍵

   時間:2024-11-17 15:19:30 來源:ITBEAR作者:36氪編輯:瑞雪 發(fā)表評論無障礙通道

【ITBEAR】在中國AI初創(chuàng)公司中,月之暗面一直以技術(shù)理想主義而知名。近日,他們正式發(fā)布了一款名為K0-math的新數(shù)學模型,這一模型專注于計算能力,并在發(fā)布會上展示了其解決高難度數(shù)學題的能力。

據(jù)悉,K0-math不僅能夠解決復雜的數(shù)學問題,還能展示解題的詳細步驟,甚至在遇到錯誤時能夠自我反思并調(diào)整推理邏輯。月之暗面創(chuàng)始人楊植麟在發(fā)布會上強調(diào),盡管Scaling Law仍然有效,但隨著AI行業(yè)的發(fā)展,其應用的重點已經(jīng)從單純擴大計算和參數(shù)規(guī)模,轉(zhuǎn)向了強化學習,以提升模型的智力水平。

月之暗面對K0-math進行了基準測試,結(jié)果顯示,在數(shù)學能力上,該模型可媲美全球領(lǐng)先的OpenAI的o1模型中的兩個可公開使用版本。特別是在中考、高考等數(shù)學基準測試中,K0-math初代模型的表現(xiàn)甚至超越了o1-mini和o1-preview。

不過,楊植麟也坦率承認,K0-math仍有局限性,例如在面對更高難度的數(shù)學問題時可能會出錯,或者在簡單問題上過度思考。盡管如此,這一新模型的發(fā)布仍然被視為月之暗面在追趕全球頂尖AI模型領(lǐng)域邁出的重要一步。

隨著AI技術(shù)的不斷發(fā)展,月之暗面堅信,提升模型的智力和思考水平將成為未來AI領(lǐng)域的重要趨勢。而K0-math的發(fā)布,正是他們在這一方向上取得的最新成果。

值得注意的是,月之暗面在發(fā)布會上并未過多回應近期的仲裁風波等外界關(guān)注的話題,而是將焦點集中在新模型的技術(shù)展示和未來發(fā)展規(guī)劃上。楊植麟表示,他們將繼續(xù)致力于提升AI模型的思考能力和用戶體驗,以推動AI技術(shù)的更廣泛應用。

在AI技術(shù)日新月異的今天,月之暗面的新數(shù)學模型K0-math無疑為行業(yè)帶來了新的思考和探索方向。隨著他們在強化學習路線的深入探索,未來AI模型的能力提升和應用拓展值得期待。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version