滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

昆侖萬維Skywork o1：解鎖強推理與自我反思，AI新里程碑？

時間：2024-11-27 12:30:00 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

昆侖萬維在人工智能領(lǐng)域邁出了重要一步，正式推出了其最新力作——「天工大模型4.0」o1版，命名為Skywork o1。這款模型以其獨特的復(fù)雜思考推理能力，在國內(nèi)首次實現(xiàn)了中文邏輯推理o1模型的突破。

Skywork o1不僅僅是對OpenAI o1模型的簡單復(fù)現(xiàn)，它在模型輸出中內(nèi)嵌了思考、計劃、反思等高級能力。經(jīng)過標準評測集的驗證，與普通模型相比，Skywork o1的推理能力顯著提升，真正實現(xiàn)了通過思考和反思來增強推理能力的目標。昆侖萬維團隊通過獨特的技術(shù)路線，成功將初始推理能力較弱的基座模型提升到了生態(tài)位的頂尖水平。

此次發(fā)布的Skywork o1系列包含三款模型，旨在滿足不同用戶的需求：

第一款是Skywork o1 Open，基于Llama 3.1 8B的開源模型，它在同生態(tài)位的開源模型中評測指標大幅提升，達到了SOTA水平，并成功解鎖了許多輕量級模型無法完成的復(fù)雜數(shù)學(xué)任務(wù)。Skywork o1 Open的發(fā)布，將加速國內(nèi)開源社區(qū)復(fù)現(xiàn)o1模型的進程。

第二款是Skywork o1 Lite，這款模型具備完整的思考能力，尤其在中文支持和推理速度上表現(xiàn)優(yōu)異。在數(shù)學(xué)、中文邏輯和推理類問題上，Skywork o1 Lite展現(xiàn)出了出色的性能。

第三款是Skywork o1 Preview，作為本次發(fā)布的完整版推理模型，它配備了自研的線上推理算法，相比Skywork o1 Lite，擁有更多樣和深入的思考過程，以及更完善和高質(zhì)量的推理能力。

Skywork o1 Open在各項數(shù)學(xué)和代碼指標上的表現(xiàn)均大幅提高，不僅超越了同生態(tài)位的Llama-3.1-8B模型，還解鎖了諸如GPT 4o等較大量級模型無法完成的數(shù)學(xué)推理任務(wù)，如24點計算。這為推理模型在輕量級設(shè)備上的部署提供了新的可能性。

昆侖萬維還開源了兩個推理任務(wù)的Process Reward Model（PRM）：Skywork o1 Open-PRM-1.5B和Skywork o1 Open-PRM-7B。與之前的開源PRM相比，Skywork o1 Open-PRM能夠?qū)δＰ突卮鹬械拿總€步驟進行打分，而不僅僅是對整個回答進行評分。在大部分基準測試中，Skywork o1 Open-PRM-1.5B的表現(xiàn)接近或超過了8B的開源模型，而Skywork o1 Open-PRM-7B則接近或超過了10倍量級的模型。

Skywork o1在邏輯推理任務(wù)上性能的大幅提升，得益于昆侖萬維自研的三階段訓(xùn)練方案。首先，通過自研的多智能體體系構(gòu)造高質(zhì)量的分步思考、反思和驗證數(shù)據(jù)，對基座模型進行繼續(xù)預(yù)訓(xùn)練和監(jiān)督微調(diào)。其次，研發(fā)了適配分步推理強化的Skywork o1 Process Reward Model（PRM），有效捕捉到復(fù)雜推理任務(wù)中間步驟和思考步驟對最終答案的影響。最后，基于自研的Q*線上推理算法，配合模型在線思考，尋找最佳推理路徑。

Skywork o1模型展現(xiàn)出了多項亮點功能，包括模型思考和規(guī)劃能力、自我反思能力和自我驗證能力。在復(fù)雜問題分析、思考反思過程以及輸出答案質(zhì)量上，Skywork o1 Lite和Skywork o1 Preview線上版本均有大幅提升。例如，在面對難度較大的考研數(shù)學(xué)題時，Skywork o1 Preview能夠一步步推理出正確結(jié)果。在解決比大小問題時，其思考過程嚴謹，邏輯清晰，準確得出正確答案，并給出了差值計算。

Skywork o1在中文邏輯問題思考中也展現(xiàn)出了反思能力，能夠準確識別并糾正錯誤的讀音，給出后續(xù)對話建議。在“算24點”游戲中，Skywork o1不僅給出了正確答案，還進行了自我驗證，確認過程和答案符合命題要求。在競賽數(shù)學(xué)、密碼解密以及智力問答等復(fù)雜場景中，Skywork o1也表現(xiàn)出了優(yōu)異的性能。

昆侖萬維自2024年以來，持續(xù)在人工智能領(lǐng)域發(fā)力，陸續(xù)發(fā)布了「天工2.0」、「天工3.0」、「天工大模型4.0」4o版——Skywork 4o，以及此次的「天工大模型4.0」o1版（Skywork o1）。這些舉措不僅貫徹了公司“All in AGI 與 AIGC”的戰(zhàn)略，也是構(gòu)建AI技術(shù)棧的重要一步。昆侖萬維將繼續(xù)秉持“實現(xiàn)通用人工智能，讓每個人更好地塑造和表達自我”的使命，從模型層、應(yīng)用層等全方位、多維度來構(gòu)建公司的技術(shù)競爭力和生態(tài)矩陣。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

AI造假又現(xiàn)！好萊塢標志牌“著火”圖實為假，你中招了嗎？

01-10

馬斯克：特斯拉明年將量產(chǎn)十萬臺Optimus機器人

Commenting on a video showcasing Optimus’ flexible movement of handwith 22 DoF in October, Musk said t…

01-10

好太太新設(shè)子公司，含AI軟件開發(fā)業(yè)務(wù)

企查查APP顯示，近日，北京市好太太智能科技有限公司成立，法定代表人為曹彩鳳，注冊資本50萬元，經(jīng)營范圍包含：人工智能應(yīng)用軟件開發(fā)；金屬材料銷售；金屬材料制造；工程和技術(shù)研究和試驗發(fā)展等。企查查股權(quán)穿透顯示，…

01-10

好太太全資控股新公司，經(jīng)營范圍涉足AI軟件開發(fā)領(lǐng)域

01-10

問止中醫(yī)沖刺港股：9個月營收近1.7億，虧損收窄，藍馳真格加持

01-10

華為榮耀領(lǐng)跑！今年國產(chǎn)手機自研技術(shù)哪家強？

01-10

人工智能重塑華爾街：未來三到五年或減20萬崗位？

01-10

購新補貼來襲，手機等產(chǎn)品熱銷能否帶動半導(dǎo)體需求攀升？

01-10

2024胡潤榜單揭曉：中國人工智能50強企業(yè)價值排行

01-10

美光科技豪擲70億建廠，AI芯片、高頻CCL及機器人激光雷達市場迎新機遇

據(jù)媒體報道，隨著人工智能提振對先進存儲芯片的需求，美光科技將在未來幾年投資70億美元，擴大在新加坡的制造業(yè)務(wù)。美光在公告中表示，“美光未來在新加坡的擴張計劃也將支持NAND的長期制造需求?！?在PCB制造過…

01-10

AI造假又出新招！好萊塢標志牌“著火”圖實為虛驚一場

01-10

浙大榮譽學(xué)子AI造假，麻省理工嚴處：榮譽與誠信，哪個更重要？

三言科技 1月10日消息，近日，一位曾獲得浙江大學(xué)最高榮譽 “竺可楨獎學(xué)金” 的女生因使用 AI進行學(xué)術(shù)造假而被美國麻省理工學(xué)院（MIT）退學(xué)。據(jù)報道，在2023年的一門課程作業(yè)中，該女生使用ChatGP…

01-10

賈躍亭FX品牌亮相：全新MPV與SUV齊發(fā)，能否逆襲新能源市場？

01-10

微軟再啟裁員計劃，基于績效調(diào)整，預(yù)計影響員工不足1%

01-10

聯(lián)發(fā)科技與Cocos強強聯(lián)手，端側(cè)AI技術(shù)將如何重塑游戲開發(fā)領(lǐng)域？

01-09

點擊查看更多 +

全站最新

小鵬G7來襲，顏值超越G6，售價或達25萬，能否成新爆款？

小米多功能破壁N1，大容量高性價比，228元特惠來襲！

小米新智能手環(huán)M2459B1獲EEC認證，配置功能引期待

Faker五冠加冕 “名人堂阿貍”皮膚將迎五星升級？

小米海外新機POCO X7 Pro亮相，與REDMI Turbo 4有何異同？

《黑神話：悟空》澳門交響音樂會來襲，你準備好沉浸音樂之旅了嗎？

熱門內(nèi)容

本欄最新

AI造假又現(xiàn)！好萊塢標志牌“著火”圖實為假，你中招了嗎？

好太太新設(shè)子公司，含AI軟件開發(fā)業(yè)務(wù)

好太太全資控股新公司，經(jīng)營范圍涉足AI軟件開發(fā)領(lǐng)域

問止中醫(yī)沖刺港股：9個月營收近1.7億，虧損收窄，藍馳真格加持

2024胡潤榜單揭曉：中國人工智能50強企業(yè)價值排行

AI造假又出新招！好萊塢標志牌“著火”圖實為虛驚一場

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

昆侖萬維Skywork o1：解鎖強推理與自我反思，AI新里程碑？

昆侖萬維Skywork o1：解鎖強推理與自我反思，AI新里程碑？