<th id="16161"><abbr id="16161"></abbr></th>

<tt id="16161"><acronym id="16161"><mark id="16161"></mark></acronym></tt>

ITBear旗下自媒體矩陣：

滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

360自研AI大模型gpt2-o1亮相，數(shù)學(xué)邏輯推理能力能否超越國(guó)際水平？

時(shí)間：2024-12-14 11:11:35 來(lái)源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

近日，360智腦官方在其公眾號(hào)上發(fā)布了一則令人矚目的消息，正式推出了其自主研發(fā)的AI大模型——360gpt2-o1。這款新模型在推理能力上實(shí)現(xiàn)了顯著提升，尤其在數(shù)學(xué)與邏輯推理任務(wù)上的表現(xiàn)尤為突出。

360gpt2-o1之所以能夠在這些領(lǐng)域取得如此優(yōu)異的成績(jī)，主要得益于其三大技術(shù)突破：合成數(shù)據(jù)優(yōu)化、模型后訓(xùn)練以及“慢思考”范式。這些技術(shù)使得該模型在多項(xiàng)權(quán)威評(píng)測(cè)中均表現(xiàn)出色，超越了前代模型360gpt2-pro，甚至在與GPT-4o模型的對(duì)比中也毫不遜色。

在數(shù)學(xué)領(lǐng)域的評(píng)測(cè)中，360gpt2-o1展現(xiàn)出了強(qiáng)大的實(shí)力。無(wú)論是基礎(chǔ)數(shù)學(xué)評(píng)測(cè)，如MATH和高考數(shù)學(xué)，還是權(quán)威的數(shù)學(xué)競(jìng)賽，包括AIME24和AMC23，該模型都取得了令人矚目的成績(jī)。特別是在數(shù)學(xué)競(jìng)賽評(píng)測(cè)中，360gpt2-o1還超越了阿里巴巴最新開(kāi)源的o1系列模型QWQ-32B-preview，進(jìn)一步證明了其卓越的數(shù)學(xué)推理能力。

為了提升模型的推理能力，360智腦團(tuán)隊(duì)在合成數(shù)據(jù)優(yōu)化方面下足了功夫。他們通過(guò)指令合成、質(zhì)量/多樣性篩選等方法，有效解決了高質(zhì)量數(shù)學(xué)與邏輯推理數(shù)據(jù)稀缺的問(wèn)題，為模型提供了豐富的訓(xùn)練數(shù)據(jù)集。

在模型后訓(xùn)練階段，360智腦團(tuán)隊(duì)采用了兩階段訓(xùn)練策略。他們首先利用小模型生成多樣化的推理路徑，然后利用大模型進(jìn)行RFT訓(xùn)練和強(qiáng)化學(xué)習(xí)訓(xùn)練，從而進(jìn)一步提升了模型的推理能力和反思糾錯(cuò)能力。

360gpt2-o1還引入了“慢思考”范式，這一創(chuàng)新性的技術(shù)使得模型能夠像人類一樣逐步推理和反思。該范式利用蒙特卡洛樹(shù)搜索探索多樣化的解決方案，并引入LLM進(jìn)行錯(cuò)誤驗(yàn)證和糾錯(cuò)，最終形成包含反思、驗(yàn)證、糾錯(cuò)和回溯的長(zhǎng)思維鏈。

360智腦官方還公布了360gpt2-o1的整體架構(gòu)圖，展示了其復(fù)雜而精密的設(shè)計(jì)。這一架構(gòu)的公布，不僅讓人們更加了解了這款A(yù)I大模型的內(nèi)部構(gòu)造，也為其在未來(lái)的應(yīng)用和發(fā)展提供了更多的可能性。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

抖音2024年直播治理報(bào)告：32萬(wàn)賬號(hào)被回收，中小商家直播銷售額超6591億

12-28

極光問(wèn)鼎WIM2024“AIGC創(chuàng)新產(chǎn)業(yè)TOP20”，GPTBots引領(lǐng)企業(yè)數(shù)智化轉(zhuǎn)型

12-28

仙途智能榮登機(jī)器之心AI領(lǐng)軍企業(yè)榜單，實(shí)力領(lǐng)航無(wú)人駕駛新賽道

12-28

AI賦能教育，Meta Dot與GPTBots共繪智慧教育新藍(lán)圖

12-28

榮耀Magic7系列影像大升級(jí)，AI超級(jí)長(zhǎng)焦引領(lǐng)手機(jī)攝影新風(fēng)尚

12-28

訊飛醫(yī)療：安徽合肥崛起的醫(yī)療AI獨(dú)角獸，年收入5.56億領(lǐng)跑全國(guó)

12-27

OpenAI大變革：非營(yíng)利與營(yíng)利拆分，馬斯克法律糾紛成絆腳石？

12-27

字節(jié)跳動(dòng)豪擲1600億布局AI，蘋(píng)果急欲合作搶灘中國(guó)市場(chǎng)？

12-27

榮耀大招頻出：大王影像震撼發(fā)布，保時(shí)捷設(shè)計(jì)價(jià)格下探引熱議

12-27

OpenAI結(jié)構(gòu)調(diào)整：非營(yíng)利與營(yíng)利并行，能否更好推進(jìn)AGI使命？

12-27

存算一體芯片破局AI存儲(chǔ)瓶頸，PIM技術(shù)標(biāo)準(zhǔn)化加速商業(yè)化進(jìn)程

以AMD、Intel、三星、海力士等企業(yè)為代表的半導(dǎo)體龍頭企業(yè)均已發(fā)布基于高帶寬內(nèi)存技術(shù)(HBM)和2.5D/3D封裝技術(shù)的近存計(jì)算芯片。 2021年，三星展示了基于HBM2-PIM技術(shù)的存內(nèi)計(jì)算芯片，該處理…

12-27

2025年AI趨勢(shì)前瞻：Web Agent或成新殺手級(jí)應(yīng)用，智能爆炸序章開(kāi)啟？

如果說(shuō)2023年是生成式AI元年，2024年是AI普及元年；那么在2025年，AI將迎來(lái)從廣泛應(yīng)用到深度轉(zhuǎn)型的關(guān)鍵時(shí)刻——橫向提升生產(chǎn)效率、優(yōu)化業(yè)務(wù)流程；縱向在醫(yī)療、金融、制造、教育等多個(gè)領(lǐng)域扎根，推動(dòng)根本…

12-27

榮耀Magic7保時(shí)捷版新影像技術(shù)：AI馭光，重塑移動(dòng)攝影巔峰

12-27

基石智算大模型公測(cè)開(kāi)啟，你準(zhǔn)備好打造專屬多模態(tài)AI應(yīng)用了嗎？

12-27

大位科技新動(dòng)作：廣東成立通信技術(shù)全資子公司

12-27

點(diǎn)擊查看更多 +

全站最新

小米新品再受熱捧！米家智能健腹輪眾籌火爆售罄

小米新品再受熱捧！米家智能健腹輪眾籌火爆售罄

盧偉冰透露：小米2024年高端手機(jī)銷量大增，全球突破千萬(wàn)臺(tái)

盧偉冰透露：小米2024年高端手機(jī)銷量大增，全球突破千萬(wàn)臺(tái)

小米平板6S Pro新功能：3A游戲虛擬機(jī)內(nèi)測(cè)，平板秒變游戲電腦？

小米平板6S Pro新功能：3A游戲虛擬機(jī)內(nèi)測(cè)，平板秒變游戲電腦？

成都為何對(duì)共享電單車說(shuō)“不”？安全隱患成主因

成都為何對(duì)共享電單車說(shuō)“不”？安全隱患成主因

華為Mate70 Pro+超可靠架構(gòu)揭秘，余承東盛贊：兄弟們，再接再厲！

華為Mate70 Pro+超可靠架構(gòu)揭秘，余承東盛贊：兄弟們，再接再厲！

馮毅：18年守望，只為神舟開(kāi)艙那一刻的榮耀

馮毅：18年守望，只為神舟開(kāi)艙那一刻的榮耀

熱門(mén)內(nèi)容

本欄最新

抖音2024年直播治理報(bào)告：32萬(wàn)賬號(hào)被回收，中小商家直播銷售額超6591億

抖音2024年直播治理報(bào)告：32萬(wàn)賬號(hào)被回收，中小商家直播銷售額超6591億

極光問(wèn)鼎WIM2024“AIGC創(chuàng)新產(chǎn)業(yè)TOP20”，GPTBots引領(lǐng)企業(yè)數(shù)智化轉(zhuǎn)型

極光問(wèn)鼎WIM2024“AIGC創(chuàng)新產(chǎn)業(yè)TOP20”，GPTBots引領(lǐng)企業(yè)數(shù)智化轉(zhuǎn)型

仙途智能榮登機(jī)器之心AI領(lǐng)軍企業(yè)榜單，實(shí)力領(lǐng)航無(wú)人駕駛新賽道

仙途智能榮登機(jī)器之心AI領(lǐng)軍企業(yè)榜單，實(shí)力領(lǐng)航無(wú)人駕駛新賽道

榮耀Magic7系列影像大升級(jí)，AI超級(jí)長(zhǎng)焦引領(lǐng)手機(jī)攝影新風(fēng)尚

榮耀Magic7系列影像大升級(jí)，AI超級(jí)長(zhǎng)焦引領(lǐng)手機(jī)攝影新風(fēng)尚

榮耀大招頻出：大王影像震撼發(fā)布，保時(shí)捷設(shè)計(jì)價(jià)格下探引熱議

榮耀大招頻出：大王影像震撼發(fā)布，保時(shí)捷設(shè)計(jì)價(jià)格下探引熱議

OpenAI結(jié)構(gòu)調(diào)整：非營(yíng)利與營(yíng)利并行，能否更好推進(jìn)AGI使命？

OpenAI結(jié)構(gòu)調(diào)整：非營(yíng)利與營(yíng)利并行，能否更好推進(jìn)AGI使命？

網(wǎng)站首頁(yè) | 關(guān)于我們 | 聯(lián)系方式 | 版權(quán)聲明 | RSS訂閱 | 開(kāi)放轉(zhuǎn)載 | 滾動(dòng)資訊 | 爭(zhēng)議稿件處理 | English Version

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

<strike id="66666"><s id="66666"></s></strike>

<th id="66666"><acronym id="66666"></acronym></th>