滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

OpenAI o3模型登場(chǎng)，能否成為通用人工智能新里程碑？

時(shí)間：2024-12-21 08:11:15 來(lái)源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

在近期科技界的重大事件中，OpenAI公司的“12 Days of OpenAI”活動(dòng)圓滿(mǎn)落幕，這一活動(dòng)的壓軸大戲是o3系列大模型的驚艷亮相。據(jù)官方透露，o3在某些應(yīng)用場(chǎng)景下的推理能力已逼近通用人工智能（AGI）的水平，這一消息引起了業(yè)界的廣泛關(guān)注。

關(guān)于o3的命名，OpenAI首席執(zhí)行官山姆·阿爾特曼在一場(chǎng)直播活動(dòng)中給出了答案。他解釋稱(chēng)，為了避免與英國(guó)電信運(yùn)營(yíng)商O(píng)2的商標(biāo)產(chǎn)生沖突，公司決定跳過(guò)o2，直接將最新模型命名為o3。這一決定不僅彰顯了OpenAI在命名上的創(chuàng)意，也體現(xiàn)了其對(duì)法律風(fēng)險(xiǎn)的謹(jǐn)慎考量。

o3作為o1推理模型的升級(jí)版，推出了完整版和精簡(jiǎn)版（o3-mini）兩個(gè)版本。其中，o3-mini針對(duì)特定任務(wù)進(jìn)行了優(yōu)化，以滿(mǎn)足不同用戶(hù)的需求。然而，OpenAI并未立即全面開(kāi)放這兩款模型，而是先邀請(qǐng)安全研究人員注冊(cè)測(cè)試預(yù)覽版o3-mini，待測(cè)試穩(wěn)定后再推出o3預(yù)覽版。這一舉措不僅有助于提升模型的安全性，還能為后續(xù)的全面開(kāi)放打下堅(jiān)實(shí)基礎(chǔ)。

對(duì)于感興趣的公眾而言，他們可以通過(guò)OpenAI的官方網(wǎng)站提交申請(qǐng)，參與安全測(cè)試。雖然阿爾特曼并未透露o3模型的具體開(kāi)放日期，但他表示o3-mini將在2025年1月底推出，隨后再推出o3。這一消息無(wú)疑讓眾多AI愛(ài)好者充滿(mǎn)了期待。

o3模型與主流AI模型的一個(gè)顯著區(qū)別在于其事實(shí)核查功能。這一功能能夠幫助o3規(guī)避一些常見(jiàn)的模型陷阱，但也會(huì)帶來(lái)一定的響應(yīng)延遲。根據(jù)推理難度的不同，延遲時(shí)間通常在幾秒到幾分鐘之間。o3還采用了“私人思想鏈”進(jìn)行思考，能夠在響應(yīng)前暫停并考慮相關(guān)提示，最終給出最準(zhǔn)確的答案。

o3模型還具備調(diào)整推理時(shí)間的新功能，用戶(hù)可以根據(jù)需要選擇低、中、高三種計(jì)算級(jí)別。計(jì)算級(jí)別越高，o3的任務(wù)執(zhí)行性能就越好。這一功能為用戶(hù)提供了更加靈活的使用體驗(yàn)。

在性能方面，o3模型在多個(gè)基準(zhǔn)測(cè)試中均表現(xiàn)出色。在ARC-AGI基準(zhǔn)測(cè)試中，o3在高計(jì)算設(shè)置下獲得了87.5%的分?jǐn)?shù)，在低計(jì)算設(shè)置下得分為75.7%，性能是o1的三倍。在SWE-Bench Verified編程任務(wù)基準(zhǔn)測(cè)試、Codeforces編程技能測(cè)試、2024年美國(guó)數(shù)學(xué)邀請(qǐng)賽以及GPQA Diamond研究生水平生物、物理和化學(xué)測(cè)試中，o3均取得了優(yōu)異的成績(jī)。

這些成績(jī)不僅證明了o3模型的強(qiáng)大實(shí)力，也為其在通用人工智能領(lǐng)域的進(jìn)一步發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。然而，隨著o3能力的不斷提升，其潛在風(fēng)險(xiǎn)也日益凸顯。OpenAI承諾將致力于模型安全，并與其他機(jī)構(gòu)合作構(gòu)建更加完善的基準(zhǔn)測(cè)試體系，以確保o3能夠在安全可控的范圍內(nèi)發(fā)揮最大效用。

o3的發(fā)布對(duì)于OpenAI與微軟之間的合作關(guān)系也產(chǎn)生了重要影響。根據(jù)雙方的交易條款，一旦OpenAI達(dá)到AGI水平，公司將不再有義務(wù)向微軟提供其最先進(jìn)的技術(shù)。這意味著o3的成功發(fā)布不僅標(biāo)志著OpenAI在通用人工智能領(lǐng)域邁出了重要一步，也可能對(duì)其與微軟的合作關(guān)系產(chǎn)生深遠(yuǎn)影響。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類(lèi)資訊

自動(dòng)駕駛落榜，圖森未來(lái)能否借AI游戲與金庸IP東山再起？

12-21

小米重金攬才，DeepSeek大模型專(zhuān)家羅福莉或?qū)⒓用诵∶譇I實(shí)驗(yàn)室

12-21

普渡機(jī)器人PUDU D9：雙足行走、靈活操作，深圳智造展現(xiàn)清潔新技能！

二是在操作方面，PUDU D9擁有兩條7自由度機(jī)械臂，負(fù)載超過(guò)20kg，搭載11自由度五指靈巧手PUDU DH11，可靈活完成各類(lèi)精細(xì)操作任務(wù)，滿(mǎn)足多類(lèi)場(chǎng)景需求。在產(chǎn)品布局完成之后，普渡或?qū)⒃诰呱碇悄艿穆涞亍?/div>

12-21

超算AI聯(lián)手！科學(xué)家描繪地球20億至5億年前生命多樣性演化壯麗圖景

12-21

值得買(mǎi)科技AI戰(zhàn)略引領(lǐng)消費(fèi)新風(fēng)尚，榮獲華為云先鋒實(shí)踐案例

12-20

科技新風(fēng)向！這些創(chuàng)新熱詞你掌握了嗎？

12-20

輕量化AI眼鏡，999元閃極“拍拍鏡”能否開(kāi)啟智能穿戴新篇章？

12-20

谷歌CEO：將削減10%高管職位

12-20

OpenAI被意大利罰款1500萬(wàn)歐元：ChatGPT數(shù)據(jù)使用侵犯隱私

12-20

行競(jìng)科技儲(chǔ)能電池技術(shù)驚艷CES，浸沒(méi)式冷卻獲創(chuàng)新大獎(jiǎng)

12-20

蘋(píng)果國(guó)行iPhone尋AI新伙伴，百度落榜背后有何隱情？

12-20

湯姆貓AI童伴機(jī)器人即將面世，情緒識(shí)別聊天科普樣樣精通

12-20

2024旗艦手機(jī)大賞：影像升級(jí)，AI成新寵，誰(shuí)將領(lǐng)跑未來(lái)？

12-20

京東健康新突破：智能手機(jī)秒變血壓計(jì)，便捷監(jiān)測(cè)新時(shí)代

基于京醫(yī)千詢(xún)大模型的多模態(tài)能力，京東健康成功自主研發(fā)了“首款以智能手機(jī)為載體的多模態(tài)技術(shù)應(yīng)用血壓檢測(cè)產(chǎn)品”（以下簡(jiǎn)稱(chēng)“手機(jī)測(cè)血壓產(chǎn)品”），該產(chǎn)品內(nèi)嵌于京東/京東健康A(chǔ)pp中，登陸搜索“測(cè)血壓”即可使用。正…

12-20

行競(jìng)科技CES展風(fēng)采：浸沒(méi)式冷卻電池技術(shù)獲創(chuàng)新大獎(jiǎng)

12-20

點(diǎn)擊查看更多 +

全站最新

蔚來(lái)十年路：多品牌戰(zhàn)略能否引領(lǐng)盈利未來(lái)？

RTX 50系列顯卡臺(tái)式機(jī)亮相：高端配置價(jià)格破4.5萬(wàn)引關(guān)注

六旬大爺沉迷《黑神話：悟空》，940小時(shí)成就游戲傳奇！

小米YU7實(shí)車(chē)照流出，中大型SUV設(shè)計(jì)亮眼，能否成為市場(chǎng)新寵？

OPPO Find X8系列哈蘇水印自定義上線，Live圖編輯分享再升級(jí)！