滾動資訊

當前位置：首頁 > 資訊 > 游戲之家 > 正文內容

OpenAI發(fā)布o3模型，AGI評測突破人類水平門檻，智能新紀元來臨？

時間：2024-12-21 09:04:14 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

在科技界萬眾矚目的線上新品發(fā)布活動尾聲，OpenAI于近日揭曉了其最新力作——o3模型，以及一個更為精簡的版本o3-mini。這一發(fā)布標志著OpenAI在人工智能領域的又一重大突破。

OpenAI的首席執(zhí)行官Sam Altman在直播中透露，此次發(fā)布活動首尾呼應，均聚焦于推理模型。活動首日推出了正式版o1，而壓軸登場的o3則展現(xiàn)了更為強大的能力。

關于新模型命名為o3而非o2的原因，Altman解釋稱，這是出于對英國電信服務商O2的尊重，以避免名稱沖突。這一決定體現(xiàn)了OpenAI的細心與周到。

Altman在直播中高度評價o3為“極其聰慧的模型”。OpenAI的評估數(shù)據(jù)顯示，o3在軟件工程、代碼編寫、競賽數(shù)學以及自然科學知識掌握方面，均顯著超越其前輩o1。更令人振奮的是，o3在OpenAI實現(xiàn)通用人工智能（AGI）的征途上取得了關鍵性進展，測試成績已達到類人水平。

回顧今年9月，OpenAI發(fā)布o1預覽版時，曾宣稱o1是首個具備真正通用推理能力的大模型。在測試化學、物理和生物學專業(yè)知識的基準GPQA-diamond上，o1的表現(xiàn)全面超越人類博士專家，準確率高達78.3%。而此次o3的推出，更是將這一標準推向了新的高度。

在軟件工程能力測評中，o3憑借71.7%的準確率遠超o1的48.9%和o1預覽版的41.3%。在競爭性編程網(wǎng)站Codeforces的測評中，o3的Elo評分高達2727，較o1正式版高出44%，是o1預覽版的兩倍多。在數(shù)學競賽AIME的題目測試中，o3的準確率高達96.7%，僅錯一道題，表現(xiàn)堪比頂級數(shù)學家。

在測試化學、物理和生物學專業(yè)知識的基準GPQA-diamond上，o3的準確率也達到了87.7%，較o1和o1預覽版均有顯著提升。這些數(shù)據(jù)無疑證明了o3在多個領域的卓越表現(xiàn)。

o3在AGI評估中也取得了顯著進步。以100%為最高分的ARC-AGI評估結果顯示，o3的最低成績?yōu)?5.7%，最高成績更是高達87.5%，超過了標志著達到人類水平的門檻85%。這一成績無疑為OpenAI實現(xiàn)AGI的目標注入了強大動力。

與此同時，o3-mini作為o3的精簡版，也在性能與成本之間找到了完美的平衡點。在編碼評估方面，o3-mini展現(xiàn)出了出色的性能提升，甚至在中位思考時間下，其性能優(yōu)于o1模型，且成本更低。這意味著開發(fā)人員可以在不增加過多成本的情況下，獲得更高效的編程輔助。

o3-mini還支持函數(shù)調用、結構化輸出、開發(fā)者消息等一系列功能，與o1模型相當。在實際應用中，o3-mini在大多數(shù)評估中實現(xiàn)了可比或更好的性能。在現(xiàn)場演示中，o3-mini的強大功能得到了直觀展示，其處理復雜任務的能力令人印象深刻。

盡管o3和o3-mini的測評表現(xiàn)驚艷，但OpenAI并未急于將其推向大眾市場。目前，OpenAI已允許安全研究人員注冊訪問o3和o3-mini的預覽版，并計劃于明年初正式發(fā)布這些新模型。這一決定無疑為科技界和廣大用戶留下了更多期待。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

常青游戲霸榜！400億收入背后，騰訊網(wǎng)易領銜十億俱樂部

12-21

《影子詭局：被詛咒的海盜》新發(fā)行商揭曉，Hooded Horse接手未來運營

12-21

Epic連續(xù)15天免費領游戲，第二天《阿斯特賴亞》等你來拿！

12-21

《腐爛國度2：巨霸版》Steam特惠，僅需9.9元開啟末日生存之旅！

12-21

2024 IGN年度游戲揭曉，《暗喻幻想》力壓《黑神話：悟空》奪冠

12-21

《原神》5.3版PV來襲，靈與火交織的織卷，元旦等你來探秘！

12-21

OpenAI o3震撼登場，AI通往通用智能之路再邁大步！

12-21

《光年邊境》未來展望：更大開放世界與農(nóng)業(yè)機甲新體驗來襲？

12-21

谷歌Android Auto車聯(lián)平臺開放天氣類App，駕車出行更便捷！

12-21

《原神》納塔探險，為何建議繞開玻娜？長線任務等你挑戰(zhàn)！

12-21

RTX 50系列顯卡臺式機亮相：高端配置價格破4.5萬引關注

12-21

六旬大爺沉迷《黑神話：悟空》，940小時成就游戲傳奇！

12-21

Epic假日大促連送好禮，《阿斯特賴亞》免費領，你還等什么？

12-21

夏侯惇戰(zhàn)場攻略：技能運用與團隊協(xié)作，助你成就無敵戰(zhàn)士

12-21

《無限暖暖》：以溫暖之心，探索美麗而殘酷的開放世界童話

12-21

點擊查看更多 +

全站最新

《原神》5.3版PV來襲，靈與火交織的織卷，元旦等你來探秘！

OpenAI o3震撼登場，AI通往通用智能之路再邁大步！

《光年邊境》未來展望：更大開放世界與農(nóng)業(yè)機甲新體驗來襲？

證監(jiān)會優(yōu)化港基互認安排，香港互認基金內地銷售比例提升至80%

2025款豐田凱美瑞光輝版上市，黑武士能否續(xù)寫輝煌篇章？

歐洲百億太空計劃出爐，欲打造衛(wèi)星通信新體系抗衡馬斯克“星鏈”

熱門內容

本欄最新

OpenAI o3震撼登場，AI通往通用智能之路再邁大步！

《光年邊境》未來展望：更大開放世界與農(nóng)業(yè)機甲新體驗來襲？

谷歌Android Auto車聯(lián)平臺開放天氣類App，駕車出行更便捷！

《原神》納塔探險，為何建議繞開玻娜？長線任務等你挑戰(zhàn)！

RTX 50系列顯卡臺式機亮相：高端配置價格破4.5萬引關注

六旬大爺沉迷《黑神話：悟空》，940小時成就游戲傳奇！

本網(wǎng)站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

OpenAI發(fā)布o3模型，AGI評測突破人類水平門檻，智能新紀元來臨？

OpenAI發(fā)布o3模型，AGI評測突破人類水平門檻，智能新紀元來臨？