OpenAI公司于近日在X平臺上發(fā)布了一則重要更新消息,宣布對其o3系列模型中的o3-mini進行了思維鏈功能的升級,此次更新惠及了免費及付費用戶群體。
特別地,對于付費用戶,OpenAI推出了o3-mini-high版本,該版本在思維鏈展示上更為透明和詳盡,能夠清晰地呈現(xiàn)模型的推理步驟及答案得出過程,為用戶提供了更深層次的解析體驗。
回顧去年12月,OpenAI推出了全新的推理模型系列——o3,該系列包括高性能的o3模型及精簡版o3-mini模型。o3-mini在保持高度智能的同時,對性能和成本進行了優(yōu)化,滿足了不同用戶的需求。
o3模型自發(fā)布以來,便在多個領(lǐng)域展現(xiàn)出了卓越的性能。在軟件基準測試SWE-bench Verified中,o3以71.7%的準確率領(lǐng)先,相比其前代o1模型,性能提升了超過20個百分點。在編程競技領(lǐng)域,o3同樣表現(xiàn)出色,在Codeforces競賽中的評分高達2727分,幾乎達到了OpenAI內(nèi)部頂尖程序員的水平。
更令人驚嘆的是,o3模型在AIME數(shù)學(xué)競賽模擬中的表現(xiàn)。它以96.7%的準確率遠超o1模型的83.3%,展現(xiàn)出了強大的數(shù)學(xué)推理能力。在ARC-AGI測試中,o3模型更是取得了歷史性的突破,首次跨越了人類水平門檻,以87.5%的優(yōu)異成績,為OpenAI在實現(xiàn)人工通用智能(AGI)的道路上樹立了新的里程碑。