近期,科技界迎來了一場引人矚目的盛宴,OpenAI在其“連續(xù)12日圣誕發(fā)布”活動(dòng)中,終于揭曉了備受期待的終極產(chǎn)品——o3,這一前沿推理模型的升級版,被譽(yù)為OpenAI迄今最強(qiáng)的技術(shù)結(jié)晶。
據(jù)OpenAI透露,o3在某些特定條件下已接近通用人工智能(AGI)的水平,并同時(shí)推出了o3及其精簡版本o3-mini,以滿足不同用戶的需求。
在各類評估中,o3展現(xiàn)出了驚人的實(shí)力。在軟件工程測試中,其準(zhǔn)確率相比前代o1提升了近47%;在競賽數(shù)學(xué)測評中,準(zhǔn)確率提高了15%;而在人類博士專家級的生化物測試中,o3的準(zhǔn)確率也比o1高出近13%。在AGI相關(guān)測試中,o3更是取得了87.5分的佳績,超過了人類水平的門檻85分,標(biāo)志著向類人智能邁出了重要的一步。
與之形成鮮明對比的是,GPT-3在這一測試中的得分為0%,GPT-4o也僅為5%,而o3則一舉將成績提升至87.5%,展現(xiàn)出了其強(qiáng)大的推理和學(xué)習(xí)能力。
OpenAI計(jì)劃在明年初正式發(fā)布o(jì)3系列模型,但CEO Altman表示,這類模型可能不會(huì)立即面向大眾上線。他強(qiáng)調(diào),在正式發(fā)布前,需要有一個(gè)聯(lián)邦政府的測試框架來指導(dǎo)、監(jiān)控并減少這類模型可能帶來的風(fēng)險(xiǎn)。
從本周五開始,OpenAI已允許安全研究人員注冊訪問o3和o3-mini的預(yù)覽版,以進(jìn)一步評估和優(yōu)化這些模型。
回顧OpenAI此次的12天技術(shù)直播,亮點(diǎn)頻出。除了重磅推出的o3模型外,OpenAI還帶來了“滿血版”推理模型o1和ChatGPT Pro,后者每月訂閱費(fèi)為200美元。同時(shí),OpenAI還推出了強(qiáng)化微調(diào)研究項(xiàng)目,能夠使用數(shù)十到數(shù)千個(gè)高質(zhì)量任務(wù)來定制模型,以滿足特定需求。
OpenAI還正式推出了AI視頻生成模型Sora Turbo,支持最高1080p 20s的視頻生成。升級版Canvas創(chuàng)作助手也向全量用戶開放,主打高效編程與寫作。與蘋果的合作更是將Siri、寫作工具和Visual Intelligence與ChatGPT深度集成,為用戶帶來了全新的體驗(yàn)。
OpenAI還全量上線了4o視頻通話功能,能夠?qū)崟r(shí)對話并理解用戶的連續(xù)性動(dòng)作,同時(shí)還具備記憶能力。Projects In ChatGPT的推出,則整合了ChatGPT的各種功能,便于用戶創(chuàng)建及管理項(xiàng)目。ChatGPT搜索功能也得到了全面升級,新增了地圖集成、實(shí)時(shí)搜索等功能,并向所有用戶開放。
在API方面,OpenAI開放了滿血o1模型API,實(shí)時(shí)API直接支持WebRTC,且定價(jià)降低了60%。同時(shí),ChatGPT也入駐了手機(jī)平臺,用戶撥打免費(fèi)號碼即可連接聊天機(jī)器人,每月可免費(fèi)通話15分鐘。OpenAI還支持了原生應(yīng)用程序自動(dòng)化協(xié)作功能,能夠主動(dòng)理解用戶需求,為用戶提供更加便捷的服務(wù)。