OpenAI近期通過(guò)電子郵件向TechCrunch透露,其o3-mini模型迎來(lái)了一項(xiàng)重大更新——引入了全新的思維鏈技術(shù)。這一技術(shù)革新旨在提升用戶(hù)對(duì)模型推理過(guò)程的理解,使用戶(hù)對(duì)模型的響應(yīng)更加清晰自信。
據(jù)OpenAI介紹,o3-mini等推理模型在輸出結(jié)果前會(huì)進(jìn)行自我事實(shí)核查,這一特性雖然有助于避免模型陷入常見(jiàn)陷阱,但也導(dǎo)致了推理過(guò)程耗時(shí)較長(zhǎng),通常需要額外幾秒到幾分鐘。
與o3-mini類(lèi)似的,DeepSeek的R1模型同樣作為一種推理模型,能夠展示完整的思維過(guò)程,這一做法備受人工智能研究人員的青睞。他們認(rèn)為,推理步驟的展示不僅有助于模型研究,還能在某些情況下提升用戶(hù)體驗(yàn),幫助用戶(hù)判斷模型是否正在正確路徑上運(yùn)行。
然而,OpenAI在過(guò)去并未展示o3-mini及其前身o1和o1-mini的完整推理步驟,這在一定程度上是出于競(jìng)爭(zhēng)考慮。用戶(hù)往往只能看到推理步驟的摘要,而這些摘要有時(shí)并不準(zhǔn)確。
盡管如此,OpenAI表示已找到了一種平衡之道。他們?yōu)閛3-mini引入了更詳細(xì)的摘要功能,使模型能夠自由思考并有序地組織其想法。OpenAI發(fā)言人表示,為了提升清晰度和安全性,他們?cè)黾恿艘粋€(gè)后處理步驟,讓模型審查并刪除原始思路中的不安全內(nèi)容,同時(shí)簡(jiǎn)化復(fù)雜想法。這一后處理步驟還能使非英語(yǔ)用戶(hù)以母語(yǔ)接收思路,從而提升用戶(hù)體驗(yàn)。
在上周的Reddit AMA活動(dòng)中,OpenAI首席產(chǎn)品官Kevin Weil也暗示了這一變化即將到來(lái)。他表示,OpenAI正在努力展示更多內(nèi)容,展示模型思維過(guò)程的功能很快就會(huì)出現(xiàn)。同時(shí),他也承認(rèn)展示所有思維鏈可能會(huì)引發(fā)競(jìng)爭(zhēng)性的提煉,但他們知道用戶(hù)(尤其是高級(jí)用戶(hù))對(duì)此有需求,因此將努力找到平衡之道。
此次更新標(biāo)志著OpenAI在提升模型透明度和用戶(hù)體驗(yàn)方面邁出了重要一步。隨著技術(shù)的不斷進(jìn)步,未來(lái)我們或許能夠更深入地了解AI模型的思維方式,從而更好地利用這些技術(shù)服務(wù)于人類(lèi)社會(huì)。