近日,ChatGPT在社交媒體X上宣布,其聊天機(jī)器人家族的GPT-4o模型迎來(lái)了重要更新,并強(qiáng)調(diào)此次更新將帶來(lái)顯著變化。值得注意的是,此更新并非針對(duì)OpenAI最新的API端GPT-4o 0806模型,而是一項(xiàng)面向所有用戶的福利,即便是免費(fèi)用戶也能體驗(yàn),盡管使用次數(shù)有所限制。
在此之前,外界已有傳言稱OpenAI將在ChatGPT的更新中揭曉“草莓”項(xiàng)目。這一消息引發(fā)了廣泛猜測(cè),而官宣之后,更有網(wǎng)友推測(cè)新的GPT-4o模型可能就是“草莓”項(xiàng)目的成果。
這些猜測(cè)并非毫無(wú)根據(jù)。ChatGPT此前曾在X上發(fā)布草莓的表情,似乎有所暗示。而OpenAI的CEO奧特曼也在社交媒體上分享了夏日花園中的草莓照片,進(jìn)一步引發(fā)了公眾的遐想。
那么,“草莓”項(xiàng)目究竟是何方神圣?據(jù)ITBEAR了解,上個(gè)月,OpenAI的內(nèi)部團(tuán)隊(duì)被曝正在開發(fā)“草莓”項(xiàng)目,旨在增強(qiáng)OpenAI模型的推理能力和處理復(fù)雜科學(xué)與數(shù)學(xué)問(wèn)題的能力,使大模型不僅能生成查詢答案,還能提前規(guī)劃,以便自主、可靠地瀏覽互聯(lián)網(wǎng),進(jìn)行OpenAI定義的“深度研究”。
而“草莓”項(xiàng)目的前身是Q*算法模型,該模型能夠解決棘手的科學(xué)和數(shù)學(xué)問(wèn)題。數(shù)學(xué)作為生成式AI發(fā)展的基礎(chǔ),掌握數(shù)學(xué)能力將使AI模型擁有更強(qiáng)的推理能力,甚至與人類智能相媲美,這也是目前大語(yǔ)言模型尚無(wú)法做到的一點(diǎn)。
奧特曼曾強(qiáng)調(diào),推理能力將是未來(lái)AI發(fā)展的關(guān)鍵。據(jù)知情人士透露,“草莓”項(xiàng)目包括一種專門的“后訓(xùn)練”方法,即在生成式AI模型已經(jīng)過(guò)大量數(shù)據(jù)集預(yù)訓(xùn)練后,進(jìn)一步調(diào)整模型以提高其在特定任務(wù)上的表現(xiàn)。這與斯坦福大學(xué)在2022年開發(fā)的“自學(xué)推理者”(Self-Taught Reasoner,簡(jiǎn)稱STaR)方法類似。
STaR的創(chuàng)造者之一、斯坦福大學(xué)教授Noah Goodman曾表示,STaR可以讓AI模型通過(guò)反復(fù)創(chuàng)建自己的訓(xùn)練數(shù)據(jù),“引導(dǎo)”自己進(jìn)入更高的智能水平,理論上可以用來(lái)讓語(yǔ)言模型實(shí)現(xiàn)超越人類的智能。這與OpenAI所追求的“推理能力”不謀而合。
此外,OpenAI在11日還公布了未來(lái)AI發(fā)展的五級(jí)路線圖:
按照OpenAI的設(shè)想,未來(lái)AI將經(jīng)歷五個(gè)階段:第一級(jí)是聊天機(jī)器人,具有對(duì)話語(yǔ)言的人工智能;第二級(jí)是推理者,具備人類水平的問(wèn)題解決能力;第三級(jí)是代理者,可以采取行動(dòng)的系統(tǒng);第四級(jí)是創(chuàng)新者,能夠協(xié)助發(fā)明的人工智能;第五級(jí)是組織者,可以完成組織工作的人工智能。