在科技日新月異的今天,人工智能領(lǐng)域再次迎來重大突破。北京時間2月3日上午,OpenAI正式推出了一款名為“深度研究”(Deep Research)的智能體產(chǎn)品,專為深度研究領(lǐng)域打造,旨在大幅提升專業(yè)研究報告的生成效率。
這款創(chuàng)新產(chǎn)品能夠自主分析復雜的專業(yè)信息,實時查找并綜合數(shù)百個在線資源,最終生成一份專業(yè)水準的完整報告。以往,一位經(jīng)驗豐富的行業(yè)分析師可能需要花費數(shù)天甚至數(shù)周的時間才能完成這樣的任務,而現(xiàn)在,借助深度研究功能,這一過程被縮短至僅需5-30分鐘。這一變革性的進展,無疑將深刻影響金融、科學、政策、工程等多個領(lǐng)域的知識工作者。
深度研究功能由OpenAI即將推出的o3模型的特制版本提供支持,該版本經(jīng)過專門優(yōu)化,適配網(wǎng)頁瀏覽和數(shù)據(jù)分析場景。它能夠運用強大的推理能力,在互聯(lián)網(wǎng)上搜索、解讀和分析海量的文本、圖像和PDF文件,并能根據(jù)所遇到的信息靈活調(diào)整研究方向。這一技術(shù)的實現(xiàn),標志著人工智能在深度研究領(lǐng)域的重大進步。
在評估深度研究功能的能力時,OpenAI特別提到了Humanity’s Last Exam(簡稱HLE)測試。在這項由全球眾多領(lǐng)域?qū)<夜餐_發(fā)的測試中,深度研究所使用的模型在專家級問題上達到了26.6%的準確率,刷新了之前的紀錄。相比之下,DeepSeek的R1模型的準確率僅為9.4%。這一成績充分證明了深度研究在廣泛學科領(lǐng)域中的卓越表現(xiàn)。
深度研究功能專為高強度知識工作者設計,他們需要全面、精準且可靠的調(diào)研成果。同時,它也適用于在購買汽車、家電、家具等需要謹慎研究的產(chǎn)品時,希望尋求高度個性化建議的消費者。深度研究的輸出附有清晰的引用和對其思考過程的總結(jié),便于用戶查閱和驗證信息。它尤其擅長尋找冷門、非直觀信息,通過一次查詢即可幫助用戶卸載并加速復雜、耗時的網(wǎng)絡調(diào)研任務。
在技術(shù)架構(gòu)層面,深度研究由四個協(xié)同工作的核心模塊構(gòu)成:信息發(fā)現(xiàn)模塊、信息綜合模塊、推理模塊和輸出模塊。這些模塊共同形成了一個完整的智能研究系統(tǒng),能夠像人類研究者一樣進行整體性的思考和決策。信息發(fā)現(xiàn)模塊負責在多個平臺中定位有價值的信息;信息綜合模塊將零散信息梳理成系統(tǒng)化的知識體系;推理模塊對收集到的信息進行深度分析和推導;輸出模塊則將研究成果轉(zhuǎn)化為專業(yè)的呈現(xiàn)形式。
深度研究功能還采用了端到端強化學習的方式,在多個領(lǐng)域中針對復雜的網(wǎng)絡瀏覽和推理任務進行訓練。通過這種方式,它學會了如何規(guī)劃并執(zhí)行多步驟的操作流程,以找到所需的數(shù)據(jù),并在必要時進行回溯以及對實時信息做出反應。這種創(chuàng)新的學習方式打破了傳統(tǒng)機器學習需要人為劃分訓練階段的限制。
目前,深度研究功能已在ChatGPT網(wǎng)頁版上線,并計劃在一個月內(nèi)擴展到移動和桌面應用程序。OpenAI已推出針對Pro用戶的優(yōu)化版本,每月最多支持100次查詢。接下來,Plus和Team用戶將獲得訪問權(quán)限,隨后是企業(yè)用戶。未來,用戶還將能夠連接到更多專業(yè)化的數(shù)據(jù)源,擴展其對訂閱制或內(nèi)部資源的訪問權(quán)限。
盡管深度研究功能目前仍處于早期階段,存在一些局限性,如可能生成虛假信息、難以區(qū)分權(quán)威信息與謠言等,但OpenAI表示將密切監(jiān)控當前版本的表現(xiàn),并進行更嚴格的測試。預計在未來幾周和幾個月內(nèi),隨著技術(shù)基礎(chǔ)設施的完善,深度研究功能的表現(xiàn)將得到進一步提升。