滾動資訊

當前位置：首頁 > 資訊 > 智能汽車 > 正文內(nèi)容

OpenAI“深度研究”功能上線，HLE測試準確率超DeepSeek R1，AI研究能力再突破

時間：2025-02-03 14:00:37 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

在科技日新月異的今天，人工智能領(lǐng)域再次迎來重大突破。北京時間2月3日上午，OpenAI正式推出了一款名為“深度研究”（Deep Research）的智能體產(chǎn)品，專為深度研究領(lǐng)域打造，旨在大幅提升專業(yè)研究報告的生成效率。

這款創(chuàng)新產(chǎn)品能夠自主分析復雜的專業(yè)信息，實時查找并綜合數(shù)百個在線資源，最終生成一份專業(yè)水準的完整報告。以往，一位經(jīng)驗豐富的行業(yè)分析師可能需要花費數(shù)天甚至數(shù)周的時間才能完成這樣的任務，而現(xiàn)在，借助深度研究功能，這一過程被縮短至僅需5-30分鐘。這一變革性的進展，無疑將深刻影響金融、科學、政策、工程等多個領(lǐng)域的知識工作者。

深度研究功能由OpenAI即將推出的o3模型的特制版本提供支持，該版本經(jīng)過專門優(yōu)化，適配網(wǎng)頁瀏覽和數(shù)據(jù)分析場景。它能夠運用強大的推理能力，在互聯(lián)網(wǎng)上搜索、解讀和分析海量的文本、圖像和PDF文件，并能根據(jù)所遇到的信息靈活調(diào)整研究方向。這一技術(shù)的實現(xiàn)，標志著人工智能在深度研究領(lǐng)域的重大進步。

在評估深度研究功能的能力時，OpenAI特別提到了Humanity’s Last Exam（簡稱HLE）測試。在這項由全球眾多領(lǐng)域?qū)＜夜餐_發(fā)的測試中，深度研究所使用的模型在專家級問題上達到了26.6%的準確率，刷新了之前的紀錄。相比之下，DeepSeek的R1模型的準確率僅為9.4%。這一成績充分證明了深度研究在廣泛學科領(lǐng)域中的卓越表現(xiàn)。

深度研究功能專為高強度知識工作者設計，他們需要全面、精準且可靠的調(diào)研成果。同時，它也適用于在購買汽車、家電、家具等需要謹慎研究的產(chǎn)品時，希望尋求高度個性化建議的消費者。深度研究的輸出附有清晰的引用和對其思考過程的總結(jié)，便于用戶查閱和驗證信息。它尤其擅長尋找冷門、非直觀信息，通過一次查詢即可幫助用戶卸載并加速復雜、耗時的網(wǎng)絡調(diào)研任務。

在技術(shù)架構(gòu)層面，深度研究由四個協(xié)同工作的核心模塊構(gòu)成：信息發(fā)現(xiàn)模塊、信息綜合模塊、推理模塊和輸出模塊。這些模塊共同形成了一個完整的智能研究系統(tǒng)，能夠像人類研究者一樣進行整體性的思考和決策。信息發(fā)現(xiàn)模塊負責在多個平臺中定位有價值的信息；信息綜合模塊將零散信息梳理成系統(tǒng)化的知識體系；推理模塊對收集到的信息進行深度分析和推導；輸出模塊則將研究成果轉(zhuǎn)化為專業(yè)的呈現(xiàn)形式。

深度研究功能還采用了端到端強化學習的方式，在多個領(lǐng)域中針對復雜的網(wǎng)絡瀏覽和推理任務進行訓練。通過這種方式，它學會了如何規(guī)劃并執(zhí)行多步驟的操作流程，以找到所需的數(shù)據(jù)，并在必要時進行回溯以及對實時信息做出反應。這種創(chuàng)新的學習方式打破了傳統(tǒng)機器學習需要人為劃分訓練階段的限制。

目前，深度研究功能已在ChatGPT網(wǎng)頁版上線，并計劃在一個月內(nèi)擴展到移動和桌面應用程序。OpenAI已推出針對Pro用戶的優(yōu)化版本，每月最多支持100次查詢。接下來，Plus和Team用戶將獲得訪問權(quán)限，隨后是企業(yè)用戶。未來，用戶還將能夠連接到更多專業(yè)化的數(shù)據(jù)源，擴展其對訂閱制或內(nèi)部資源的訪問權(quán)限。

盡管深度研究功能目前仍處于早期階段，存在一些局限性，如可能生成虛假信息、難以區(qū)分權(quán)威信息與謠言等，但OpenAI表示將密切監(jiān)控當前版本的表現(xiàn)，并進行更嚴格的測試。預計在未來幾周和幾個月內(nèi)，隨著技術(shù)基礎(chǔ)設施的完善，深度研究功能的表現(xiàn)將得到進一步提升。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

腦洞科技新動作：增持Affirm股份，減持小鵬汽車股份

三言科技2月3日消息，腦洞科技公告，于2025年1月31日，繼購入Affirm股份后，公司進一步于公開市場以總代價約40萬美元（相當于約300萬港元）（不包括交易成本）購入合共6400股Affirm股份。 …

02-03

春節(jié)返鄉(xiāng)必備！這些硬派SUV讓你面子十足動力滿滿

02-03

特斯拉上半年將推廉價電車model Q，售價或低至15萬！

02-03

極氪1月銷量下滑，是春節(jié)效應還是市場波動？

02-03

特斯拉上半年將推廉價電車model Q，售價或低至15萬！

02-03

問界春晚炫技，賽力斯與中國智造共輝煌

02-03

OPPO Find N5強勢回歸！項目組提前開工，折疊屏新旗艦有何亮點？

02-03

鴻蒙智行1月銷量爆棚，全系新車交付破3萬，領(lǐng)跑中國車市高端市場

02-03

春運返程高峰，江蘇高速“移動力量”助力新能源車無憂前行

02-03

捷達VA7來襲，9萬起享“速騰”待遇？家用新選擇，比軒逸還香！

02-03

新春汽車市場火爆，車企春節(jié)檔“各顯神通”贏消費者心

02-03

12萬元買車，你選500km續(xù)航+側(cè)滑門，還是動力強+熱泵空調(diào)？

02-03

本田剛宣布在華召回，又要在日本召回超155萬臺車，咋回事？

02-03

新春自駕返鄉(xiāng)，新能源汽車充電難題緩解了嗎？

02-03

福特維多利亞皇冠：如何以5.8升V8發(fā)動機成為美國警車經(jīng)典？

02-03

點擊查看更多 +

全站最新

大虹橋沉浸式“秦潮覺醒2”，穿越千年探秘秦朝文化！

春節(jié)返鄉(xiāng)必備！這些硬派SUV讓你面子十足動力滿滿

掌機黃金時代的余暉：NDS、PSP與iPhone的初交鋒

特斯拉上半年將推廉價電車model Q，售價或低至15萬！

極氪1月銷量下滑，是春節(jié)效應還是市場波動？

特斯拉上半年將推廉價電車model Q，售價或低至15萬！

熱門內(nèi)容

本欄最新

腦洞科技新動作：增持Affirm股份，減持小鵬汽車股份

春節(jié)返鄉(xiāng)必備！這些硬派SUV讓你面子十足動力滿滿

特斯拉上半年將推廉價電車model Q，售價或低至15萬！

極氪1月銷量下滑，是春節(jié)效應還是市場波動？

特斯拉上半年將推廉價電車model Q，售價或低至15萬！

問界春晚炫技，賽力斯與中國智造共輝煌

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

OpenAI“深度研究”功能上線，HLE測試準確率超DeepSeek R1，AI研究能力再突破

OpenAI“深度研究”功能上線，HLE測試準確率超DeepSeek R1，AI研究能力再突破