滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

低成本高效率！斯坦福團隊打造出媲美OpenAI的推理AI模型

時間：2025-02-06 10:32:36 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

近日，人工智能領域迎來了一項引人注目的新突破。一項由斯坦福大學與華盛頓大學聯(lián)手完成的研究顯示，科學家們僅花費不到50美元（當前匯率約364元人民幣）的云計算成本，便成功打造出一個具備卓越“推理”能力的人工智能模型，命名為s1。

s1模型在數(shù)學邏輯與編程能力測試中，展現(xiàn)出了與業(yè)界頂尖推理模型，如OpenAI的o1和DeepSeek的r1不相上下的表現(xiàn)。更令人矚目的是，s1模型及其訓練數(shù)據(jù)和代碼已在GitHub平臺全面開源，供全球開發(fā)者學習與研究。

s1團隊透露，該模型的誕生得益于“蒸餾”技術，這是一種通過訓練模型來模仿另一模型的答案，從而提煉出“推理”能力的創(chuàng)新方法。s1正是從谷歌的Gemini 2.0 Flash Thinking Experimental模型中蒸餾而來。值得注意的是，加州大學伯克利分校的研究團隊也采用了同樣的蒸餾方法，以約450美元的成本開發(fā)出了一款人工智能推理模型。

s1模型的橫空出世，引發(fā)了業(yè)界對于人工智能模型商品化的深刻反思。若能以極低的成本復制出價值數(shù)百萬美元的模型，大型科技公司的競爭優(yōu)勢何在？這一話題引發(fā)了廣泛討論。不出所料，OpenAI等人工智能巨頭對此表示擔憂，此前就曾指責DeepSeek不當獲取其API數(shù)據(jù)用于模型蒸餾。

s1團隊則致力于探索實現(xiàn)高效推理性能和“測試時擴展”的最簡化路徑，這些正是OpenAI的o1模型所展現(xiàn)出的突破性進展。s1的論文指出，通過監(jiān)督微調(diào)（SFT）方法，即便使用較小的數(shù)據(jù)集也能成功蒸餾出推理模型。在SFT過程中，模型被明確指示模仿特定行為，相較于DeepSeek用于訓練R1模型的大規(guī)模強化學習方法，SFT更具成本效益。

谷歌通過其Google AI Studio平臺免費提供Gemini 2.0 Flash Thinking Experimental模型的訪問權限，但每日使用有限制，并明確禁止逆向工程以開發(fā)競爭服務。然而，s1團隊巧妙地利用了這一資源。他們基于阿里巴巴旗下中國人工智能實驗室Qwen提供的一款小型免費模型，創(chuàng)建了僅包含1000個精心挑選的問題及其答案的數(shù)據(jù)集，并引入了谷歌Gemini 2.0 Flash Thinking Experimental為每個答案提供的“思考”過程。

在訓練過程中，s1團隊使用了16個Nvidia H100 GPU，耗時不到30分鐘便完成了訓練，成本僅為約20美元。訓練后的s1在某些人工智能基準測試中取得了優(yōu)異成績。斯坦福大學參與該項目的研究員Niklas Muennighoff向TechCrunch透露了這一信息。

s1團隊還采用了一個獨特的技巧來提升模型的準確性：讓s1在推理過程中“等待”。論文顯示，在推理步驟中加入“等待”一詞，有助于模型獲得更精確的答案。這一創(chuàng)新方法無疑為人工智能領域帶來了新的啟示。

舉報 0 收藏 0 打賞 0評論 0

02-06

軟銀或65億美元收購Ampere，芯片設計領域再掀波瀾？

02-06

《梅根2.0》驚悚回歸！環(huán)球影業(yè)官宣6月27日內(nèi)地上映日期

02-06

低成本高效能！斯坦福團隊打造媲美OpenAI推理模型s1

02-06

AI領域大咖許主洪正式入職阿里，將如何引領AI To C業(yè)務革新？

02-06

高通股價盤后走低，AI增長能否抵消智能手機需求放緩影響？

02-06

DeepSeek突破引爆！AI投資新風潮來襲？

02-06

小屏旗艦新選擇！這三款手機手感絕佳，國補后價格親民

02-06

軟銀或65億美元收購芯片設計公司Ampere，芯片行業(yè)AI投資熱升溫？

02-06

卡斯談DeepSeek：AI模型平價化加速，英偉達股價波動折射市場認知差異

OpenAI原全球市場應用負責人、人工智能與商業(yè)戰(zhàn)略專家卡斯（Zack Kass）表示，DeepSeek是一個巨大的成功，令人興奮。對于英偉達股價巨震及未來表現(xiàn)，在卡斯看來，抄底英偉達與否并非核心問題，關鍵在…

02-06

ChatGPT搜索全面開放！無需賬號，人人可用

02-06

谷歌股價大跌市值蒸發(fā)2000億，人工智能高投入引發(fā)投資者擔憂

02-06

谷歌Gemini 2.0人工智能模型套件全面發(fā)布，功能再升級！

02-06

ChatGPT搜索功能全面開放，無需注冊即可體驗！

三言科技 2月6日消息，OpenAI宣布，ChatGPT搜索功能現(xiàn)在已向所有用戶開放，無需注冊?！?/div>

02-06

中文在線升級AI創(chuàng)作能力，DeepSeek-R1已應用于內(nèi)部網(wǎng)文創(chuàng)作流程

三言科技 2月6日消息，昨日，中文在線發(fā)文稱，基于DeepSeek V3與R1提出的技術路線，中文在線正著力研發(fā)并訓練升級版“中文逍遙”，以進一步提升該大模型的創(chuàng)作能力。目前，公司已在部分內(nèi)部AI網(wǎng)文創(chuàng)作流程…

02-06

點擊查看更多 +

全站最新

小米今年能否創(chuàng)歷史新高？兩款Ultra產(chǎn)品或成關鍵

榮耀新筆記本曝光：輕薄高顏值，性能續(xù)航雙在線！

2025年春節(jié)支付盛宴：銀聯(lián)網(wǎng)聯(lián)交易暴增，移動支付新挑戰(zhàn)浮現(xiàn)

vivo X200 Pro mini或將添新紫，小屏旗艦配色再升級？

2024年大尺寸交互平板顯示面板出貨微降，2025年能否迎來正增長？

海灘洗車陷沙損失大，正確洗車方法你get了嗎？

熱門內(nèi)容

本欄最新

《梅根2.0》驚悚回歸！環(huán)球影業(yè)官宣6月27日內(nèi)地上映日期

低成本高效能！斯坦福團隊打造媲美OpenAI推理模型s1

AI領域大咖許主洪正式入職阿里，將如何引領AI To C業(yè)務革新？

DeepSeek突破引爆！AI投資新風潮來襲？

小屏旗艦新選擇！這三款手機手感絕佳，國補后價格親民

軟銀或65億美元收購芯片設計公司Ampere，芯片行業(yè)AI投資熱升溫？

本網(wǎng)站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.