滾動資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

加州大學(xué)團隊開源Sky-T1推理模型，訓(xùn)練成本僅450美元引關(guān)注

時間：2025-01-12 17:55:04 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

近期，加州大學(xué)伯克利分校 Sky Computing 實驗室的研究團隊 NovaSky 推出了一個名為 Sky-T1-32B-Preview 的推理模型，這一創(chuàng)新成果在AI界引起了廣泛關(guān)注。據(jù)悉，該模型在多項關(guān)鍵基準(zhǔn)測試中的表現(xiàn)與 OpenAI 早期版本的 o1 模型不相上下，但其開源的特性使其更具吸引力。

引人注目的是，Sky-T1-32B-Preview 是首個真正意義上的開源推理模型，其訓(xùn)練數(shù)據(jù)集和代碼均向公眾開放。這意味著，任何有興趣的用戶都可以從零開始復(fù)現(xiàn)這一模型，無需依賴特定的商業(yè)平臺或昂貴的硬件資源。這一舉措無疑為AI領(lǐng)域的研究和發(fā)展注入了新的活力。

NovaSky 團隊在官方博客中透露，Sky-T1-32B-Preview 的訓(xùn)練成本僅為約450美元（當(dāng)前約合3306元人民幣），遠(yuǎn)低于同類模型的數(shù)百萬美元訓(xùn)練成本。這一突破性的降低得益于合成訓(xùn)練數(shù)據(jù)的廣泛應(yīng)用。合成數(shù)據(jù)是由其他模型生成的數(shù)據(jù)，它不僅能夠顯著降低訓(xùn)練成本，還能提高模型的訓(xùn)練效率和性能。例如，AI 公司 Writer 最近發(fā)布的 Palmyra X 004 模型就幾乎完全依賴合成數(shù)據(jù)進行訓(xùn)練，其開發(fā)成本僅為70萬美元。

與傳統(tǒng)的AI模型相比，推理模型具備自我事實核查能力，這一特性使其能夠更有效地避免一些常見的錯誤。雖然推理模型在解決問題時可能需要花費更多的時間，通常在幾秒到幾分鐘之間，但在物理、科學(xué)和數(shù)學(xué)等領(lǐng)域，其更高的可靠性使其更具應(yīng)用價值。

據(jù) NovaSky 團隊介紹，Sky-T1 的訓(xùn)練數(shù)據(jù)由阿里巴巴的 QwQ-32B-Preview 推理模型生成，并經(jīng)過了精心的篩選和重構(gòu)。他們利用 OpenAI 的 GPT-4o-mini 對數(shù)據(jù)進行處理，使其更易于模型訓(xùn)練。在僅使用8臺 Nvidia H100 GPU的情況下，訓(xùn)練這款擁有320億參數(shù)的模型僅耗時約19小時。參數(shù)數(shù)量是衡量模型解決問題能力的一個重要指標(biāo)，因此 Sky-T1 的高性能表現(xiàn)并不令人意外。

在性能方面，Sky-T1 在 MATH500（一組“競賽級”數(shù)學(xué)挑戰(zhàn)）上的表現(xiàn)優(yōu)于 o1 的早期預(yù)覽版本，同時在 LiveCodeBench 的編程評估中也展現(xiàn)出了更佳的性能。然而，在 GPQA-Diamond 測試中（包含物理學(xué)、生物學(xué)和化學(xué)領(lǐng)域的研究生水平問題），Sky-T1 的表現(xiàn)略遜于 o1 預(yù)覽版。盡管如此，NovaSky 團隊表示，他們將繼續(xù)優(yōu)化 Sky-T1 的性能，并計劃推出更多版本的開源推理模型。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

小米REDMI NOTE 14系列5G新機香港上市，最高配不到3000港幣！

01-12

河北邯鄲：無人機運輸航線試航成功，開啟低空物流新時代

01-12

河北邯鄲無人機運輸新突破：10公里航線10分鐘送達(dá)

01-12

中通快遞2024年業(yè)務(wù)量突破340億件，連續(xù)九年領(lǐng)跑行業(yè)

01-12

極越全員簽署離職賠償協(xié)議，1月20日前發(fā)薪，但部分員工資產(chǎn)未歸還影響補償？

三言科技 1月12日消息，據(jù)極越員工透露，極越已和所有員工簽署離職賠償協(xié)議，預(yù)計將于1月20日前發(fā)放薪資及離職補償金。據(jù)該極越員工公布的內(nèi)部信顯示，目前離職人員的離職手續(xù)已經(jīng)結(jié)束，但經(jīng)實際盤點，目前已歸還資…

01-12

冬季行車需謹(jǐn)慎，這些安全小貼士助你平安回家！

01-12

商務(wù)部2025工作藍(lán)圖：提振消費、穩(wěn)外貿(mào)、促外資，全方位推進開放合作

01-12

CES 2025禾賽JT16助力，MOVA 1000智能割草機器人驚艷亮相

01-12

機械狗遛彎遇柴犬，上演“跨物種”拜年，網(wǎng)友：科幻照進現(xiàn)實？

01-12

藍(lán)色起源New Glenn火箭首飛再推遲，因海況不佳延期至1月13日后

01-12

哈工大牽手賽力斯，共筑科研創(chuàng)新與合作新篇章！

01-12

安耐美CES 2025發(fā)布REVOLUTION III與CyberG II金牌電源，支持ATX 3.1標(biāo)準(zhǔn)

01-12

胖東來重拳出擊！公示30個侵權(quán)賬號，最高索賠金額達(dá)200萬

01-12

iFlight翼飛山海系列穿越機亮相，售價3699元起，性能亮點搶先看！

01-12

硅料企業(yè)聚首定減產(chǎn)，目標(biāo)價格未達(dá)誓不休，光伏洗牌能否迎來春天？

據(jù)說，有的企業(yè)是因為其N型料真的達(dá)不到行業(yè)平均水準(zhǔn)，也有的硅料新玩家，號稱規(guī)模很大，雖然在2024年也投產(chǎn)了，但到現(xiàn)在還沒拿到生產(chǎn)許可證。特別是對于一家硅料企業(yè)而言，如果參與自律的硅片企業(yè)都不是自己的客戶，現(xiàn)…

01-12

點擊查看更多 +

全站最新

小米澎湃OS優(yōu)化進展：超級小愛等問題已解決，更多功能正在完善中

華為Mate X6影像卓越，微博之夜成追星族新寵

Surreal Interactive發(fā)布新款手柄，助力蘋果Vision Pro暢玩VR游戲

捷達(dá)VA7上市，8.9777萬起售，能否撼動軒逸卡羅拉地位？

深藍(lán)S05升級DEEPAL OS 3.0.3，智慧座艙再進化，女王副駕體驗升級！

手機Steam激活游戲Key教程：輕松上手，注意事項全解析！

熱門內(nèi)容

本欄最新

小米REDMI NOTE 14系列5G新機香港上市，最高配不到3000港幣！

河北邯鄲：無人機運輸航線試航成功，開啟低空物流新時代

中通快遞2024年業(yè)務(wù)量突破340億件，連續(xù)九年領(lǐng)跑行業(yè)

極越全員簽署離職賠償協(xié)議，1月20日前發(fā)薪，但部分員工資產(chǎn)未歸還影響補償？

冬季行車需謹(jǐn)慎，這些安全小貼士助你平安回家！

CES 2025禾賽JT16助力，MOVA 1000智能割草機器人驚艷亮相

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

加州大學(xué)團隊開源Sky-T1推理模型，訓(xùn)練成本僅450美元引關(guān)注

加州大學(xué)團隊開源Sky-T1推理模型，訓(xùn)練成本僅450美元引關(guān)注