近期,科技界傳來了一則引人注目的消息。據(jù)三言科技報道,斯坦福大學與華盛頓大學的研究團隊攜手,僅憑不到50美元的云計算成本,便成功培育出一款名為s1的人工智能推理模型。
這一創(chuàng)新成果迅速引起了業(yè)界的廣泛關(guān)注。阿里云隨后證實,該團隊實際上是以其開源的阿里通義千問Qwen2.5-32B-Instruct模型為基礎(chǔ),進行了進一步的探索。研究人員在16塊H100GPU的強大算力支持下,僅通過26分鐘的監(jiān)督微調(diào),便成功訓(xùn)練出了全新的s1-32B模型。
據(jù)悉,這款新模型在數(shù)學和編碼能力方面展現(xiàn)出了與業(yè)界頂尖推理模型相匹敵的實力。具體而言,s1-32B在數(shù)學競賽問題上的表現(xiàn)尤為亮眼,其準確率甚至超過了OpenAI的o1-preview模型高達27個百分點。這一成就無疑為人工智能推理領(lǐng)域注入了新的活力。
s1-32B模型的誕生不僅彰顯了研究團隊在算法和算力方面的深厚積累,也進一步驗證了開源模型在推動人工智能技術(shù)創(chuàng)新中的重要作用。通過充分利用開源資源,并結(jié)合高效的訓(xùn)練策略,研究人員得以在極低的成本下實現(xiàn)如此顯著的成果。
隨著人工智能技術(shù)的不斷發(fā)展,越來越多的創(chuàng)新模型將不斷涌現(xiàn)。s1-32B模型的誕生無疑為這一領(lǐng)域樹立了新的標桿,也為未來的研究提供了寶貴的參考和啟示。