近期,科技界傳來一則引人注目的消息,斯坦福大學(xué)與華盛頓大學(xué)的科研團(tuán)隊(duì)攜手,利用不足50美元的云計(jì)算成本,成功培育出一款名為s1的人工智能推理模型。這款模型在數(shù)學(xué)解題與編程能力上的表現(xiàn),據(jù)相關(guān)報(bào)道,已與業(yè)界領(lǐng)先的OpenAI O1及DeepSeek R1等模型比肩。
然而,深入探究后發(fā)現(xiàn),s1模型的誕生并非完全從零起點(diǎn)出發(fā)?!犊苿?chuàng)板日記》披露,該模型的訓(xùn)練實(shí)際上是基于阿里云推出的通義千問(Qwen)模型進(jìn)行了監(jiān)督微調(diào)。換言之,s1模型的“低成本高效能”特性,得益于站在了一個(gè)已經(jīng)具備強(qiáng)大基礎(chǔ)的開源模型肩膀上。
這一發(fā)現(xiàn)揭示了人工智能領(lǐng)域的一個(gè)新趨勢:即便是在資源有限的情況下,通過合理利用現(xiàn)有的開源模型并進(jìn)行針對性的優(yōu)化,同樣能夠創(chuàng)造出具有競爭力的AI產(chǎn)品。s1模型的成功,無疑為眾多科研團(tuán)隊(duì)和企業(yè)提供了一個(gè)值得借鑒的范例。