近日,國(guó)家超算互聯(lián)網(wǎng)平臺(tái)迎來(lái)重要進(jìn)展,DeepSeek系列的多款A(yù)I模型,包括DeepSeek-R1、V3及Coder等,已相繼在該平臺(tái)上架。用戶現(xiàn)已可通過(guò)平臺(tái)訪問(wèn)DeepSeek-R1模型的多個(gè)版本,涵蓋1.5B、7B、8B及14B參數(shù)規(guī)模,且預(yù)計(jì)不久后還將迎來(lái)32B、70B等大模型的更新。
DeepSeek-R1小版本模型以其便捷性脫穎而出,用戶無(wú)需本地下載即可享受一鍵推理服務(wù)。針對(duì)特定需求,用戶還可引入專有數(shù)據(jù),對(duì)模型進(jìn)行個(gè)性化訓(xùn)練與開發(fā),極大地提升了模型的靈活性和實(shí)用性。與此同時(shí),國(guó)家超算互聯(lián)網(wǎng)平臺(tái)還推出了DeepSeek-V3、DeepSeek-v2.5系列、DeepSeek-coder系列、DeepSeek-math系列(7b)及DeepSeek-v2系列(Lite)等多款模型,進(jìn)一步豐富了平臺(tái)的服務(wù)內(nèi)容。
回顧去年4月,國(guó)家超算互聯(lián)網(wǎng)平臺(tái)正式上線,憑借超過(guò)3200款商品,迅速在科學(xué)計(jì)算、工業(yè)仿真、AI模型訓(xùn)練等多個(gè)領(lǐng)域嶄露頭角。超算互聯(lián)網(wǎng)作為一種創(chuàng)新的運(yùn)營(yíng)模式,通過(guò)互聯(lián)網(wǎng)思維連接超算中心,整合產(chǎn)業(yè)生態(tài)中的算力供給、應(yīng)用開發(fā)、運(yùn)營(yíng)服務(wù)及用戶資源,共同構(gòu)建了一個(gè)一體化的超算算力網(wǎng)絡(luò)和服務(wù)平臺(tái)。
科技部對(duì)于超算互聯(lián)網(wǎng)的發(fā)展寄予厚望,強(qiáng)調(diào)其關(guān)鍵目標(biāo)在于緊密連接算力供需雙方,通過(guò)市場(chǎng)化運(yùn)營(yíng)和服務(wù)體系,實(shí)現(xiàn)算力資源的統(tǒng)籌調(diào)度。此舉旨在降低超算應(yīng)用門檻,推動(dòng)計(jì)算技術(shù)邁向新高度,同時(shí)促進(jìn)自主核心軟硬件技術(shù)的深度應(yīng)用,為自主可控產(chǎn)業(yè)生態(tài)的發(fā)展與成熟注入強(qiáng)勁動(dòng)力。