近日,中科曙光國家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心有限公司傳來喜訊,其海光信息技術(shù)團(tuán)隊(duì)宣布,已成功實(shí)現(xiàn)DeepSeek V3與R1模型與海光DCU(深度計(jì)算單元)的國產(chǎn)化適配,并正式上線供用戶使用。這一消息標(biāo)志著我國在AI模型與硬件適配領(lǐng)域取得了又一重要進(jìn)展。
用戶現(xiàn)在可以通過訪問“光合開發(fā)者社區(qū)”中的“光源”板塊,或登錄光源官網(wǎng)搜索“DeepSeek”,輕松下載并部署相關(guān)模型。這些模型基于DCU平臺(tái),將為用戶提供更高效的AI計(jì)算體驗(yàn)。
據(jù)悉,DeepSeek V3與R1模型均采用了先進(jìn)的Transformer架構(gòu),并融入了Multi-Head Latent Attention(MLA)和DeepSeek MoE兩大核心技術(shù)。MLA技術(shù)通過優(yōu)化KV緩存,顯著降低了內(nèi)存占用,從而提升了模型的推理效率。而DeepSeek MoE技術(shù)則通過引入輔助損失,實(shí)現(xiàn)了專家負(fù)載的智能平衡,進(jìn)一步提升了模型的性能表現(xiàn)。
海光信息推出的DCU,作為一款高性能GPGPU架構(gòu)的AI加速卡,憑借其自主可控的全精度通用AI加速計(jì)算解決方案,已在多個(gè)領(lǐng)域?qū)崿F(xiàn)了規(guī)?;瘧?yīng)用。無論是科教、金融、醫(yī)療、政務(wù)還是智算中心,DCU都展現(xiàn)出了強(qiáng)大的計(jì)算能力和廣泛的應(yīng)用前景。
此次DeepSeek V3與R1模型與DCU的成功適配,不僅為用戶提供了更多樣化的AI計(jì)算選擇,也進(jìn)一步推動(dòng)了我國在AI領(lǐng)域的技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展。隨著AI技術(shù)的不斷演進(jìn)和應(yīng)用場(chǎng)景的不斷拓展,相信未來會(huì)有更多類似的技術(shù)成果涌現(xiàn),為我國的數(shù)字化轉(zhuǎn)型和智能化升級(jí)注入新的動(dòng)力。