ITBear旗下自媒體矩陣:

DeepSeek V3和R1模型與海光DCU完成國產(chǎn)化適配,正式啟用!

   時(shí)間:2025-02-05 02:12:37 來源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無障礙通道

近日,中科曙光國家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心有限公司傳來喜訊,其海光信息技術(shù)團(tuán)隊(duì)宣布,已成功實(shí)現(xiàn)DeepSeek V3與R1模型與海光DCU(深度計(jì)算單元)的國產(chǎn)化適配,并正式上線供用戶使用。這一消息標(biāo)志著我國在AI模型與硬件適配領(lǐng)域取得了又一重要進(jìn)展。

用戶現(xiàn)在可以通過訪問“光合開發(fā)者社區(qū)”中的“光源”板塊,或登錄光源官網(wǎng)搜索“DeepSeek”,輕松下載并部署相關(guān)模型。這些模型基于DCU平臺(tái),將為用戶提供更高效的AI計(jì)算體驗(yàn)。

據(jù)悉,DeepSeek V3與R1模型均采用了先進(jìn)的Transformer架構(gòu),并融入了Multi-Head Latent Attention(MLA)和DeepSeek MoE兩大核心技術(shù)。MLA技術(shù)通過優(yōu)化KV緩存,顯著降低了內(nèi)存占用,從而提升了模型的推理效率。而DeepSeek MoE技術(shù)則通過引入輔助損失,實(shí)現(xiàn)了專家負(fù)載的智能平衡,進(jìn)一步提升了模型的性能表現(xiàn)。

海光信息推出的DCU,作為一款高性能GPGPU架構(gòu)的AI加速卡,憑借其自主可控的全精度通用AI加速計(jì)算解決方案,已在多個(gè)領(lǐng)域?qū)崿F(xiàn)了規(guī)?;瘧?yīng)用。無論是科教、金融、醫(yī)療、政務(wù)還是智算中心,DCU都展現(xiàn)出了強(qiáng)大的計(jì)算能力和廣泛的應(yīng)用前景。

此次DeepSeek V3與R1模型與DCU的成功適配,不僅為用戶提供了更多樣化的AI計(jì)算選擇,也進(jìn)一步推動(dòng)了我國在AI領(lǐng)域的技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展。隨著AI技術(shù)的不斷演進(jìn)和應(yīng)用場(chǎng)景的不斷拓展,相信未來會(huì)有更多類似的技術(shù)成果涌現(xiàn),為我國的數(shù)字化轉(zhuǎn)型和智能化升級(jí)注入新的動(dòng)力。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version