華為近日正式宣布,其DeepSeek系列中的DeepSeek-R1、DeepSeek-V3、DeepSeek-V2以及Janus-Pro模型已在昇騰社區(qū)上線。這一系列舉措意味著用戶現(xiàn)在可以一鍵獲取DeepSeek系列模型,并且在昇騰硬件平臺(tái)上實(shí)現(xiàn)開箱即用的便捷體驗(yàn)。
據(jù)悉,DeepSeek-V3模型早在2024年便推出了首個(gè)版本,并同步進(jìn)行了開源。作為一款自研的MoE模型,DeepSeek-V3擁有671B的參數(shù),其中37B被激活,并在14.8T的token數(shù)據(jù)上進(jìn)行了預(yù)訓(xùn)練。這樣的配置使其在多個(gè)評(píng)測(cè)中展現(xiàn)出了卓越的性能。
DeepSeek方面透露,DeepSeek-V3在多項(xiàng)評(píng)測(cè)中的表現(xiàn)已經(jīng)超越了Qwen2.5-72B和Llama-3.1-405B等其他知名的開源模型。更令人矚目的是,在性能上,DeepSeek-V3與世界頂尖的閉源模型,如GPT-4o和Claude-3.5-Sonnet,也達(dá)到了相當(dāng)?shù)乃?。這一成就無(wú)疑進(jìn)一步提升了DeepSeek系列模型在行業(yè)內(nèi)的地位和影響力。
為了幫助用戶更好地在昇騰社區(qū)獲取和使用DeepSeek-V3模型,以下將詳細(xì)介紹具體的操作步驟。以DeepSeek-V3為例,用戶首先需要確保滿足硬件要求,即部署該模型需要配置4臺(tái)Atlas 800I A2(8*64G)服務(wù)器資源。
接下來(lái)是模型調(diào)用的實(shí)踐環(huán)節(jié)。用戶需要完成權(quán)重轉(zhuǎn)換,盡管原文中GPU和NPU的具體轉(zhuǎn)換步驟未詳細(xì)列出,但用戶可以在昇騰社區(qū)找到相關(guān)的指導(dǎo)文檔。完成權(quán)重轉(zhuǎn)換后,用戶需要從昇騰社區(qū)的開發(fā)資源中下載適配DeepSeek-V3的鏡像包,具體為mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64。下載完成后,使用docker images命令來(lái)查找并確認(rèn)具體的鏡像名稱與標(biāo)簽。
服務(wù)化測(cè)試是最后一步。用戶需要配置服務(wù)化環(huán)境變量,并啟用內(nèi)存池?cái)U(kuò)展段功能,即虛擬內(nèi)存特性。完成服務(wù)化參數(shù)的修改后,用戶可以拉起服務(wù)化。當(dāng)屏幕上出現(xiàn)“Daemon start success!”的提示時(shí),即表示服務(wù)已經(jīng)成功啟動(dòng)。
通過(guò)以上步驟,用戶就可以在昇騰社區(qū)高效地獲取并使用DeepSeek-V3模型了。這一流程的簡(jiǎn)化和優(yōu)化,無(wú)疑將進(jìn)一步提升DeepSeek系列模型在行業(yè)內(nèi)的普及度和應(yīng)用率。