近日,阿里云在其平臺上推出了一項重大更新,宣布PAI Model Gallery現(xiàn)已支持云上一鍵部署DeepSeek系列模型,具體包括DeepSeek-V3和DeepSeek-R1。這一功能的推出,標(biāo)志著AI模型的開發(fā)流程得到了極大的簡化,用戶無需編寫繁瑣的代碼,即可實現(xiàn)從模型訓(xùn)練到部署再到推理的全鏈條操作。
據(jù)阿里云官方介紹,一鍵部署DeepSeek模型的操作流程異常簡便,用戶僅需簡單幾步即可完成。首先,用戶需登錄PAI控制臺,在工作空間列表中選擇并進(jìn)入指定的工作空間。隨后,在左側(cè)導(dǎo)航欄中找到并點擊“快速開始”,進(jìn)而選擇“Model Gallery”。
進(jìn)入Model Gallery頁面后,用戶可以在模型列表中輕松找到并點擊進(jìn)入所需部署的DeepSeek模型詳情頁。例如,若用戶選擇部署“DeepSeek-R1-Distill-Qwen-7B”模型,只需點擊該模型卡片即可進(jìn)入詳情頁面。
在模型詳情頁,用戶可以看到一鍵部署的選項。點擊“部署”按鈕后,系統(tǒng)將為用戶提供多種部署方式。其中,DeepSeek-R1支持采用vLLM加速部署,而DeepSeek-V3則不僅支持vLLM加速部署,還支持Web應(yīng)用部署。DeepSeek-R1蒸餾小模型還支持采用BladeLLM和vLLM進(jìn)行加速部署。
部署成功后,用戶可以在服務(wù)頁面查看調(diào)用信息,包括Endpoint和Token等關(guān)鍵信息。為了更好地了解服務(wù)調(diào)用方式,用戶可以點擊預(yù)訓(xùn)練模型鏈接,返回模型介紹頁面查看詳細(xì)的調(diào)用方式說明。
值得注意的是,本次教程中部署的模型為經(jīng)過蒸餾處理的DeepSeek-R1-Distill-Qwen-7B,該模型基于DeepSeek-R1的推理能力,通過蒸餾技術(shù)將推理模式遷移到了較小的Qwen模型上。同時,阿里云PAI Model Gallery也提供了DeepSeek-R1和DeepSeek-V3原始模型的一鍵部署服務(wù),以滿足不同用戶的需求。