近日,阿里云發(fā)布了一項重大更新,宣布其PAI Model Gallery平臺現(xiàn)已支持云上一鍵部署DeepSeek-V3與DeepSeek-R1模型。這一舉措標(biāo)志著AI模型開發(fā)流程的重大簡化,用戶無需編寫繁瑣的代碼,即可實現(xiàn)從模型訓(xùn)練、部署到推理的全過程。
據(jù)悉,阿里云PAI Model Gallery的一鍵部署功能操作簡便,僅需三步即可完成。首先,用戶需登錄PAI控制臺,選擇并進(jìn)入指定的工作空間。在左側(cè)導(dǎo)航欄中,快速開始選項下的Model Gallery等待著用戶的探索。
進(jìn)入Model Gallery后,用戶可以在模型列表中輕松找到所需部署的DeepSeek模型。例如,點擊“DeepSeek-R1-Distill-Qwen-7B”模型卡片,即可進(jìn)入該模型的詳細(xì)信息頁面。
在模型詳情頁,用戶只需點擊右上角的部署按鈕,即可開始模型的部署過程。值得注意的是,DeepSeek-R1支持vLLM加速部署,而DeepSeek-V3則不僅支持vLLM加速部署,還提供了Web應(yīng)用部署的選項。DeepSeek-R1蒸餾小模型更可采用BladeLLM和vLLM進(jìn)行加速部署。
部署成功后,用戶可以在服務(wù)頁面查看調(diào)用信息,獲取Endpoint和Token等關(guān)鍵信息。若對服務(wù)調(diào)用方式有疑問,用戶可點擊預(yù)訓(xùn)練模型鏈接,返回模型介紹頁面查看詳細(xì)的調(diào)用方式說明。
本次部署的DeepSeek-R1-Distill-Qwen-7B模型是經(jīng)過蒸餾處理的版本。它基于DeepSeek-R1的推理能力,通過蒸餾技術(shù)將推理模式遷移到了較小的Qwen模型上。同時,阿里云PAI Model Gallery也提供了DeepSeek-R1和DeepSeek-V3原始模型的一鍵部署服務(wù),以滿足不同用戶的需求。