2025年一月以來,由 DeepSeek 團(tuán)隊開發(fā)的系列模型,如擁有6710億參數(shù)的大型語言模型 DeepSeek-R1 等,一經(jīng)發(fā)布便在全球范圍內(nèi)引發(fā)熱議,其先進(jìn)的架構(gòu)和卓越的性能吸引了眾多開發(fā)者與科技企業(yè)的目光。國內(nèi)外眾多企業(yè)爭先上線DeepSeek系列大模型,而昇騰憑借強(qiáng)大的算力支持與技術(shù)協(xié)同能力,讓 DeepSeek 的上線進(jìn)程按下“快進(jìn)鍵”,以令人驚嘆的中國速度,實現(xiàn)了技術(shù)與應(yīng)用的高效對接。
事實上,早在 DeepSeek 模型發(fā)布之初,昇騰就已深度參與其中。2024年12月26日,DeepSeek AI正式發(fā)布大型語言模型DeepSeek-V3,發(fā)布即支持昇騰,用戶可在昇騰硬件和MindIE推理引擎上實現(xiàn)高效推理。在2025 年春節(jié)期間,合作成果集中爆發(fā),多家企業(yè)相繼官宣基于昇騰成功上線 DeepSeek 相關(guān)服務(wù)。
潞晨科技推出基于昇騰算力的 DeepSeek R1 系列推理API及云鏡像服務(wù);SiliconCloud(硅基流動)上線基于華為云昇騰云服務(wù)的 DeepSeek-V3、DeepSeek-R1;移動云基于昇騰生態(tài)全版本、全尺寸、全功能支持DeepSeek系列產(chǎn)品,全面上線13個中國移動智算中心;電信天翼云“息壤”智算平臺從昇騰硬件、推理引擎到模型服務(wù)支持DeepSeek-R1滿血版至輕量化蒸餾模型靈活部署;聯(lián)通云基于聯(lián)合創(chuàng)新和自研加速引擎,構(gòu)建昇騰智算底座,與DeepSeek-R1模型深度對接。同時,DeepSeek-R1、V3、V2、Janus-Pro等模型正式上線昇騰社區(qū)、電信魔樂社區(qū),支持在昇騰硬件平臺上開箱即用,推理快速部署。
DeepSeek的成功,展示了中國在AI領(lǐng)域的創(chuàng)新實力,加速了大模型更加廣泛的應(yīng)用,為人們的生活帶來更多的便利和樂趣。AI行業(yè)將迎來更為廣闊的發(fā)展空間,中國在大模型高速發(fā)展中發(fā)揮越來越重要的作用,貢獻(xiàn)中國速度,展現(xiàn)中國力量。