近期,DeepSeek的硬件配置詳情雖未全面公開,但業(yè)界普遍推測其大量采用了NVIDIA的AI芯片系列,涵蓋H100、H800及H20等多個型號。然而,最新消息透露,DeepSeek亦已驗證并采納了華為最新的AI芯片——昇騰910C。
昇騰910C這款芯片于2024年末曝光,據(jù)傳已向阿里巴巴、百度、騰訊等科技巨頭批量供貨,首批供應(yīng)量高達(dá)7萬顆,單價約為2萬元。該芯片采用中芯國際的7nm工藝制造,通過chiplets雙芯片整合封裝技術(shù),內(nèi)含530億個晶體管,整體國產(chǎn)化率已接近55%。
昇騰910C在性能上足以媲美NVIDIA的H100芯片,適用于大規(guī)模的AI訓(xùn)練和推理任務(wù),在FP8、FP16、FP32、FP64等多種數(shù)據(jù)類型下均展現(xiàn)出卓越表現(xiàn)。據(jù)DeepSeek團(tuán)隊的實測數(shù)據(jù)顯示,昇騰910C在AI推理方面的性能尤為出色,已達(dá)到NVIDIA H100芯片的約60%。
更令人振奮的是,通過手寫CUNN內(nèi)核和優(yōu)化,昇騰910C的性能仍有進(jìn)一步提升的空間。據(jù)悉,DeepSeek自成立之初便支持華為的昇騰芯片,并自主維護(hù)PyTorch倉庫。用戶僅需一行代碼,即可將CUDA轉(zhuǎn)換為CUNN,從而釋放出巨大的性能優(yōu)化潛力。
盡管昇騰910C在AI推理性能上表現(xiàn)出色,但目前已知其在AI訓(xùn)練性能方面可能仍存在一定的局限性。不過,這并不影響其在AI領(lǐng)域內(nèi)的廣泛應(yīng)用和前景。