AMD近日宣布了一項重大進(jìn)展,他們已將全新的DeepSeek-V3模型成功集成到Instinct MI300X GPU上。此次集成旨在通過與SGLang的協(xié)同工作,實現(xiàn)前所未有的性能優(yōu)化。
據(jù)AMD官方表示,DeepSeek V3已成為目前性能最強(qiáng)的開源大型語言模型(LLM),其能力甚至超越了備受矚目的GPT-4。這一突破性的進(jìn)展無疑為人工智能領(lǐng)域注入了新的活力。
SGLang與DeepSeek團(tuán)隊緊密合作,確保了DeepSeek V3在FP8格式下,從發(fā)布首日便能在英偉達(dá)和AMD的GPU上流暢運(yùn)行。這一兼容性無疑將大大拓寬DeepSeek V3的應(yīng)用場景和受眾范圍。
AMD在公告中還特別感謝了美團(tuán)搜索與推薦算法平臺團(tuán)隊以及DataCrunch的支持,他們?yōu)镈eepSeek V3的研發(fā)提供了寶貴的GPU資源。這些資源的投入對于加速DeepSeek V3的研發(fā)進(jìn)程起到了至關(guān)重要的作用。
自DeepSeek-R1大模型發(fā)布以來,其受歡迎程度迅速攀升。在短短幾天內(nèi),該模型便成功登頂中美兩區(qū)蘋果應(yīng)用市場的免費(fèi)榜榜單。這一成就不僅彰顯了DeepSeek模型的強(qiáng)大實力,也吸引了眾多科技巨頭的關(guān)注。亞馬遜、微軟等公司紛紛宣布將接入DeepSeek模型,以期在人工智能領(lǐng)域取得更大的突破。
有趣的是,曾經(jīng)對DeepSeek持批評態(tài)度的OpenAI也改變了立場。OpenAI的首席執(zhí)行官奧爾特曼在東京的一次活動中表示,OpenAI并沒有起訴DeepSeek的計劃。他強(qiáng)調(diào),公司將專注于打造出色的產(chǎn)品,并以模型能力引領(lǐng)世界。同時,奧爾特曼對DeepSeek給予了高度評價,認(rèn)為它是一個令人印象深刻的模型,并對有新的競爭者表示歡迎。