ITBear旗下自媒體矩陣:

DeepSeek技術(shù)突破:英偉達(dá)兩大壁壘面臨挑戰(zhàn)與機(jī)遇?

   時(shí)間:2025-02-08 14:31:25 來(lái)源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

近日,DeepSeek公司推出的V3模型在AI領(lǐng)域引發(fā)了廣泛關(guān)注。這款模型以驚人的訓(xùn)練成本效益——僅557.6萬(wàn),實(shí)現(xiàn)了與OpenAI O1推理模型相當(dāng)?shù)男阅?。這一突破不僅在全球范圍內(nèi)引發(fā)了連鎖反應(yīng),還直接沖擊了英偉達(dá)的市場(chǎng)地位,導(dǎo)致其股價(jià)在1月27日暴跌17%,市值瞬間蒸發(fā)6000億美元。

盡管部分投資人擔(dān)憂(yōu)DeepSeek的崛起會(huì)減少市場(chǎng)對(duì)先進(jìn)芯片的需求,但科技界普遍持另一種觀點(diǎn):高性能、低成本且開(kāi)源的大模型將促進(jìn)整個(gè)應(yīng)用生態(tài)的繁榮,從而長(zhǎng)期利好英偉達(dá)。這兩種截然不同的觀點(diǎn),在科技界引發(fā)了激烈的討論。

從技術(shù)層面來(lái)看,DeepSeek對(duì)英偉達(dá)、芯片行業(yè)乃至整個(gè)科技領(lǐng)域的影響遠(yuǎn)非簡(jiǎn)單。Inference.ai的創(chuàng)始人兼CEO John Yue指出,DeepSeek沖擊了英偉達(dá)的兩大核心壁壘——NVLink與CUDA,盡管并未完全沖垮這些壁壘,但確實(shí)打掉了英偉達(dá)的溢價(jià)。

在詳細(xì)解讀DeepSeek的技術(shù)創(chuàng)新時(shí),加州大學(xué)戴維斯分校電子計(jì)算機(jī)工程系的助理教授、AIZip的聯(lián)合創(chuàng)始人陳羽北表示,DeepSeek的成功關(guān)鍵在于其基礎(chǔ)模型V3的能力。通過(guò)采用GRPO(分組相對(duì)策略?xún)?yōu)化)方法,DeepSeek在R1 Zero未經(jīng)強(qiáng)化學(xué)習(xí)的情況下,每生成100條內(nèi)容就有約10%的成功率,這一顯著提升證明了基礎(chǔ)模型能力的重要性。

陳羽北進(jìn)一步解釋說(shuō),DeepSeek在模型架構(gòu)效率上進(jìn)行了重大提升,包括優(yōu)化混合專(zhuān)家網(wǎng)絡(luò)(MoE)的負(fù)載均衡和節(jié)省鍵值緩存(KV Cache)。這些創(chuàng)新使得DeepSeek在600多B的大模型上表現(xiàn)出色,并通過(guò)自啟發(fā)式回答和蒸餾學(xué)習(xí)的方法,成功將大模型的能力傳授給小模型,實(shí)現(xiàn)了性能的進(jìn)一步提升。

關(guān)于DeepSeek對(duì)英偉達(dá)的影響,John Yue認(rèn)為這是一把雙刃劍。一方面,DeepSeek的出現(xiàn)激發(fā)了更多初創(chuàng)企業(yè)探索AI應(yīng)用層面的可能性,從而增加了對(duì)GPU的需求,這對(duì)英偉達(dá)是有利的。另一方面,DeepSeek通過(guò)優(yōu)化MOE和直接調(diào)用PTX(并行線程執(zhí)行)來(lái)繞過(guò)CUDA高層API,確實(shí)沖擊了英偉達(dá)的溢價(jià)。

然而,John Yue強(qiáng)調(diào),英偉達(dá)的核心壁壘——NVLink和CUDA——仍然堅(jiān)挺。雖然DeepSeek提供了一種可能的替代方案,但尚未出現(xiàn)能夠完全替代CUDA的通用系統(tǒng)。因此,長(zhǎng)期來(lái)看,英偉達(dá)在GPU市場(chǎng)的領(lǐng)先地位仍難以撼動(dòng)。

DeepSeek技術(shù)示意圖

DeepSeek選擇開(kāi)源其模型,這一舉措對(duì)整個(gè)AI行業(yè)產(chǎn)生了深遠(yuǎn)影響。John Yue指出,開(kāi)源降低了AI應(yīng)用的準(zhǔn)入門(mén)檻,激發(fā)了更多開(kāi)發(fā)者探索AI應(yīng)用的熱情。陳羽北也表示,開(kāi)源生態(tài)對(duì)于提高AI應(yīng)用的效率至關(guān)重要,它使得開(kāi)發(fā)者能夠基于開(kāi)源模型快速構(gòu)建自己的應(yīng)用。

在談到DeepSeek如何降低API成本時(shí),John Yue表示,DeepSeek從上到下進(jìn)行了整套優(yōu)化,包括PTX調(diào)用、GPU切分等。這些優(yōu)化措施使得DeepSeek能夠在更低端的芯片上運(yùn)行,從而大幅降低了每個(gè)Token的成本。DeepSeek還通過(guò)蒸餾學(xué)習(xí)等方法,成功將大模型的能力傳授給小模型,進(jìn)一步降低了推理成本。

陳羽北還提到了小模型在未來(lái)的發(fā)展?jié)摿?。他表示,隨著小模型在性能上的不斷提升,它們將在更多場(chǎng)景中取代大模型,從而降低AI應(yīng)用的成本并提高普及程度。未來(lái),AI基礎(chǔ)設(shè)施將形成端-邊-云的分層體系,小模型將在終端設(shè)備和邊緣端發(fā)揮重要作用。

最后,陳羽北對(duì)DeepSeek的數(shù)據(jù)構(gòu)成和訓(xùn)練細(xì)節(jié)表示了好奇。他指出,雖然DeepSeek已經(jīng)公開(kāi)了部分信息,但關(guān)于數(shù)據(jù)的具體構(gòu)成和處理流程等關(guān)鍵細(xì)節(jié)仍然未披露。這些細(xì)節(jié)對(duì)于其他研究者復(fù)現(xiàn)DeepSeek的工作至關(guān)重要。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類(lèi)資訊
全站最新
熱門(mén)內(nèi)容