在人工智能領(lǐng)域的激烈競(jìng)爭(zhēng)中,英偉達(dá)這位行業(yè)巨頭正面臨著一系列新興挑戰(zhàn)者的沖擊,尤其是在2025年,AI算力市場(chǎng)的風(fēng)向似乎正在悄然轉(zhuǎn)變。
近年來(lái),AI行業(yè)的焦點(diǎn)逐漸從模型訓(xùn)練轉(zhuǎn)向了模型推理。這意味著,對(duì)于能夠高效處理推理任務(wù)的基礎(chǔ)設(shè)施需求正在不斷上升。OpenAI的o1和o3模型,以及Google的Gemini 2.0 Flash Thinking等前沿技術(shù),都在通過(guò)強(qiáng)化推理策略來(lái)提升訓(xùn)練后的結(jié)果質(zhì)量。與此同時(shí),訓(xùn)練好的大模型需要通過(guò)推理才能在實(shí)際場(chǎng)景中發(fā)揮作用,隨著AI技術(shù)在各行各業(yè)的深入應(yīng)用,AI工作負(fù)載的結(jié)構(gòu)也在發(fā)生變化。
以O(shè)penAI的Sora為例,它的創(chuàng)建代表了AI訓(xùn)練階段,而當(dāng)用戶(hù)利用Sora生成一段視頻時(shí),則構(gòu)成了一個(gè)推理工作負(fù)載。簡(jiǎn)而言之,大規(guī)模訓(xùn)練是技術(shù)的“研發(fā)階段”,而推理則是技術(shù)的“商業(yè)化階段”。想要在A(yíng)I領(lǐng)域?qū)崿F(xiàn)盈利,擴(kuò)大推理工作負(fù)載成為了關(guān)鍵。
根據(jù)巴克萊研報(bào)的預(yù)測(cè),AI推理計(jì)算需求將迅速增長(zhǎng),預(yù)計(jì)其將占據(jù)通用人工智能總計(jì)算需求的70%以上,甚至可能超過(guò)訓(xùn)練計(jì)算需求,達(dá)到后者的4.5倍。這一趨勢(shì)為專(zhuān)注于推理的“小”芯片公司提供了巨大的發(fā)展空間。
在新的一年里,Groq、SambaNova、Positron AI等初創(chuàng)公司紛紛向英偉達(dá)發(fā)起了挑戰(zhàn)。這些公司專(zhuān)注于推理芯片的研發(fā),試圖在英偉達(dá)的主場(chǎng)分一杯羹。
Groq由前谷歌TPU團(tuán)隊(duì)的成員創(chuàng)辦,其AI推理引擎LPU被譽(yù)為“世界最快推理”。Groq不僅在推理速度上展示了超群的實(shí)力,還以遠(yuǎn)低于GPU的token成本吸引了業(yè)界的目光。2024年,Groq推出了一款名為“猛獸”(Beast)的高性能計(jì)算芯片,據(jù)稱(chēng)在A(yíng)I推理任務(wù)中的性能超越了英偉達(dá)的主流GPU。然而,盡管Groq宣稱(chēng)其LPU在速度和成本上具有顯著優(yōu)勢(shì),但也有一些專(zhuān)家對(duì)其實(shí)際部署成本提出了質(zhì)疑。
SambaNova則是另一家值得關(guān)注的初創(chuàng)公司,其估值已高達(dá)50億美元。SambaNova的RDU芯片結(jié)合了GPU十倍以上的片上分布SRAM和適用于大規(guī)模計(jì)算任務(wù)的HBM,實(shí)現(xiàn)了極致的算子融合和高HBM利用率。SambaNova不僅銷(xiāo)售芯片,還提供從芯片到服務(wù)器系統(tǒng),甚至包括部署大模型的完整技術(shù)堆棧。其聯(lián)創(chuàng)Rodrigo Liang表示,大模型與生成式AI商業(yè)化的下一個(gè)戰(zhàn)場(chǎng)將是企業(yè)的私有數(shù)據(jù),SambaNova的技術(shù)將幫助企業(yè)高效、可持續(xù)地?cái)U(kuò)展規(guī)模。
相比之下,Positron AI雖然成立時(shí)間較短,但也展現(xiàn)出了不俗的實(shí)力。Positron推出了一款聲稱(chēng)可以執(zhí)行與英偉達(dá)H100相同計(jì)算但成本僅為五分之一的推理芯片,并上榜了《2024全球50家最具潛力初創(chuàng)公司榜》。Positron的CEO Thomas Sohmers表示,AI計(jì)算開(kāi)支的重心已經(jīng)轉(zhuǎn)向推理,并預(yù)計(jì)這一趨勢(shì)將繼續(xù)擴(kuò)大。
面對(duì)這些新興挑戰(zhàn)者的沖擊,英偉達(dá)似乎并未放慢腳步。英偉達(dá)最新推出的B300系列推理大模型芯片,在算力上相比B200提高了50%,顯存也從192GB提升到288GB。B300將有效提升大模型的推理性能,降低推理成本,并提高模型能力。
然而,半導(dǎo)體行業(yè)的“牧本周期”表明,芯片類(lèi)型總是在通用和定制之間不斷交替。當(dāng)前,英偉達(dá)所代表的通用結(jié)構(gòu)時(shí)代正處于被顛覆的邊緣。英偉達(dá)的業(yè)務(wù)范圍早已不僅限于A(yíng)I芯片,它在云計(jì)算、5G電信、游戲、汽車(chē)等領(lǐng)域都有布局。2025年上半年,英偉達(dá)還將發(fā)布其最新一代人形機(jī)器人芯片Jetson Thor。
在這樣的背景下,對(duì)于新興挑戰(zhàn)者而言,與其想著干掉英偉達(dá),不如專(zhuān)注于做英偉達(dá)之外的事,尋找屬于自己的發(fā)展空間。