在人工智能(AI)浪潮的推動(dòng)下,OpenAI憑借一次技術(shù)革命躍升為全球矚目的科技巨頭,估值飆升超過(guò)1500億美元。然而,在探討誰(shuí)是AI時(shí)代最大贏家時(shí),NVIDIA以其卓越表現(xiàn)成為無(wú)可爭(zhēng)議的答案。
NVIDIA發(fā)布的2024年第三財(cái)季財(cái)報(bào)揭示了其驚人的增長(zhǎng)態(tài)勢(shì):營(yíng)收高達(dá)350.82億美元,同比增長(zhǎng)93.61%;歸母凈利潤(rùn)達(dá)到193.09億美元,同比增長(zhǎng)更是高達(dá)108.90%。其中,數(shù)據(jù)中心業(yè)務(wù)表現(xiàn)尤為亮眼,營(yíng)收為308億美元,同比增長(zhǎng)112%。這一系列數(shù)據(jù)不僅將NVIDIA推上了市值超越微軟的寶座,更使其成為僅次于另一科技巨頭的全球第二大市值公司。
NVIDIA與AI企業(yè)的合作堪稱雙贏典范。AI企業(yè)依賴NVIDIA提供的GPU和專業(yè)AI計(jì)算卡進(jìn)行大模型的訓(xùn)練和推理,這些需求為NVIDIA帶來(lái)了持續(xù)增長(zhǎng)的營(yíng)收和利潤(rùn)。為了鞏固這一合作關(guān)系,NVIDIA也積極投資AI初創(chuàng)企業(yè),以扶持其成長(zhǎng)并培養(yǎng)忠實(shí)客戶群體。據(jù)英國(guó)《金融時(shí)報(bào)》報(bào)道,NVIDIA在2024年參與了超過(guò)50輪融資和多筆交易,向AI初創(chuàng)企業(yè)累計(jì)投資約10億美元,相比前一年增長(zhǎng)了約15%。
NVIDIA的成功并非孤例,國(guó)內(nèi)外眾多互聯(lián)網(wǎng)公司也紛紛加大在AI領(lǐng)域的投入,一方面組建自己的AI團(tuán)隊(duì),另一方面積極投資其他AI公司。這一趨勢(shì)吸引了無(wú)數(shù)企業(yè)涌入AI行業(yè),天眼查數(shù)據(jù)顯示,2024年國(guó)內(nèi)新增AI相關(guān)企業(yè)超過(guò)50萬(wàn)家。然而,隨著AI技術(shù)的日益成熟,人們不禁要問(wèn):進(jìn)軍AI行業(yè)真的還有機(jī)會(huì)嗎?
AI創(chuàng)業(yè)之路并不平坦,尤其是在人才、算力和數(shù)據(jù)三大成本方面。AI大模型的黑盒特性使其可解釋性和可調(diào)試性較弱,對(duì)語(yǔ)義理解、數(shù)學(xué)邏輯和推理能力的要求極高,同時(shí)可能存在的AI“幻覺(jué)”問(wèn)題也困擾著開發(fā)者。為了訓(xùn)練一款成熟可用的大模型,企業(yè)需要招募大量技術(shù)人才,而行業(yè)內(nèi)的激烈競(jìng)爭(zhēng)又導(dǎo)致人才成本不斷飆升。例如,小米CEO雷軍親自招募的AI人才羅福莉,據(jù)傳年薪高達(dá)千萬(wàn)級(jí)別,盡管這一數(shù)字可能有所夸張,但無(wú)疑反映了AI人才市場(chǎng)的火爆程度。
除了人才成本,GPU算力也是AI公司面臨的一大挑戰(zhàn)。以小米為例,該公司正在打造萬(wàn)卡算力集群,而百度智能云執(zhí)行副總裁沈抖曾透露,一個(gè)1.6萬(wàn)張GPU的集群采購(gòu)成本就高達(dá)數(shù)十億元,還不包括搭建、運(yùn)營(yíng)和維護(hù)成本。NVIDIA CEO黃仁勛也曾表示,為了滿足未來(lái)AI大模型的訓(xùn)練和推理需求,可能需要投入數(shù)千億美元來(lái)重塑全球半導(dǎo)體行業(yè)。
數(shù)據(jù)方面,隨著AI大模型參數(shù)量的不斷增加,對(duì)訓(xùn)練數(shù)據(jù)的需求也呈指數(shù)級(jí)增長(zhǎng)。然而,可用于訓(xùn)練大模型的高質(zhì)量數(shù)據(jù)卻越來(lái)越稀缺。OpenAI原計(jì)劃于2024年中后期推出的GPT-5至今未能完成訓(xùn)練,主要原因之一就是數(shù)據(jù)不足。為了解決這個(gè)問(wèn)題,OpenAI不得不招聘大量工程師、數(shù)學(xué)家和物理學(xué)家來(lái)編寫數(shù)據(jù)。
然而,盡管面臨諸多挑戰(zhàn),AI行業(yè)依然吸引著眾多企業(yè)涌入。其中,一些企業(yè)通過(guò)創(chuàng)新技術(shù)降低了訓(xùn)練大模型的成本。例如,DeepSeek-V3模型以低至557.6萬(wàn)美元的訓(xùn)練成本,實(shí)現(xiàn)了與GPT-4等頂級(jí)大模型相當(dāng)?shù)男阅?。這一成功案例向其他AI公司展示了降低訓(xùn)練成本的可能性。
DeepSeek-V3的成功主要得益于其采用的MLA架構(gòu)、MoE架構(gòu)、FP8混合精度訓(xùn)練框架以及模型蒸餾技術(shù)。這些技術(shù)雖然在一定程度上犧牲了精度,但大幅降低了訓(xùn)練成本和時(shí)間。然而,蒸餾技術(shù)也存在一些缺陷,如“學(xué)生模型”的能力無(wú)法超過(guò)“教師”模型等。過(guò)度依賴數(shù)據(jù)蒸餾可能導(dǎo)致生成數(shù)據(jù)的偏差和喪失多樣性等問(wèn)題。
盡管如此,DeepSeek-V3的成功仍然為其他AI公司和考慮入場(chǎng)的企業(yè)指明了一條新的道路。通過(guò)創(chuàng)新技術(shù)和降低精度等方法,企業(yè)可以在不投入數(shù)億美元高昂成本的情況下,訓(xùn)練出表現(xiàn)出色的AI大模型。AI行業(yè)依然是“野心家”的樂(lè)園,只是門檻比過(guò)去更高了一些,入場(chǎng)需要更加謹(jǐn)慎和理性。