在科技領(lǐng)域的浪潮中,12月中旬成為了各大AI大模型廠商競(jìng)相發(fā)布新成果的高光時(shí)刻。先是智譜,作為大模型領(lǐng)域的六小虎之一,宣布完成了高達(dá)30億元的新一輪融資;緊接著,字節(jié)跳動(dòng)推出了豆包視覺(jué)理解模型,而快手也正式上線了可靈1.6版本。
如果說(shuō)2023年標(biāo)志著大模型技術(shù)的元年,那么2024年則被視為AI應(yīng)用落地的重要一年。從深度推理技術(shù)的崛起,到AI Agent成為新的風(fēng)口,再到多模態(tài)模型的層出不窮,AI產(chǎn)品的迭代速度之快,讓人幾乎忘記了從爆發(fā)至今,國(guó)內(nèi)AI領(lǐng)域的發(fā)展還不足兩年時(shí)間。AI領(lǐng)域的一年進(jìn)步,相當(dāng)于人間的十年變遷。
然而,盡管被視為互聯(lián)網(wǎng)級(jí)別的變革產(chǎn)品,AI至今仍未迎來(lái)真正的爆發(fā)時(shí)刻。上半年,算力還是國(guó)內(nèi)討論大模型發(fā)展的核心要素。在百模大戰(zhàn)如火如荼的那段日子,通過(guò)增加參數(shù)來(lái)迅速搶占市場(chǎng)份額,是許多領(lǐng)先大模型的共同策略。但從今年開(kāi)始,國(guó)內(nèi)外大模型的發(fā)展似乎遇到了瓶頸,特別是下半年,大廠推出新大模型的消息越來(lái)越少。這并不意味著百模大戰(zhàn)即將結(jié)束,而是各大廠商開(kāi)始意識(shí)到,隨著行業(yè)的快速迭代,僅靠提升算力和參數(shù)規(guī)模已難以真正超越競(jìng)爭(zhēng)對(duì)手。
大模型的訓(xùn)練和運(yùn)營(yíng)需要巨額的算力和資金投入,這種投入需要持續(xù)進(jìn)行,對(duì)于目前尚未找到成熟商業(yè)模式的廠商來(lái)說(shuō),無(wú)疑是一大挑戰(zhàn)。以字節(jié)跳動(dòng)為例,據(jù)報(bào)道,僅在2024年,字節(jié)在AI領(lǐng)域的投入就達(dá)到了800億元,幾乎相當(dāng)于BAT三家公司資本開(kāi)支的總和。而其2025年的資本開(kāi)支更是驚人,預(yù)計(jì)將達(dá)到1600億元,其中約900億元將用于AI算力的采購(gòu)。
即便是ChatGPT,也一直在為算力緊缺所困擾。據(jù)報(bào)道,微軟為了給ChatGPT和新版必應(yīng)提供更好的算力,耗資數(shù)億美元,使用了上萬(wàn)張英偉達(dá)A100芯片打造超算平臺(tái)。微軟還在Azure的60多個(gè)數(shù)據(jù)中心部署了幾十萬(wàn)張GPU,用于ChatGPT的推理。
然而,從長(zhǎng)遠(yuǎn)來(lái)看,算力并不能構(gòu)成真正的護(hù)城河,它更多體現(xiàn)的是硬件層面的核心競(jìng)爭(zhēng)力。誰(shuí)的算力更強(qiáng),訓(xùn)練語(yǔ)料更豐富,誰(shuí)的模型表現(xiàn)就更好。但算力依賴于GPU性能和數(shù)據(jù)中心建設(shè),訓(xùn)練語(yǔ)料依賴于公開(kāi)的數(shù)據(jù)集,兩者最終都取決于經(jīng)濟(jì)實(shí)力。谷歌內(nèi)部在討論如何應(yīng)對(duì)ChatGPT時(shí),曾有工程師表示,谷歌和OpenAI都沒(méi)有真正的護(hù)城河。即使谷歌全力投入,也可能贏不了這場(chǎng)AI競(jìng)賽。
目前國(guó)內(nèi)大模型的現(xiàn)狀也印證了這一點(diǎn)。各公司的模型雖然強(qiáng)弱不一,但核心功能普遍同質(zhì)化,替代品眾多。一個(gè)新功能推出后,很快就會(huì)被其他廠商追上。例如,Kimi最初雖然依靠長(zhǎng)文本功能成功進(jìn)入了國(guó)內(nèi)AI大模型的第一梯隊(duì),但如今長(zhǎng)文本已成為大多數(shù)AI搜索產(chǎn)品的基本能力。
隨著AI領(lǐng)域的焦點(diǎn)從“模型層”轉(zhuǎn)向“應(yīng)用層”,各家廠商開(kāi)始探索AI在不同場(chǎng)景下的應(yīng)用。然而,同質(zhì)化問(wèn)題仍然是AI產(chǎn)品頭頂?shù)倪_(dá)摩克里斯之劍。例如,豆包視覺(jué)理解模型發(fā)布時(shí),媒體聲勢(shì)浩大,但就在兩天前,Kimi才剛剛發(fā)布了針對(duì)基礎(chǔ)科學(xué)領(lǐng)域圖片理解和推理能力的Kimi視覺(jué)思考版。
在技術(shù)上難以形成護(hù)城河的情況下,從應(yīng)用場(chǎng)景角度進(jìn)攻能否找到破圈點(diǎn)呢?大模型始終是個(gè)底座,要想真正看到爆發(fā)點(diǎn),必須讓AI與普通人產(chǎn)生強(qiáng)關(guān)聯(lián)。業(yè)內(nèi)人士指出,未來(lái)能否出現(xiàn)殺手級(jí)別的應(yīng)用,將是決定各家勝負(fù)的關(guān)鍵。李彥宏也曾多次強(qiáng)調(diào),“沒(méi)有應(yīng)用,基礎(chǔ)模型一文不值?!?/p>
然而,目前AI應(yīng)用的發(fā)展還遠(yuǎn)未達(dá)到能夠催生出下一個(gè)iPhone時(shí)代的程度。盡管AIGC技術(shù)在某些領(lǐng)域取得了進(jìn)展,如快手與知名影視工作者合作,用可靈生成電影短片,以及在獨(dú)立游戲領(lǐng)域的廣泛應(yīng)用,但整體上AIGC仍處于發(fā)展階段,生成內(nèi)容的質(zhì)量、穩(wěn)定性和可控性等方面仍存在不足。
在硬件端,以手機(jī)大模型為例,也出現(xiàn)了同質(zhì)化的情況。目前AI手機(jī)在AI體驗(yàn)上的主要變化集中在語(yǔ)音交互、圖像處理和通話增強(qiáng)上。幾乎所有頭部手機(jī)廠商都在對(duì)語(yǔ)音交互進(jìn)行升級(jí),號(hào)稱要將之前的語(yǔ)音助手打造成更智能的AI Agent。然而,正如創(chuàng)新工場(chǎng)聯(lián)合CEO汪華所言,現(xiàn)在AI才出來(lái)一年半的時(shí)間,就指望AI的產(chǎn)品形態(tài)被探索出來(lái),顯然是不現(xiàn)實(shí)的。
AI應(yīng)用之所以受到如此重視,一個(gè)重要原因是市場(chǎng)亟需看到AI技術(shù)能轉(zhuǎn)化為可落地的商業(yè)模式。隨著大量資金涌入AI領(lǐng)域,投資者對(duì)AI項(xiàng)目的回報(bào)要求越來(lái)越高。他們希望AI企業(yè)能夠盡快實(shí)現(xiàn)技術(shù)的商業(yè)化應(yīng)用。然而,目前AI產(chǎn)品的盈利模式仍然有限,主要是付費(fèi)訂閱和廣告。對(duì)于對(duì)話類AI產(chǎn)品來(lái)說(shuō),賺錢(qián)確實(shí)有一定壓力。
盡管豆包的用戶規(guī)模在過(guò)去幾個(gè)月有所增長(zhǎng),但和其他AI對(duì)話形態(tài)的產(chǎn)品一樣,其在使用時(shí)長(zhǎng)、打開(kāi)頻次及商業(yè)化潛力上仍不夠理想。字節(jié)管理層判斷AI對(duì)話類產(chǎn)品可能只是AI產(chǎn)品的“中間態(tài)”,長(zhǎng)期更理想的產(chǎn)品形式可能需要更視覺(jué)化的用戶體驗(yàn)、更低的用戶使用門(mén)檻。因此,字節(jié)已經(jīng)提升了即夢(mèng)的產(chǎn)品優(yōu)先級(jí),嘗試用新的路徑打造AI時(shí)代的“抖音”。
盡管如此,只要有活躍的用戶和可持續(xù)的使用價(jià)值,AI對(duì)話類產(chǎn)品的重要性就仍然存在。事實(shí)上,縱觀目前其他對(duì)話類產(chǎn)品,字節(jié)的友商們也并不急于將對(duì)話類AI當(dāng)作商業(yè)化的重要組成部分。百度副總裁在談及生成式AI的商業(yè)場(chǎng)景時(shí)就曾表示,要先滿足用戶需求,才能更好地滿足商業(yè)需求。