在科技領域的浪潮中,12月中旬成為了各大AI大模型廠商競相發(fā)布新成果的高光時刻。先是智譜,作為大模型領域的六小虎之一,宣布完成了高達30億元的新一輪融資;緊接著,字節(jié)跳動推出了豆包視覺理解模型,而快手也正式上線了可靈1.6版本。
如果說2023年標志著大模型技術的元年,那么2024年則被視為AI應用落地的重要一年。從深度推理技術的崛起,到AI Agent成為新的風口,再到多模態(tài)模型的層出不窮,AI產(chǎn)品的迭代速度之快,讓人幾乎忘記了從爆發(fā)至今,國內AI領域的發(fā)展還不足兩年時間。AI領域的一年進步,相當于人間的十年變遷。
然而,盡管被視為互聯(lián)網(wǎng)級別的變革產(chǎn)品,AI至今仍未迎來真正的爆發(fā)時刻。上半年,算力還是國內討論大模型發(fā)展的核心要素。在百模大戰(zhàn)如火如荼的那段日子,通過增加參數(shù)來迅速搶占市場份額,是許多領先大模型的共同策略。但從今年開始,國內外大模型的發(fā)展似乎遇到了瓶頸,特別是下半年,大廠推出新大模型的消息越來越少。這并不意味著百模大戰(zhàn)即將結束,而是各大廠商開始意識到,隨著行業(yè)的快速迭代,僅靠提升算力和參數(shù)規(guī)模已難以真正超越競爭對手。
大模型的訓練和運營需要巨額的算力和資金投入,這種投入需要持續(xù)進行,對于目前尚未找到成熟商業(yè)模式的廠商來說,無疑是一大挑戰(zhàn)。以字節(jié)跳動為例,據(jù)報道,僅在2024年,字節(jié)在AI領域的投入就達到了800億元,幾乎相當于BAT三家公司資本開支的總和。而其2025年的資本開支更是驚人,預計將達到1600億元,其中約900億元將用于AI算力的采購。
即便是ChatGPT,也一直在為算力緊缺所困擾。據(jù)報道,微軟為了給ChatGPT和新版必應提供更好的算力,耗資數(shù)億美元,使用了上萬張英偉達A100芯片打造超算平臺。微軟還在Azure的60多個數(shù)據(jù)中心部署了幾十萬張GPU,用于ChatGPT的推理。
然而,從長遠來看,算力并不能構成真正的護城河,它更多體現(xiàn)的是硬件層面的核心競爭力。誰的算力更強,訓練語料更豐富,誰的模型表現(xiàn)就更好。但算力依賴于GPU性能和數(shù)據(jù)中心建設,訓練語料依賴于公開的數(shù)據(jù)集,兩者最終都取決于經(jīng)濟實力。谷歌內部在討論如何應對ChatGPT時,曾有工程師表示,谷歌和OpenAI都沒有真正的護城河。即使谷歌全力投入,也可能贏不了這場AI競賽。
目前國內大模型的現(xiàn)狀也印證了這一點。各公司的模型雖然強弱不一,但核心功能普遍同質化,替代品眾多。一個新功能推出后,很快就會被其他廠商追上。例如,Kimi最初雖然依靠長文本功能成功進入了國內AI大模型的第一梯隊,但如今長文本已成為大多數(shù)AI搜索產(chǎn)品的基本能力。
隨著AI領域的焦點從“模型層”轉向“應用層”,各家廠商開始探索AI在不同場景下的應用。然而,同質化問題仍然是AI產(chǎn)品頭頂?shù)倪_摩克里斯之劍。例如,豆包視覺理解模型發(fā)布時,媒體聲勢浩大,但就在兩天前,Kimi才剛剛發(fā)布了針對基礎科學領域圖片理解和推理能力的Kimi視覺思考版。
在技術上難以形成護城河的情況下,從應用場景角度進攻能否找到破圈點呢?大模型始終是個底座,要想真正看到爆發(fā)點,必須讓AI與普通人產(chǎn)生強關聯(lián)。業(yè)內人士指出,未來能否出現(xiàn)殺手級別的應用,將是決定各家勝負的關鍵。李彥宏也曾多次強調,“沒有應用,基礎模型一文不值?!?/p>
然而,目前AI應用的發(fā)展還遠未達到能夠催生出下一個iPhone時代的程度。盡管AIGC技術在某些領域取得了進展,如快手與知名影視工作者合作,用可靈生成電影短片,以及在獨立游戲領域的廣泛應用,但整體上AIGC仍處于發(fā)展階段,生成內容的質量、穩(wěn)定性和可控性等方面仍存在不足。
在硬件端,以手機大模型為例,也出現(xiàn)了同質化的情況。目前AI手機在AI體驗上的主要變化集中在語音交互、圖像處理和通話增強上。幾乎所有頭部手機廠商都在對語音交互進行升級,號稱要將之前的語音助手打造成更智能的AI Agent。然而,正如創(chuàng)新工場聯(lián)合CEO汪華所言,現(xiàn)在AI才出來一年半的時間,就指望AI的產(chǎn)品形態(tài)被探索出來,顯然是不現(xiàn)實的。
AI應用之所以受到如此重視,一個重要原因是市場亟需看到AI技術能轉化為可落地的商業(yè)模式。隨著大量資金涌入AI領域,投資者對AI項目的回報要求越來越高。他們希望AI企業(yè)能夠盡快實現(xiàn)技術的商業(yè)化應用。然而,目前AI產(chǎn)品的盈利模式仍然有限,主要是付費訂閱和廣告。對于對話類AI產(chǎn)品來說,賺錢確實有一定壓力。
盡管豆包的用戶規(guī)模在過去幾個月有所增長,但和其他AI對話形態(tài)的產(chǎn)品一樣,其在使用時長、打開頻次及商業(yè)化潛力上仍不夠理想。字節(jié)管理層判斷AI對話類產(chǎn)品可能只是AI產(chǎn)品的“中間態(tài)”,長期更理想的產(chǎn)品形式可能需要更視覺化的用戶體驗、更低的用戶使用門檻。因此,字節(jié)已經(jīng)提升了即夢的產(chǎn)品優(yōu)先級,嘗試用新的路徑打造AI時代的“抖音”。
盡管如此,只要有活躍的用戶和可持續(xù)的使用價值,AI對話類產(chǎn)品的重要性就仍然存在。事實上,縱觀目前其他對話類產(chǎn)品,字節(jié)的友商們也并不急于將對話類AI當作商業(yè)化的重要組成部分。百度副總裁在談及生成式AI的商業(yè)場景時就曾表示,要先滿足用戶需求,才能更好地滿足商業(yè)需求。