在人工智能領(lǐng)域,一場(chǎng)關(guān)于通用人工智能(AGI)的競(jìng)爭(zhēng)正悄然改變著中國(guó)大模型行業(yè)的格局。隨著多家初創(chuàng)公司在下一代超大規(guī)模模型競(jìng)爭(zhēng)中顯露疲態(tài),大廠們則憑借雄厚的資本和技術(shù)實(shí)力,逐漸占據(jù)了主導(dǎo)地位。
2024年,中國(guó)大模型行業(yè)迎來(lái)了分水嶺。大廠與初創(chuàng)公司在技術(shù)、產(chǎn)品、商業(yè)化及生態(tài)建設(shè)等方面的戰(zhàn)略選擇開(kāi)始明顯分化,不再沿著同一條路線發(fā)展。初創(chuàng)公司中,估值超過(guò)200億人民幣的五大模型公司中,百川智能已轉(zhuǎn)向醫(yī)療等垂直行業(yè)模型,月之暗面與MiniMax則更注重C端產(chǎn)品與應(yīng)用,僅有智譜與階躍星辰仍堅(jiān)持向AGI大模型發(fā)力。而估值較低的二線模型公司也早已轉(zhuǎn)向,深耕細(xì)分領(lǐng)域。
與此同時(shí),國(guó)內(nèi)外多家大模型的強(qiáng)勢(shì)發(fā)布,如Claude 3.5 Sonnet等,不僅在性能上大幅提升,甚至在某些指標(biāo)測(cè)試中超越了GPT-4,使得大模型成為像“電力”一樣的基礎(chǔ)資源。一家專(zhuān)注于AI代碼生成的創(chuàng)業(yè)公司表示,過(guò)去他們需要緊密?chē)@單一大模型開(kāi)發(fā),但如今已能在應(yīng)用開(kāi)發(fā)中搭建容錯(cuò)系統(tǒng),同時(shí)接入多個(gè)底層模型,根據(jù)產(chǎn)品需求調(diào)用不同模型的優(yōu)勢(shì)。
在此背景下,大模型市場(chǎng)的商機(jī)逐漸清晰,分為三層:底層基座模型提供商(類(lèi)比發(fā)電廠)、中間云廠商(類(lèi)比國(guó)家電網(wǎng))、上層AI軟硬產(chǎn)品應(yīng)用(類(lèi)比電子產(chǎn)品)。在這三個(gè)層級(jí)中,無(wú)論是模型還是應(yīng)用的創(chuàng)業(yè)公司,由于資金、人才與資源的限制,大多只能選擇兩個(gè)戰(zhàn)場(chǎng),甚至只能專(zhuān)注于一個(gè)賽道。而基座模型訓(xùn)練的難度和資源要求極高,使得更多創(chuàng)業(yè)公司的機(jī)會(huì)可能僅限于應(yīng)用層,如AIGC軟件應(yīng)用和AI智能硬件。
OpenAI在2024年繼續(xù)發(fā)布新模型,但GPT-5的遲遲未公布,加上過(guò)去一年人才流失和模型訓(xùn)練技巧的傳播,使得下一代基座大模型的發(fā)展充滿(mǎn)變數(shù)。推出下一代基座大模型的公司可能不再是OpenAI,也不再只有OpenAI。行業(yè)共識(shí)是,具備頂尖人才團(tuán)隊(duì)、充足資金和大量訓(xùn)練數(shù)據(jù)的公司,才有可能在這場(chǎng)競(jìng)爭(zhēng)中脫穎而出。
國(guó)內(nèi)大廠中,百度、阿里和字節(jié)在基座模型上具有較大機(jī)會(huì)。盡管有報(bào)道稱(chēng)DeepSeek V3的訓(xùn)練成本不到600萬(wàn)美元,但行業(yè)公認(rèn)下一代基座大模型的訓(xùn)練成本仍是天文數(shù)字。大模型的成本走向兩個(gè)極端:一方面,基于已有大模型進(jìn)行二次訓(xùn)練或優(yōu)化的成本在下降;另一方面,推出下一代參數(shù)規(guī)模更大、智識(shí)水平更高的基座模型成本則在上升。
2023年,國(guó)內(nèi)大廠在模型、云與應(yīng)用方面的布局尚不明顯。到了2024年,阿里將AI應(yīng)用通義從阿里云分拆,開(kāi)始在C端發(fā)力;字節(jié)則在豆包推廣上投入大量預(yù)算,并招入大批人才;百度則在行業(yè)大模型與C端應(yīng)用上共同發(fā)力,實(shí)現(xiàn)了多個(gè)場(chǎng)景的商業(yè)化驗(yàn)證。至此,百度、字節(jié)、阿里形成了大廠集體陣容,與創(chuàng)業(yè)公司形成了明顯的優(yōu)勢(shì)差。
大廠們?cè)诨P汀⒃品?wù)與應(yīng)用端均有布局,這是他們押注大模型浪潮、應(yīng)對(duì)不確定性的安全牌。百度、阿里、字節(jié)在基座模型層展現(xiàn)出不同的優(yōu)勢(shì):百度投入堅(jiān)決,團(tuán)隊(duì)穩(wěn)定;阿里、字節(jié)則在文本、圖文或視頻上存在資源競(jìng)爭(zhēng)與團(tuán)隊(duì)競(jìng)爭(zhēng),賽馬制明顯。在云服務(wù)層,火山引擎綁定豆包與即夢(mèng),同時(shí)獲取其他公司的基座模型授權(quán);百度重點(diǎn)打頭部國(guó)央企等客戶(hù);阿里云則一貫兇猛投資。
在應(yīng)用層,百度與阿里同時(shí)發(fā)力B、C端。百度與行業(yè)頭部客戶(hù)共創(chuàng)行業(yè)大模型,C端則有AI搜索、文庫(kù)、網(wǎng)盤(pán)等業(yè)務(wù);阿里則以夸克搜索、通義App為主要抓手。百度、阿里、字節(jié)也都使用自家基座大模型升級(jí)內(nèi)部產(chǎn)品。在AGI真正到來(lái)之前,最終贏家還未確定。大廠全面布局的優(yōu)勢(shì)是能保底增收、以守為攻,難點(diǎn)在于資源分配、組織協(xié)調(diào)與執(zhí)行效率。
百度在競(jìng)爭(zhēng)下一代基座模型上勝率較高,關(guān)鍵在于其要保持甚至超越原有優(yōu)勢(shì)。算法積累時(shí)間長(zhǎng)、技術(shù)系統(tǒng)完善、團(tuán)隊(duì)人才資深穩(wěn)定、資金雄厚,都決定了百度可能是接下來(lái)極少數(shù)幾家能夠推出下一代基座大模型的中國(guó)公司之一。近期發(fā)布的《2024深度學(xué)習(xí)專(zhuān)利全景報(bào)告》顯示,從2011年到2023年,百度在深度學(xué)習(xí)和大模型領(lǐng)域申請(qǐng)專(zhuān)利數(shù)位居全球第一。
百度從2010年前后開(kāi)始全力轉(zhuǎn)向人工智能,多年來(lái)一直將超過(guò)收入所得的20%用于人工智能等技術(shù)的研發(fā)。在戰(zhàn)略驅(qū)動(dòng)的勝利下,百度在2023年3月推出中國(guó)第一個(gè)類(lèi)ChatGPT產(chǎn)品文心一言,同時(shí)基于文心大模型與各行各業(yè)共創(chuàng)行業(yè)大模型。百度C端AI應(yīng)用的發(fā)展迅猛,以百度文庫(kù)為例,付費(fèi)用戶(hù)已突破4000萬(wàn),AI功能的月活躍用戶(hù)數(shù)已超過(guò)9000萬(wàn)。
百度在C端產(chǎn)品上的先發(fā)優(yōu)勢(shì)仍在持續(xù)起作用,對(duì)用戶(hù)心智的搶先占領(lǐng),決定了市場(chǎng)份額。尤其在付費(fèi)的情況下,用戶(hù)極少會(huì)更換產(chǎn)品使用。百度在C端應(yīng)用上的優(yōu)勢(shì),不僅是商業(yè)化成功的驗(yàn)證,從數(shù)據(jù)的角度來(lái)說(shuō),也是百度的籌碼之一。百度搜索引擎帶來(lái)的大規(guī)模中文數(shù)據(jù)、百度智能云積累的企業(yè)場(chǎng)景數(shù)據(jù)、C端應(yīng)用產(chǎn)生的用戶(hù)交互數(shù)據(jù)等,都將成為百度在下一代基座模型競(jìng)爭(zhēng)中的重要資源。
百度在中間層的算力與API服務(wù)方面也具有優(yōu)勢(shì)。飛槳平臺(tái)為文心大模型提供高效的訓(xùn)練和推理支持,為開(kāi)發(fā)者提供完整工具鏈和開(kāi)發(fā)環(huán)境。百度自建數(shù)據(jù)中心和AI專(zhuān)用加速硬件,增強(qiáng)了技術(shù)自主性,也能很大程度上規(guī)避外界因素的影響。在2025年,中國(guó)大模型格局將從百模大戰(zhàn)進(jìn)入大浪淘沙的快速洗牌期,百度、字節(jié)、阿里等大廠將穩(wěn)坐“大模型牌桌”,競(jìng)爭(zhēng)也將就此打開(kāi)全新的局面。