算力市場的風(fēng)云變幻,如同潮起潮落,令人目不暇接。在AIGC技術(shù)的驅(qū)動(dòng)下,智能算力市場迎來了前所未有的爆發(fā)期。據(jù)《中國算力發(fā)展報(bào)告(2024年)》披露,全球算力規(guī)模在2023年底已達(dá)到910EFLOPS(FP32),年度增長率高達(dá)40%。尤為引人注目的是,智能算力的增速更為迅猛,同比激增136%,遠(yuǎn)超整體算力市場的增速。
這一趨勢(shì)不僅吸引了傳統(tǒng)算力供應(yīng)商如云服務(wù)商等的持續(xù)加碼,還促使眾多傳統(tǒng)企業(yè)紛紛跨界進(jìn)入算力租賃領(lǐng)域。據(jù)統(tǒng)計(jì),僅在2023年下半年,就有近40家上市公司,如鴻博股份、蓮花控股等,涉足算力租賃業(yè)務(wù),試圖在這一新興市場中分一杯羹。
然而,市場的熱情并未持續(xù)太久。短短不到一年的時(shí)間,部分跨界企業(yè)便因?qū)λ懔κ袌龅馁Y金投入、技術(shù)門檻等預(yù)估不足,主動(dòng)終止了相關(guān)項(xiàng)目。算力租賃市場的熱潮迅速消退,從眾多企業(yè)蜂擁而入,到市場迅速降溫,這一過程令人唏噓不已。
面對(duì)算力市場的這一劇變,英博數(shù)科CFO兼CEO浦威表示,國內(nèi)智算行業(yè)正經(jīng)歷著翻天覆地的變化。在他看來,算力市場的主線邏輯已經(jīng)發(fā)生了顯著變化:通用大模型訓(xùn)練算力集群從千卡級(jí)別躍升至萬卡級(jí)別,垂直大模型訓(xùn)練算力需求從定量模式轉(zhuǎn)向彈性模式,而商業(yè)化加速則推動(dòng)算力市場從訓(xùn)練環(huán)節(jié)向推理環(huán)節(jié)轉(zhuǎn)移。
具體而言,基礎(chǔ)大模型的預(yù)訓(xùn)練需求正朝著“少而精”的方向發(fā)展。國外如OpenAI和xAI等巨頭正在建設(shè)十萬卡級(jí)別的集群,國內(nèi)如字節(jié)跳動(dòng)、阿里、百度等企業(yè)也在朝著數(shù)萬甚至十萬卡規(guī)模邁進(jìn)。對(duì)于更多廠商而言,萬卡集群已成為當(dāng)前能夠觸及的天花板。浦威指出,在國家的有序引導(dǎo)下,新的智算中心正朝著萬卡規(guī)模建設(shè),沒有萬卡級(jí)別的通用模型將難以進(jìn)一步迭代。
與此同時(shí),垂直大模型主要面向科研、教育、金融等細(xì)分行業(yè),其算力需求更具分散性、臨時(shí)性和動(dòng)態(tài)變化的特點(diǎn)。因此,垂直大模型的算力需求正逐步從大規(guī)模定量模式向可伸縮、彈性的算力模式轉(zhuǎn)變,以兼顧成本和體驗(yàn)。浦威表示,他們與眾多企業(yè)交流發(fā)現(xiàn),這些企業(yè)正在基于基座模型進(jìn)行大量的行業(yè)精調(diào)和微調(diào),其算力需求非常分散,僅在模型微調(diào)等操作時(shí)才使用算力,且對(duì)成本極為關(guān)注。
隨著大模型的商業(yè)化落地和多模態(tài)模型的普及,推理需求迅速增長。據(jù)相關(guān)數(shù)據(jù)預(yù)測(cè),從2022年到2027年,中國AI服務(wù)器的推理工作負(fù)載比例將從58.4%增長至72.6%,逐步取代訓(xùn)練成為主導(dǎo)。多模態(tài)模型的普及推動(dòng)了文本生成、圖像生成、視頻生成等廣泛的推理需求,AI模型應(yīng)用也從通用模型延展至垂直行業(yè),如代碼生成、圖像轉(zhuǎn)3D等多樣化場景。推理算力需具備更快、更靈活的特點(diǎn),以滿足實(shí)時(shí)性和動(dòng)態(tài)變化的需求。
面對(duì)算力市場的這些變化,算力服務(wù)商需要與時(shí)俱進(jìn)。英博云專注于為大模型預(yù)訓(xùn)練規(guī)模增長的頭部客戶提供量身定制的集群選型、建設(shè)、運(yùn)維等整體解決方案,同時(shí)也為有彈性算力需求的應(yīng)用領(lǐng)域的中小客戶提供GPU和CPU資源混合的彈性K8S集群服務(wù)。英博云副總裁宋琛表示,雖然部分大模型企業(yè)因資金壓力對(duì)預(yù)訓(xùn)練規(guī)模進(jìn)行了縮減,但大模型技術(shù)本身并未遇冷,仍在持續(xù)發(fā)展中。
為了應(yīng)對(duì)算力需求分層的問題,英博云提出了“單位有效算力成本”的成本評(píng)估框架,通過算力投入成本與有效計(jì)算能力的比值來評(píng)價(jià)算力服務(wù)質(zhì)量。英博數(shù)科副總裁秦偉俊表示,他們將從IDC建設(shè)到訓(xùn)練過程中的折損、故障,再到模型框架的選擇、訓(xùn)練模型的時(shí)間長度和效率等方面通盤考慮,為客戶提供算力提升的空間。
在智算中心的核心網(wǎng)絡(luò)難題方面,英博數(shù)科CTO李少鵬指出,只有在單一物理空間內(nèi),使用高功率機(jī)柜,通過統(tǒng)一的計(jì)算網(wǎng)和存儲(chǔ)網(wǎng)將所有GPU服務(wù)器組成單一集群,才能實(shí)現(xiàn)萬卡級(jí)別的并行訓(xùn)練。當(dāng)前算力成本主要來自設(shè)備采購、機(jī)電支持和運(yùn)維費(fèi)用,而算力資源的實(shí)際利用率普遍偏低,這與硬件匹配、調(diào)度策略以及訓(xùn)推框架配置等因素密切相關(guān)。
隨著長尾客戶逐漸成為算力服務(wù)的主要消費(fèi)群體,彈性算力服務(wù)將成為他們的首選。英博數(shù)科不僅提供高效益、多樣化的智算產(chǎn)品與服務(wù),還建立了算力實(shí)驗(yàn)室,對(duì)主流算力卡和設(shè)備進(jìn)行測(cè)評(píng),以便提供更適配于客戶業(yè)務(wù)類型的服務(wù)。例如,某3D視頻生成企業(yè)此前一直使用英偉達(dá)A卡進(jìn)行訓(xùn)練,但在英博數(shù)科的推薦下,改用H卡進(jìn)行訓(xùn)練后,整體測(cè)試效率提升了兩倍以上,性價(jià)比也遠(yuǎn)優(yōu)于A卡。
在投融資層面,智算中心建設(shè)是資本密集型行業(yè)。為了推動(dòng)AI應(yīng)用的繁榮發(fā)展,英博數(shù)科正在建設(shè)產(chǎn)業(yè)孵化器,對(duì)AI垂直應(yīng)用公司給予資金、算力、人才培養(yǎng)等方面的扶持。這一舉措將有助于建立更加完善的AI應(yīng)用生態(tài)。