在云計(jì)算與人工智能大模型訓(xùn)練的幕后,數(shù)據(jù)中心作為不可或缺的底層基礎(chǔ)設(shè)施,其重要性日益凸顯。與無形的云計(jì)算不同,數(shù)據(jù)中心是一項(xiàng)長(zhǎng)期且重大的資產(chǎn)投資,其生命周期往往以十年計(jì)。這意味著,一旦初期的布局失誤或無法緊跟市場(chǎng)需求,對(duì)于建設(shè)者而言,不僅回報(bào)無望,甚至可能面臨投資成本和后續(xù)運(yùn)營(yíng)成本的雙重?fù)p失。從運(yùn)營(yíng)商到獨(dú)立的第三方IDC廠商,再到互聯(lián)網(wǎng)和ICT企業(yè),作為數(shù)據(jù)中心的主要參與者,都曾經(jīng)或正在面臨此類挑戰(zhàn)。
盡管近年來受到政策調(diào)整、市場(chǎng)需求變化以及技術(shù)門檻降低等多重因素的影響,國(guó)內(nèi)數(shù)據(jù)中心的建設(shè)熱情并未減退。在需求端,算力,特別是AI算力仍存在巨大缺口。然而,Scale out芯片互聯(lián)等技術(shù)方案導(dǎo)致的算力利用率不高也是不爭(zhēng)的事實(shí)。因此,為了盡可能滿足企業(yè)客戶的算力需求,數(shù)據(jù)中心的建設(shè)不僅需要迅速見效,還需具備靈活擴(kuò)容的能力。
政策方面,數(shù)據(jù)中心的發(fā)展始終朝著綠色低碳的方向前進(jìn)。早在2016年,《“十三五”國(guó)家信息化規(guī)劃》就提出了增加IT項(xiàng)目投資并逐步控制新建數(shù)據(jù)中心的PUE值的要求。自2021年以來,北京、廣州等地相繼出臺(tái)了關(guān)于數(shù)據(jù)中心能耗保障的相關(guān)規(guī)定,對(duì)數(shù)據(jù)中心的PUE等能耗指標(biāo)的考核愈發(fā)嚴(yán)格。同時(shí),多地政策鼓勵(lì)數(shù)據(jù)中心采用預(yù)制模塊化等裝配式建筑,一些國(guó)家級(jí)綠色數(shù)據(jù)中心已經(jīng)開始積極應(yīng)用液冷、高壓直流等高效冷卻技術(shù)、智能化運(yùn)維管理技術(shù)及模塊化系統(tǒng)解決方案。
在此背景下,數(shù)據(jù)中心預(yù)制化的解決方案逐漸受到建設(shè)者的青睞,這符合數(shù)據(jù)中心預(yù)制化、模塊化的整體趨勢(shì)。不過,隨著時(shí)代的演進(jìn),預(yù)制化數(shù)據(jù)中心已從以通用算力結(jié)合風(fēng)冷散熱方案為主的上一代,逐步轉(zhuǎn)變?yōu)橐訟I算力等多元算力結(jié)合液冷散熱方案為主體的AIDC模式。
近日,鈦媒體跟隨浪潮信息探訪了其位于濟(jì)南的元腦“算力工廠”。這個(gè)智算中心是浪潮信息預(yù)制化AIDC解決方案的新典范,支撐了全球服務(wù)器大規(guī)模測(cè)試、客戶POC測(cè)試、大模型開發(fā)與應(yīng)用、智能化轉(zhuǎn)型等多種業(yè)務(wù)場(chǎng)景的算力需求。
預(yù)制化數(shù)據(jù)中心通過在工廠預(yù)先集成設(shè)備模塊到集裝箱中并完成測(cè)試,現(xiàn)場(chǎng)只需像“樂高”一樣快速組裝,即可形成一個(gè)完整的數(shù)據(jù)中心。這種方式的優(yōu)勢(shì)在于與土建工作解耦,不受現(xiàn)場(chǎng)條件限制,所有機(jī)電設(shè)備在工廠預(yù)集成、預(yù)測(cè)試,接入市電、網(wǎng)絡(luò)和水源后即可獨(dú)立運(yùn)行,預(yù)制裝配率高,且集成工作與現(xiàn)場(chǎng)土建工作并行,大大縮短了建設(shè)工期。
根據(jù)功能的不同,集裝箱可分為IT、電力、集成冷站、集成冷源、辦公、走廊、電梯、樓梯等八種功能箱體,可根據(jù)不同場(chǎng)景和規(guī)模靈活組合,并按照功率區(qū)段分區(qū)部署,以滿足不同算力應(yīng)用場(chǎng)景的需求。對(duì)于客戶而言,初期可根據(jù)資金水平和算力需求按需部署,后期可根據(jù)算力設(shè)備匹配數(shù)據(jù)中心模式進(jìn)行在線柔性升級(jí)擴(kuò)容,不僅支持水平擴(kuò)容,還可實(shí)現(xiàn)豎向按需擴(kuò)容,最高可達(dá)5層。
當(dāng)前數(shù)據(jù)中心建設(shè)必須將綠色節(jié)能納入考量。過去十年間,CPU和GPU的熱設(shè)計(jì)功率大幅提升,單機(jī)柜功率密度也從5kW攀升至100kW以上。Scale Up帶來的部署密度提升是實(shí)現(xiàn)Scale Out規(guī)模持續(xù)擴(kuò)張的前提和基礎(chǔ),而液冷、智能溫控等先進(jìn)制冷技術(shù)則解決了Scale Up引發(fā)的散熱問題。這意味著占地大、能耗高的數(shù)百兆瓦數(shù)據(jù)中心將進(jìn)一步壓縮為更加緊湊、節(jié)能的形態(tài)。
元腦算力工廠正是基于這一理念進(jìn)行設(shè)計(jì)。一期建設(shè)規(guī)模已實(shí)現(xiàn)119臺(tái)集裝箱、419個(gè)機(jī)柜的一層部署,總?cè)萘窟_(dá)到10MW,使用年限可達(dá)50年。從規(guī)劃到集裝箱工廠生產(chǎn)預(yù)制、地基建設(shè)、吊裝、調(diào)試等,總共耗時(shí)9個(gè)月完成交付,實(shí)際建成投運(yùn)僅用時(shí)120天。
在投資建設(shè)初期,浪潮信息內(nèi)部對(duì)采用集裝箱方案進(jìn)行了深入的論證和預(yù)想。浪潮信息服務(wù)器產(chǎn)品線副總經(jīng)理李金波指出:“在國(guó)內(nèi),10MW以上規(guī)模的智算中心并不多。這意味著采用集裝箱結(jié)構(gòu)一旦上了規(guī)模,幾百個(gè)集裝箱進(jìn)行組裝實(shí)現(xiàn)互聯(lián)互通,對(duì)技術(shù)要求非常高。同時(shí),與樓宇建設(shè)相比,集裝箱式不僅可以短時(shí)間內(nèi)構(gòu)建大規(guī)模集群,還可為未來基建節(jié)省更多投資。我們認(rèn)為預(yù)制化是最能滿足AI時(shí)代算力快速部署的需求?!?/p>
除了基建層面的預(yù)制化,元腦算力工廠還全面遵循了“高密+綠色”的未來智算中心設(shè)計(jì)理念。算力節(jié)點(diǎn)大量使用高密智算算力倉(cāng),將風(fēng)冷機(jī)柜的負(fù)載上限提升至50kW,液冷機(jī)柜的負(fù)載上限高達(dá)130kW。為解決高密度部署帶來的散熱和能耗問題,浪潮信息結(jié)合液冷、光伏、儲(chǔ)能、余熱回收等多種技術(shù),并采用智能管理平臺(tái)實(shí)現(xiàn)IT和機(jī)房設(shè)備的控制聯(lián)動(dòng),PUE可降至1.1以下。
光伏發(fā)電技術(shù)為智算中心提供清潔電力,儲(chǔ)能技術(shù)平衡電網(wǎng)負(fù)荷并提高能源利用效率,集成冷站采用變頻冷機(jī)實(shí)現(xiàn)自然冷卻,并結(jié)合余熱利用技術(shù)為辦公區(qū)供暖。集裝箱采用預(yù)制化鋼結(jié)構(gòu)建筑,材料回收率超80%,施工現(xiàn)場(chǎng)無粉塵噪音,建筑垃圾少,進(jìn)一步實(shí)現(xiàn)了綠色環(huán)保。
元腦算力工廠的建設(shè)成效顯著:一是建設(shè)周期大幅縮短,將同等規(guī)模智算中心的建設(shè)周期從18個(gè)月縮減至4個(gè)月,工期縮短了近80%;二是彈性可擴(kuò)容,可根據(jù)業(yè)務(wù)規(guī)模分期高效進(jìn)行水平及豎向擴(kuò)容,有效節(jié)省前期投入成本;三是綠色節(jié)能,全年節(jié)省電費(fèi)近2億元,大幅降低運(yùn)營(yíng)成本。據(jù)測(cè)算,4個(gè)集裝箱、千卡規(guī)模算力,每年可節(jié)省電費(fèi)400萬元。
面對(duì)復(fù)雜多變的市場(chǎng)需求和客戶挑戰(zhàn),如何快速構(gòu)建綠色高效的智算中心成為眾多企業(yè)客戶的共同難題。預(yù)制化智算中心的優(yōu)勢(shì)在于大幅縮短交付周期。然而,每個(gè)客戶的業(yè)務(wù)場(chǎng)景、地理環(huán)境、能源政策等因素各不相同,因此沒有最好的方案,只有最適合的方案。對(duì)于算力基礎(chǔ)設(shè)施廠商而言,深入了解客戶需求才能提供真正符合其實(shí)際需求的解決方案。
浪潮信息的實(shí)踐經(jīng)驗(yàn)已在互聯(lián)網(wǎng)、金融、能源、教科研、汽車等行業(yè)落地,但更多是AIO或臨建式的預(yù)制化模式。李金波表示:“以高校為例,有時(shí)會(huì)有一些偶發(fā)性算力需求,受制于科研經(jīng)費(fèi)、場(chǎng)地空間等因素,智算中心規(guī)模較小,采用兩三個(gè)集裝箱即可拼接建成。使用十幾年達(dá)到生命周期報(bào)廢后,對(duì)高校在場(chǎng)地和投入上也不會(huì)有太大影響。在海外,考慮到初期建設(shè)成本問題,企業(yè)為快速上線應(yīng)用,也可以采用這種方案?!?/p>
國(guó)際咨詢機(jī)構(gòu)ResearchAndMarkets發(fā)布的報(bào)告指出,模塊化數(shù)據(jù)中心市場(chǎng)預(yù)計(jì)將從2024年的299.3億美元增長(zhǎng)到2030年的794.9億美元,預(yù)測(cè)期內(nèi)的復(fù)合年增長(zhǎng)率為17.7%。小型數(shù)據(jù)中心作為模塊化數(shù)據(jù)中心市場(chǎng)的一個(gè)重要細(xì)分市場(chǎng),旨在滿足客戶對(duì)本地化計(jì)算能力日益增長(zhǎng)的需求,同時(shí)優(yōu)化空間和能源使用。關(guān)鍵優(yōu)勢(shì)在于靠近最終用戶,減少延遲并提高邊緣計(jì)算等應(yīng)用的性能,同時(shí)配備先進(jìn)的冷卻解決方案,提高能源效率并降低運(yùn)營(yíng)成本。