【ITBEAR】9月6日消息,中國(guó)移動(dòng)近日在哈爾濱宣布,全新的智算中心已正式上線并投入運(yùn)營(yíng)。該中心以其龐大的單集群規(guī)模,榮膺全球運(yùn)營(yíng)商最大單集群智算中心的稱號(hào)。據(jù)悉,這一智算集群配備了逾18000張AI加速卡,智能算力高達(dá)6.9EFLOPS,成為業(yè)界的佼佼者。該智算中心不僅規(guī)模宏大,更在技術(shù)上展現(xiàn)了中國(guó)移動(dòng)的深厚實(shí)力。集群采納了包括高性能無(wú)損網(wǎng)絡(luò)、全調(diào)度以太網(wǎng)GSE1.0、以及融合分級(jí)存儲(chǔ)在內(nèi)的多項(xiàng)前沿技術(shù)。此外,中心還引入了移動(dòng)云的智算與智管雙平臺(tái),這些平臺(tái)提供了萬(wàn)卡并行訓(xùn)練、斷點(diǎn)續(xù)訓(xùn)等高級(jí)功能,并對(duì)AI任務(wù)的全生命周期進(jìn)行了精細(xì)化管理。值得一提的是,其分鐘級(jí)的故障定界定位能力,大幅提升了集群的運(yùn)維效率與穩(wěn)定性。
據(jù)ITBEAR了解,此次投產(chǎn)的智算集群是繼呼和浩特智算中心之后的又一力作。該中心不僅是業(yè)內(nèi)首個(gè)全面采用國(guó)產(chǎn)設(shè)備的超大規(guī)模智算集群,更標(biāo)志著我國(guó)在國(guó)產(chǎn)芯片商用化方面邁出了堅(jiān)實(shí)的一步。通過(guò)高效整合所有AI加速卡資源,并輔以先進(jìn)的智算網(wǎng)絡(luò)技術(shù),該中心成功將眾多GPU芯片連接成一個(gè)強(qiáng)大的計(jì)算整體。這一創(chuàng)新舉措不僅縮短了數(shù)據(jù)訓(xùn)練周期達(dá)20%,還充分滿足了訓(xùn)練萬(wàn)億參數(shù)級(jí)別大模型的嚴(yán)苛需求。
中國(guó)移動(dòng)智算中心(哈爾濱)的上線,無(wú)疑將為我國(guó)的AI研究與應(yīng)用提供更為強(qiáng)大的算力支持,同時(shí)也展現(xiàn)了我國(guó)在智能計(jì)算領(lǐng)域的領(lǐng)先實(shí)力與不斷前行的決心。