【ITBEAR】9月25日消息,隨著技術(shù)的飛速發(fā)展,國內(nèi)大模型企業(yè)正邁向一個全新的時代——十萬卡時代。近日,百度、阿里云等科技巨頭相繼宣布,在AI大模型領(lǐng)域取得重要突破,成功部署支持十萬卡級別的大規(guī)模集群,這標(biāo)志著中國在AI算力方面邁出了堅實的一步。
百度發(fā)布的百舸AI異構(gòu)計算平臺4.0,專為部署十萬卡大規(guī)模集群而設(shè)計。據(jù)百度智能云事業(yè)群總裁沈抖介紹,該平臺在萬卡集群上實現(xiàn)了有效訓(xùn)練時長占比高達99.5%以上,通過一系列技術(shù)創(chuàng)新,大幅提升了模型訓(xùn)練效率,整體性能相比業(yè)界平均水平提升了30%。這一成就不僅彰顯了百度在AI技術(shù)方面的深厚底蘊,也為中國大模型企業(yè)的發(fā)展注入了強勁動力。
與此同時,阿里云也宣布其靈駿單網(wǎng)絡(luò)集群已擴展至十萬卡級別。阿里云CTO周靖人透露,他們的萬卡算力集群可以實現(xiàn)連續(xù)訓(xùn)練有效時長大于99%,模型算力利用率提升20%以上。這些數(shù)據(jù)顯示出阿里云在AI算力領(lǐng)域的強大實力和持續(xù)創(chuàng)新的精神。
據(jù)ITBEAR了解,十萬卡集群的部署不僅面臨著巨大的資金成本挑戰(zhàn),還需要克服諸多技術(shù)難題。GPU的敏感性和大規(guī)模集群的故障率問題是其中之一。此外,大模型訓(xùn)練過程中的網(wǎng)絡(luò)傳輸能力也是一個不容忽視的挑戰(zhàn)。然而,國內(nèi)大模型企業(yè)通過不斷的技術(shù)研發(fā)和創(chuàng)新,正逐步攻克這些難題,展現(xiàn)出令人矚目的進步速度。
值得一提的是,中國大模型企業(yè)在發(fā)展過程中還面臨著特殊的困難,即無法完全依賴國外芯片方案。因此,國內(nèi)企業(yè)需要在使用包括國產(chǎn)GPU在內(nèi)的異構(gòu)芯片方面下功夫,以確保在算力規(guī)模上能夠與美國企業(yè)相抗衡。這一挑戰(zhàn)也催生了國內(nèi)芯片產(chǎn)業(yè)的快速發(fā)展和技術(shù)創(chuàng)新。
然而,隨著大模型性能的提升,成本問題也日益凸顯。十萬卡集群每天消耗的電力就相當(dāng)于北京市東城區(qū)一天的居民用電量。因此,如何在保證性能的同時降低成本,成為大模型企業(yè)需要思考的重要問題。阿里云方面表示,他們將通過降價帶動應(yīng)用爆發(fā),并著眼于長遠(yuǎn)發(fā)展,不僅僅局限于眼前的利益。
總的來說,國內(nèi)大模型企業(yè)在邁向十萬卡時代的道路上取得了顯著的進展。他們通過技術(shù)創(chuàng)新和持續(xù)努力,正逐步克服各種挑戰(zhàn),展現(xiàn)出強大的發(fā)展勢頭。未來,我們有理由期待這些企業(yè)在AI領(lǐng)域取得更加輝煌的成就。
#AI大模型# #十萬卡時代# #百度百舸# #阿里云靈駿# #算力挑戰(zhàn)#