【ITBEAR】在浙江烏鎮(zhèn),全球矚目的2024年世界互聯(lián)網(wǎng)大會盛大啟幕,會上傳來了一則振奮人心的消息:騰訊憑借其卓越的創(chuàng)新成就,榮獲了大會新設(shè)獎項——杰出貢獻(xiàn)獎之創(chuàng)新突破類。這一榮譽(yù)不僅彰顯了騰訊在全球互聯(lián)網(wǎng)領(lǐng)域的影響力,更是對其不懈探索與創(chuàng)新精神的肯定。
不僅如此,騰訊Angel機(jī)器學(xué)習(xí)平臺也在本次大會上大放異彩,一舉奪得本年度世界互聯(lián)網(wǎng)大會領(lǐng)先科技獎。據(jù)悉,該獎項被譽(yù)為科技界的頂尖榮譽(yù),從270個申報項目中脫穎而出,僅有20個項目獲獎,騰訊Angel機(jī)器學(xué)習(xí)平臺的實力由此可見一斑。
評選委員會對騰訊Angel機(jī)器學(xué)習(xí)平臺給予了高度評價,指出其成功攻克了萬億級模型分布式訓(xùn)練和推理以及大規(guī)模應(yīng)用部署等世界級難題。這一突破主要體現(xiàn)在通信、效率和規(guī)模三個方面。
在通信方面,騰訊自研的RDMA網(wǎng)絡(luò)實現(xiàn)了集群的高速互聯(lián),單節(jié)點帶寬高達(dá)3.2T,相比同類領(lǐng)先產(chǎn)品,性能提升了30%,成本則降低了70%。這一技術(shù)的突破,為大規(guī)模模型訓(xùn)練提供了堅實的通信基礎(chǔ)。
在效率方面,騰訊自研了訓(xùn)練/推理框架,并創(chuàng)新性地提出了顯存加主存的一體化機(jī)制,實現(xiàn)了多維并行和算子優(yōu)化。這一框架的推出,使得訓(xùn)練性能相比開源框架提升了2.6倍,推理速度也提升了2.3倍,極大地提高了模型訓(xùn)練和推理的效率。
在規(guī)模方面,騰訊Angel機(jī)器學(xué)習(xí)平臺實現(xiàn)了單任務(wù)萬卡的線性擴(kuò)展,GPU集群加速比從50%提升至99%,這一突破使得大規(guī)模模型訓(xùn)練成為可能,進(jìn)一步推動了人工智能技術(shù)的發(fā)展。
那么,騰訊Angel機(jī)器學(xué)習(xí)平臺究竟是做什么的呢?簡單來說,它就像一個強(qiáng)大的“數(shù)據(jù)加工廠”。當(dāng)你手握一堆雜亂無章的數(shù)據(jù)時,只需將這個“原材料”交給Angel機(jī)器學(xué)習(xí)平臺,它就能通過清洗、訓(xùn)練、加工等一系列工序,將這些數(shù)據(jù)轉(zhuǎn)化為一個功能強(qiáng)大的大模型。
在整個過程中,底層由GPU、云服務(wù)器等計算硬件提供算力支持,中層則是騰訊Angel機(jī)器學(xué)習(xí)平臺這一“加工廠”,負(fù)責(zé)處理數(shù)據(jù)、開發(fā)算法和執(zhí)行訓(xùn)練任務(wù),而上層則是經(jīng)過訓(xùn)練后的大模型,可以應(yīng)用于各種場景,為人們的生活帶來便利。