【ITBEAR】近日,NVIDIA Blackwell GPU的實(shí)測數(shù)據(jù)終于浮出水面,其強(qiáng)悍性能引發(fā)了業(yè)界的廣泛關(guān)注。此前,這款GPU的強(qiáng)大能力僅限于官方宣傳,但現(xiàn)在,我們有了來自MLCommons MLPerf v4.1的權(quán)威性能測試結(jié)果,為我們揭示了Blackwell的真實(shí)實(shí)力。
在與前兩代服務(wù)器HGX B200和HGX H200的對(duì)比中,Blackwell GPU展現(xiàn)出了顯著的優(yōu)勢。尤其是在AI訓(xùn)練推理性能方面,其表現(xiàn)尤為突出。在GPT-3預(yù)訓(xùn)練項(xiàng)目中,相較于上一代Hopper,Blackwell的性能實(shí)現(xiàn)了翻倍的增長。
更為驚人的是,在Llama 2 700億參數(shù)微調(diào)項(xiàng)目中,Blackwell的性能提升了高達(dá)2.2倍。這一成就得益于其先進(jìn)的硬件配備,包括ConnectX-7 SuperNICs網(wǎng)卡、Quantum-2 InfiniBand交換機(jī),以及第五代NVLink互連總線。這些技術(shù)保障了節(jié)點(diǎn)間的通信效率,使得AI訓(xùn)練負(fù)載能夠得到平衡分配,進(jìn)而提升了整體效率。
舉例來說,在處理GPT-3 1750億參數(shù)性能的任務(wù)時(shí),Hopper需要多達(dá)256顆GPU,而Blackwell則僅需64顆,這一對(duì)比充分展現(xiàn)了Blackwell的高效與強(qiáng)大。
此次實(shí)測數(shù)據(jù)的公布,不僅印證了NVIDIA Blackwell GPU的卓越性能,更為AI領(lǐng)域的發(fā)展注入了新的活力。無疑,Blackwell將成為未來AI訓(xùn)練和推理的重要推動(dòng)力。