【ITBEAR】近日,NVIDIA旗下最新款Blackwell GPU的實測性能數(shù)據(jù)終于浮出水面,引發(fā)了業(yè)界的廣泛關注。這款被寄予厚望的圖形處理器在MLCommons MLPerf v4.1測試平臺上展現(xiàn)出了驚人的實力。
在與前兩代服務器HGX B200和HGX H200的對比中,Blackwell GPU展現(xiàn)出了顯著的性能提升。特別是在GPT-3預訓練項目中,其性能相較于上一代Hopper竟然翻了一番,這一成績無疑令人矚目。而在更為復雜的Llama 2 700億參數(shù)微調(diào)項目中,Blackwell的性能提升更是高達2.2倍,再一次刷新了人們對于AI訓練推理性能的認知。
Blackwell平臺所配備的先進硬件設施也為其卓越性能提供了有力保障。ConnectX-7 SuperNICs網(wǎng)卡、Quantum-2 InfiniBand交換機以及第五代NVLink互連總線的組合,不僅確保了節(jié)點間的通信暢通無阻,更能實現(xiàn)AI訓練負載的均衡分配,從而大幅提升整體運行效率。
在實際應用中,Blackwell GPU的強悍性能更是體現(xiàn)得淋漓盡致。例如,在處理同樣規(guī)模的GPT-3 1750億參數(shù)性能時,上一代Hopper需要多達256顆GPU才能完成的任務,而Blackwell則僅需64顆便可輕松搞定。這一對比無疑進一步印證了Blackwell在AI訓練推理領域的領先地位。
NVIDIA Blackwell GPU以其卓越的性能和先進的硬件設施,成功贏得了業(yè)界的廣泛認可。相信在未來的AI發(fā)展中,這款強悍的圖形處理器將繼續(xù)扮演著舉足輕重的角色。