能不能拿下ARM還是一樁懸案,不過NVIDIA已經(jīng)迫不及待利用ARM做抓手,來打擊做x86 CPU的Intel和AMD了。
在最新公開資料中,NVIDIA曬出了配備ARM處理器(Ampere Altra)和A100 GPU加速卡的平臺和x86處理器平臺的性能差異,基于MLPerf最新的1.1基準(zhǔn)。
可以看到,在深度學(xué)習(xí)推薦模型DLRM、自然語言處理網(wǎng)絡(luò)BERT、會議識別RNN-T、醫(yī)學(xué)圖像劃分3D U-Net、圖像分類的ResNet-50等負(fù)載中,與x86表現(xiàn)不相上下,甚至在3D U-Net單項中還實(shí)現(xiàn)反超。
此番,參與對比的還有高通AI100、Intel至強(qiáng)8380(Ice Lake)等。
加速卡方面,如果以A30為標(biāo)準(zhǔn),離線環(huán)境下,A100在大多數(shù)工作負(fù)載下的處理速度都是A30的2倍左右;在服務(wù)器環(huán)境下,基于x86的A100對會議識別RNN-T的處理速度接近A30的3倍。
據(jù)了解,MLPerf是當(dāng)前全球最具影響力的AI計算基準(zhǔn)評測組織,由圖靈獎得主大衛(wèi)·帕特森(DavidPatterson)聯(lián)合谷歌、斯坦福、哈佛大學(xué)等單位共同成立,每年組織全球AI訓(xùn)練和AI推理性能測試并發(fā)榜。