ITBear旗下自媒體矩陣:

寒武紀發(fā)布新款 AI 訓練卡 MLU370-X8:7nm 工藝,48GB LPDDR5 內(nèi)存

   時間:2022-03-21 16:58:55 來源:IT之家編輯:星輝 發(fā)表評論無障礙通道

據(jù)寒武紀官方消息,寒武紀今天正式發(fā)布新款訓練加速卡 MLU370-X8,搭載雙芯片四芯粒思元 370,集成寒武紀 MLU-Link 多芯互聯(lián)技術(shù),主要面向訓練任務。

圖片

寒武紀表示,在業(yè)界應用廣泛的 YOLOv3、Transformer 等訓練任務中,8 卡計算系統(tǒng)的并行性能平均達到 350W RTX GPU 的 155%。

MLU370-X8 采用了 7nm 工藝,配備 48GB LPDDR5 內(nèi)存,F(xiàn)P32 單精度浮點性能達到 24 TFLOPS。

圖片

據(jù)介紹,MLU370-X8 智能加速卡提供 250W 最大訓練功耗,可充分發(fā)揮 AI 訓練加速中常見的 FP32、FP16 或 BF16 計算性能。寒武紀首次將雙芯片四芯粒思元 370 整合在 MLU370-X8 智能加速卡中,提供了兩倍于標準思元 370 加速卡的內(nèi)存、編解碼資源,同時搭載 MLU-Link™多芯互聯(lián)技術(shù)。

圖片

MLU370-X8 智能加速卡支持 MLU-Link™多芯互聯(lián)技術(shù),提供卡內(nèi)及卡間互聯(lián)功能。寒武紀為多卡系統(tǒng)專門設計了 MLU-Link 橋接卡,可實現(xiàn) 4 張加速卡為一組的 8 顆思元 370 芯片全互聯(lián),每張加速卡可獲得 200GB / s 的通訊吞吐性能,帶寬為 PCIe 4.0 的 3.1 倍,可高效執(zhí)行多芯多卡訓練和分布式推理任務。

圖片

▲ MLU370-X8 單機 8 卡部署配置

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version