【ITBEAR】摩爾線程近日宣布,已開源其高性能線性代數(shù)模板庫MUTLASS,旨在助力開發(fā)者更高效地利用摩爾線程全功能GPU的MUSA Core與Tensor Core進行編程。此舉有望加快基于國產(chǎn)GPU的算子開發(fā)與算法創(chuàng)新步伐。
MUTLASS,即MUSA Templates for Linear Algebra Subroutines,是摩爾線程專為MUSA架構(gòu)打造的高性能計算庫。該庫基于開源模板庫CUTLASS進行了MUSA適配與深度定制化開發(fā),以優(yōu)化性能。
在矩陣乘法及相關(guān)操作方面,MUTLASS提供了一系列高性能的C++模板組件。這些組件采用了與muDNN庫相似的分層分解及數(shù)據(jù)搬運策略,以確保GPU性能得以充分發(fā)揮。
此次開源的版本中,摩爾線程對CuTe后端庫進行了適配,增加了對第三代MUSA架構(gòu)的MMA計算原語的支持。同時,該版本還支持TF32、FP16、BF16及INT8等多種數(shù)據(jù)精度,為矩陣乘法、默認(rèn)實例庫、性能測試器及相關(guān)工具包提供了初步支持。
開發(fā)者可通過訪問MUTLASS的開源地址:https://github.com/MooreThreads/mutlass,獲取該庫并應(yīng)用于其項目中,從而提升基于摩爾線程GPU的開發(fā)效率與性能。
摩爾線程的這一開源舉措,有望推動國產(chǎn)GPU在高性能計算領(lǐng)域的應(yīng)用與發(fā)展,為國內(nèi)外開發(fā)者提供更多選擇與可能。