ITBear旗下自媒體矩陣:

華為新專利:AI模型量化技術(shù),內(nèi)存占用大減!

   時間:2025-02-07 12:02:03 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

近日,華為技術(shù)有限公司在人工智能領(lǐng)域的一項新專利引起了廣泛關(guān)注。據(jù)天眼查App透露,華為已正式公布了名為“人工智能模型的量化方法、處理系統(tǒng)和量化單元”的專利。

該專利的核心在于一種創(chuàng)新的量化方法,該方法通過量化單元來優(yōu)化AI模型的內(nèi)存占用。具體而言,量化單元會根據(jù)運行AI模型的計算設(shè)備中各個計算單元的處理粒度,靈活地將量化矩陣分割成多個適合不同計算單元處理的小塊,即分塊量化矩陣。這一步驟確保了每個計算單元都能高效處理其負責(zé)的部分。

進一步地,量化單元會對這些分塊量化矩陣進行量化處理,并將處理后的結(jié)果存儲在存儲器中。這一創(chuàng)新不僅減少了AI模型對內(nèi)存資源的占用,還提升了整體的處理效率。值得注意的是,這里的量化矩陣可以涵蓋權(quán)重矩陣和激活矩陣,進一步拓寬了該方法的應(yīng)用范圍。

尤為重要的是,華為的這一專利在量化過程中摒棄了傳統(tǒng)的基于張量級別進行離群值統(tǒng)計的方法。相反,它完全基于計算設(shè)備的各個計算單元的處理粒度進行量化,從而實現(xiàn)了對權(quán)重矩陣和激活矩陣的實時量化。這一轉(zhuǎn)變不僅簡化了量化流程,還提高了量化的準(zhǔn)確性和效率。

業(yè)內(nèi)人士指出,華為此次公布的專利無疑為人工智能模型的優(yōu)化提供了新的思路。通過創(chuàng)新的量化方法,華為不僅解決了AI模型內(nèi)存占用大的問題,還為AI模型的實時處理和高效運行奠定了堅實的基礎(chǔ)。這一專利的公布,無疑將推動人工智能技術(shù)在更多領(lǐng)域的應(yīng)用和發(fā)展。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version