ITBear旗下自媒體矩陣:

華為新專利:AI模型量化技術,助力內存占用大幅縮減

   時間:2025-02-07 13:00:58 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

華為技術有限公司在人工智能領域再添新專利,一項名為“人工智能模型的量化方法、處理系統(tǒng)和量化單元”的專利近日正式公布。該專利揭示了華為在優(yōu)化AI模型運行效率方面的又一重要進展。

據(jù)專利摘要介紹,該量化方法的核心在于量化單元能夠智能地根據(jù)運行AI模型的計算設備的不同計算單元處理粒度,將量化矩陣分割成多個適配的分塊量化矩陣。這一過程不僅精細且高效,能夠大幅度減少AI模型對內存的占用。無論是權重矩陣還是激活矩陣,量化單元都能基于計算設備的實際處理能力進行實時量化,無需依賴傳統(tǒng)的張量級別離群值統(tǒng)計。

進一步地,量化單元會對這些分塊量化矩陣進行量化處理,并將處理后的結果存儲在存儲器中。這一創(chuàng)新不僅優(yōu)化了AI模型的內存使用,還提升了整體運行效率,為AI技術在更多場景下的應用提供了有力支持。

華為在數(shù)據(jù)處理方法及相關設備方面也取得了新突破。國家知識產(chǎn)權局信息顯示,華為于2024年9月申請了一項名為“一種數(shù)據(jù)處理方法及相關設備”的專利,并于今年1月底公布相關信息。該專利旨在降低模型訓練過程中的存儲空間開銷,同時提升模型訓練性能。

具體而言,該專利提出了一種創(chuàng)新的數(shù)據(jù)處理方法。在這一過程中,第一裝置利用神經(jīng)網(wǎng)絡模型對第一數(shù)據(jù)進行前向計算,得到第二數(shù)據(jù)。隨后,該裝置對第二數(shù)據(jù)進行量化處理,得到位數(shù)更少的第三數(shù)據(jù)。這一量化步驟有效降低了數(shù)據(jù)的存儲需求。最終,第一裝置保存這些量化后的第三數(shù)據(jù),這些數(shù)據(jù)將在后續(xù)的第一模型反向計算中發(fā)揮關鍵作用。

華為在人工智能領域的持續(xù)創(chuàng)新,不僅體現(xiàn)了其在技術研發(fā)上的深厚實力,也為推動AI技術的廣泛應用和發(fā)展做出了重要貢獻。隨著這些新專利的實施和應用,我們有理由相信,華為將在人工智能領域取得更多突破性的成果。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網(wǎng)站首頁  |  關于我們  |  聯(lián)系方式  |  版權聲明  |  RSS訂閱  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version