華為技術有限公司在人工智能領域再添新專利,一項名為“人工智能模型的量化方法、處理系統(tǒng)和量化單元”的專利近日正式公布。該專利揭示了華為在優(yōu)化AI模型運行效率方面的又一重要進展。
據(jù)專利摘要介紹,該量化方法的核心在于量化單元能夠智能地根據(jù)運行AI模型的計算設備的不同計算單元處理粒度,將量化矩陣分割成多個適配的分塊量化矩陣。這一過程不僅精細且高效,能夠大幅度減少AI模型對內存的占用。無論是權重矩陣還是激活矩陣,量化單元都能基于計算設備的實際處理能力進行實時量化,無需依賴傳統(tǒng)的張量級別離群值統(tǒng)計。
進一步地,量化單元會對這些分塊量化矩陣進行量化處理,并將處理后的結果存儲在存儲器中。這一創(chuàng)新不僅優(yōu)化了AI模型的內存使用,還提升了整體運行效率,為AI技術在更多場景下的應用提供了有力支持。
華為在數(shù)據(jù)處理方法及相關設備方面也取得了新突破。國家知識產(chǎn)權局信息顯示,華為于2024年9月申請了一項名為“一種數(shù)據(jù)處理方法及相關設備”的專利,并于今年1月底公布相關信息。該專利旨在降低模型訓練過程中的存儲空間開銷,同時提升模型訓練性能。
具體而言,該專利提出了一種創(chuàng)新的數(shù)據(jù)處理方法。在這一過程中,第一裝置利用神經(jīng)網(wǎng)絡模型對第一數(shù)據(jù)進行前向計算,得到第二數(shù)據(jù)。隨后,該裝置對第二數(shù)據(jù)進行量化處理,得到位數(shù)更少的第三數(shù)據(jù)。這一量化步驟有效降低了數(shù)據(jù)的存儲需求。最終,第一裝置保存這些量化后的第三數(shù)據(jù),這些數(shù)據(jù)將在后續(xù)的第一模型反向計算中發(fā)揮關鍵作用。
華為在人工智能領域的持續(xù)創(chuàng)新,不僅體現(xiàn)了其在技術研發(fā)上的深厚實力,也為推動AI技術的廣泛應用和發(fā)展做出了重要貢獻。隨著這些新專利的實施和應用,我們有理由相信,華為將在人工智能領域取得更多突破性的成果。