【ITBEAR】Arm控股有限公司近期揭曉了一項重大創(chuàng)新——Arm終端計算子系統(tǒng)(CSS),這一舉措旨在引領(lǐng)人工智能(AI)體驗的新紀(jì)元,助力芯片制造商基于Arm架構(gòu)迅速構(gòu)建先進解決方案,加速產(chǎn)品上市步伐。
Arm終端CSS作為旗艦系統(tǒng)級芯片(SoC)的核心計算組件,集成了最新的Armv9 CPU、Arm Immortalis GPU,以及基于三納米工藝的生產(chǎn)就緒CPU和GPU物理設(shè)計,并配備了最新的CoreLink系統(tǒng)互連和系統(tǒng)內(nèi)存管理單元(SMMU)。與此同時,Arm還推出了Kleidi,這是一款專為軟件開發(fā)者設(shè)計的工具,旨在幫助他們充分利用Arm CPU的性能優(yōu)勢,其中KleidiAI針對AI工作負載,而KleidiCV則專注于計算機視覺應(yīng)用。
Arm高級副總裁兼終端事業(yè)部總經(jīng)理Chris Bergey對此表示:“Arm平臺始終堅守能效為核心的理念,隨著AI時代的飛速發(fā)展,它正為下一代計算需求奠定堅實基礎(chǔ)。Arm終端CSS在平臺功能上取得了顯著進步,不斷突破高端移動體驗的邊界?!?/p>
Arm終端CSS被譽為迄今為止速度最快的Arm計算平臺,其計算和圖形性能提升了30%以上,足以應(yīng)對安卓工作負載在苛刻應(yīng)用場景中的需求,同時AI推理速度也提高了59%,適用于更廣泛的AI/機器學(xué)習(xí)(ML)和計算視覺任務(wù)。這一性能的飛躍得益于Arm目前最強大、最高效、功能最全面的CPU集群。
全新的Arm Cortex-X925 CPU實現(xiàn)了Cortex-X系列自推出以來的最大同比性能提升。借助領(lǐng)先的三納米工藝節(jié)點,在3.8GHz的時鐘速率和最大緩存配置下,與2023年旗艦智能手機的四納米SoC相比,其單線程性能提升了36%。在AI性能方面,Cortex-X925同樣表現(xiàn)出色,性能提升了41%,顯著提高了大語言模型(LLM)等設(shè)備端生成式AI的響應(yīng)速度。
Arm Cortex-A725 CPU將卓越的性能與出色的效率相結(jié)合,針對AI和手游用例,性能效率提升了35%。這一改進得益于更新的Arm Cortex-A520 CPU和DSU-120,使得采用最新Armv9 CPU集群的消費電子產(chǎn)品在能效和可擴展性方面實現(xiàn)了顯著提升。
在圖形處理方面,全新的Arm Immortalis-G925 GPU是Arm目前性能最強、效率最高的GPU。在多款領(lǐng)先手游應(yīng)用中,其性能提升了37%,同時在多個AI和ML網(wǎng)絡(luò)上實現(xiàn)了34%的性能提升。Immortalis-G925專為旗艦智能手機市場設(shè)計,而Arm Mali-G725和Mali-G625 GPU則構(gòu)成了全新的高可擴展性GPU系列,適用于從高端手機到智能手表和XR可穿戴設(shè)備等廣泛的消費電子市場。
Arm始終關(guān)注全球數(shù)百萬開發(fā)者的需求,確保他們能夠獲得打造下一代AI應(yīng)用所需的性能、工具和軟件庫。為了幫助開發(fā)者快速實現(xiàn)這些創(chuàng)新,Arm推出了KleidiAI,這是一套面向AI框架開發(fā)者的計算內(nèi)核,支持Neon、SVE2和SME2等關(guān)鍵Arm架構(gòu)功能,并與PyTorch、Tensorflow、MediaPipe等熱門AI框架集成。KleidiAI旨在加速meta Llama 3、Phi-3等關(guān)鍵模型的性能,同時保持前后兼容性,確保Arm技術(shù)能夠持續(xù)滿足未來市場的需求。
通過結(jié)合前沿的CPU和GPU技術(shù)、生產(chǎn)就緒的物理實現(xiàn)以及持續(xù)的軟件優(yōu)化,Arm終端CSS與Kleidi軟件共同為未來AI提供了強大的計算平臺,奠定了Arm在這一領(lǐng)域的基石地位。