【ITBEAR】夏威夷現(xiàn)場報道——
2024年10月22日,一年一度的驍龍技術峰會上,高通如約帶來了新一代旗艦級移動平臺,但不叫驍龍8 Gen4,而是改名為全新的“驍龍8 Elite”,中文名“驍龍8至尊版”,代表了一個新的開端。
之所以如此命名,主要是因為它和去年發(fā)布的PC處理器驍龍X Elite一樣,也用上了高通自研的全新Oryon CPU架構。
這一架構今年還會延伸到汽車端,構成手機、PC、汽車三位一體的“Elite全明星陣容”。
高通CEO安蒙
回顧高通驍龍?zhí)幚砥鞯拿冞w,尤其是旗艦平臺名字的變化,是相當有趣的。
2006-2008年,高通手機處理器還不叫驍龍,只是傳統(tǒng)的字母加數(shù)字編號,包括QSC6000系列、MSM6000/7000系列,可以說當時整個行業(yè)還處于拓荒時代,也缺乏品牌意識。
2008年末的QSD8250,是第一款冠以驍龍品牌的產品,之后驍龍S1、S2、S3、S4逐步迭代,越發(fā)成熟,逐步成為行業(yè)領導。
2013年開始,驍龍800、驍龍700、驍龍600、驍龍400、驍龍200四大系列逐漸完整覆蓋了從旗艦到入門級的各個領域,這也是高通真正君臨天下的階段。
2021年的驍龍888一改傳統(tǒng)編號序列,非常吉利,特別討好蓬勃發(fā)展的中國手機市場。
2022年開始了全新的“驍龍x Gen x”階段,從高到低分成驍龍8/7/6/4四大系列,大部分陸續(xù)進化了三代,但并非同步更新。
直到今天,全新的驍龍8至尊版登場了!
一如既往,驍龍8至尊版也不僅僅是一個單純的SoC處理器,更是一套完整的移動平臺,其中包含多達超過40個不同組件,全部來自高通,還包括射頻、收發(fā)器、電源管理、超聲波指紋識別、移動連接等等,是一個全面的解決方案。
它采用臺積電第二代N3E 3nm工藝制造,也就是和蘋果A18系列、聯(lián)發(fā)科天璣9400相同的N3E,整體能效提升27%。
這套平臺的核心基石就是全新打造的第二代自研Oryon CPU架構,專門面向智能手機定制,可為旗艦手機帶來最佳的性能和能效,對比第三代驍龍8單核性能提升45%、多核性能提升45%、Iometer上網性能提升62%、能效提升45%。
同時,驍龍8至尊版在GPU圖形、AI、圖像處理等各方面也都有重大創(chuàng)新,綜合性能、技術實現(xiàn)了顯著提升。
驍龍8至尊版配備了兩個基于Oryon架構的“超級核心”(Prime),主頻高達4.32GHz,經過優(yōu)化之后可以運行最為密集的應用,并保持出色能效。
這也創(chuàng)下了手機處理器頻率的新紀錄,即便放在桌面PC上也不算低。
與之搭配的是六個“性能核心”(PerformanceCore),主頻也高達3.53GHz,已經非常接近天璣9400超大核的3.62GHz。
是的,驍龍8至尊版改成了2個超大核、6個大核的組合,幾代下來逐步減少直至完全取消了能效核(小核)。
回顧歷史,驍龍8 Gen1配備的是1超3大4小的CPU核心組合,驍龍8 Gen2改成了1超4大3小,驍龍8 Gen3升級為1超5大2小,每代減少1個小核心、增加1個大核心。
如今,小核終于退出了歷史舞臺,全大核時代真正到來。
事實上,ARM多年前就基本放棄了對小核心的更新迭代,A510、A55間隔了長達三年,A520又是一次小幅升級。
顯然,大家都逐漸意識到,曾經的big.LITTLE大小核理念已經不再適應這個時代,架構、技術、工藝的進步使得小核逐漸成為拖后腿的存在,全大核無論性能還是能效都更勝一籌。
另外在延遲方面,從核心到一級緩存不超過1納秒,從一級緩存到二級緩存為5納秒,從二級緩存到內存為12納秒。
Oryon CPU的緩存也得到了重大改進,上代有12MB三級緩存,所有核心共享。
驍龍8至尊版的二級緩存容量翻番為24MB,同樣是行業(yè)最先進的,而且分成兩部分,兩個超大核獨享12MB,六個性能核分享12MB。
同時,一級緩存也全面增加,每個超大核192KB,每個性能核128KB,總計1152KB,超過了1MB。
考慮生成式AI極其依賴于內存,驍龍8至尊版配備了最先進的LPDDR5X內存,實際頻率5333MHz,等效于10.7GHz。
按照高通的說法,驍龍8至尊版的CPU性能對比上代可提升最多達50%,同時能效提升最多達45%!
高通強調,得益于第二代Oryon CPU的微架構改善,驍龍8至尊版可以帶來出色的用戶體驗,包括更快的應用啟動、無縫的多任務處理,以及先進的生成式AI特性。
高通驍龍一向擁有行業(yè)最強的GPU圖形核心,甚至經常被調侃“買GPU送CPU”。
不過歷史上,高通很少介紹GPU的具體架構設計,一般只是粗略地宣稱性能、能效提升多少多少。
這次,不太一樣。
驍龍8至尊版的Adreno GPU首次引入了全新的切片(Slice)設計,分為三組,頻率達都高達1.1GHz,接受指令處理器的統(tǒng)一調度。
高通表示,這種切片式GPU設計面向現(xiàn)代圖形負載處理而優(yōu)化,提供了基于獨立著色處理器的內核,以實現(xiàn)更好的任務分配、并發(fā)性能,可以實現(xiàn)性能提升40%,同時功耗降低40%。
其中,光線追蹤的性能提升可達35%。
末端還有多達12MB圖形緩存,可以大大減少將數(shù)據(jù)轉移至內存進行處理的幾率,從而顯著降低延遲。
遺憾的是,切片內部結構依然未公開,猜測每個切片相對獨立運行,內部又包含計算核心、采樣器、幾何單元、光柵單元、載入存儲單元、渲染后端、緩存等不同單元模塊。
這種設計理念其實和NVIDIA、AMD、IntelGPU都有些類似,比如NVIDIA一直分為GPC/TPC/SM的層級關系,AMD的計算單元(CU),Intel則是渲染切片(Render Slice)。
游戲方面,驍龍游戲工作室通過與Feral Interactive的深度持續(xù)合作,共同開發(fā)并即將推出代手游《超級房車賽:傳奇》(Grid Legends)。
它可以在驍龍8至尊版上以2倍幀率運行,畫面驚艷。
它還會獨家搭載高通自適應性能引擎4.0,通過優(yōu)化游戲線程策略,帶來更高的能效,延長續(xù)航。
驍龍8至尊版還首次支持在移動端運行虛幻引擎5Nanite解決方案,可在手游中渲染出電影級的3D環(huán)境,而且這是高通驍龍平臺的獨享功能。
Nanite是虛幻引擎5全新引入的虛擬幾何體系統(tǒng)(Virtualized Geometry System),采用全新的內部網格體格式和渲染技術,可以渲染出像素級別的細節(jié),以及海量的物體對象。
同時,它非常智能,可以只處理并渲染人眼能夠觀察到的細節(jié),并采用高度壓縮的數(shù)據(jù)格式,從而大大減輕渲染壓力。
端側生成式AI無疑是當下手機處理器乃至PC處理器最激烈的戰(zhàn)場,進化迭代速度也非常快,不斷延伸覆蓋更多領域、更多玩法。
去年的第三代驍龍8,就帶來了全球首個端側StableDiffusion,而且運行速度是最快的,而高通并未滿足于此。
生成式AI最初包括文字、語音、圖像等幾個部分,更多模態(tài)不斷加入其中,可以讓智能助手真正聽你所聽、見你所見,帶來更直觀、更出色的體驗。
為此,在驍龍8至尊版針對包含CPU、GPU、NPU等各個模塊的高通AI引擎進行了大幅升級。
迄今最好的移動端CPU架構,也就是第二代Oryon,負責處理時延敏感型的AI任務,并幫助將AI任務分配到其他更合適的模塊上,比如傳感器中樞。
高通AI引擎中的其他核心,可以各自發(fā)揮所長,分別負責專門的AI任務。
高通Hexagon NPU也是高通AI引擎的核心所在,驍龍8至尊版進行了一系列提升。
首先,標量和向量加速器都增加了,現(xiàn)在向量加速器有6個核心,標量加速器則有8個核心,并且所有核心的吞吐能力都更強了。
再加上強大的Tensor張量加速器,整體運算能力大大提升,無論是超長文本支持,還是大模型加速,都可以輕松應對。
高通稱,驍龍8至尊版NPU的性能、能效都提升了多達45%。
兩個Micro NPU,加上兩個ISP、DSP、內存,共同組成了高通傳感器中樞,整體AI性能提升了多達60%,AI推理速度提升了45%。
高通還引入了并發(fā)特性,AI和計算視覺負載可以在NPU內存中共存,從而增加了靈活性,并進一步提高了性能。
另外,NPU、ISP等不同模塊之間的直連通道也進行了重構,通信效率更高。
得益于如此強大的AI引擎,驍龍8至尊版可以完全在終端側離線運行個性化、多模態(tài)的AI助手。
這種多模態(tài)AI助手更加智能,因為它背后有很多模型在運行,包括LMM(多模態(tài))、LLM(語言)、LVM(視覺)、ASR(語音)等等。
現(xiàn)在通過LMM多模態(tài)模型,AI可以直接理解語音,節(jié)省了額外的步驟。
再加上NPU新增的加速器核心、升級的多模態(tài)模型,以及軟件的不斷優(yōu)化,可以實現(xiàn)更快的AI處理速度。
這種技術進步帶給用戶最直觀、最大差別的感受,就是語音交互更加靈敏,幾乎感覺不到延遲,就像和真人交談一樣。
驍龍8至尊版還提升了輸入時可接受的token數(shù)量,可以上傳更大的文檔、音頻和圖像,從而讓AI能夠基于更豐富的參考資料,更深入、更貼切地了解用戶想表達的問題,并進行更精準的回答。
除了文字和語音互動,AI助手首次可以完全在終端側,通過攝像頭看到用戶所看到的內容。
如此一來,用戶可以通過相機的實時模式,與AI助手進行互動,AI助手可以實時理解并回答用戶的問題。
比如用戶直接把攝像頭對準收據(jù),AI助手就能理解收據(jù)上的內容,然后通過推理來提供答案,比如幫你計算應該付多少錢、有幾個朋友如何分擔賬單。
AI助手能夠量身定做,讓手機更了解你的個人特殊需求,實現(xiàn)個性化。
手機上的傳感器和攝像頭也可以根據(jù)用戶的喜好,在端側本地創(chuàng)建屬于個人的神經網絡,讓AI助手更理解用戶的需求。
第三代驍龍8憑借認知三ISP,就已經支持強大的終端側AI影像功能,比如AI擴圖可以擴充照片背景,AI超級分辨率可以提升照片清晰度和細節(jié),AI語義分割可以自動識別畫面中的不同物體并進行專門增強。
驍龍8至尊版又打造了一個全新的AI ISP,從底層與Hexagon NPU協(xié)作,最顯著的提升就是Hexagon與內存之間的超快直連,從而能夠直接在終端側處理AI特性。
憑借這一直連技術,NPU有史以來第一次能夠直接訪問ISP上的原始RAW傳感器數(shù)據(jù),通過深度集成,實現(xiàn)對4K60fps視頻拍攝進行實時AI輔助增強。
同時,更多的處理管線轉移到了RAW域,進一步提升準確性和靈活性,同時零延遲快門吞吐量提升35%,每秒可以處理多達43億像素。
現(xiàn)在,驍龍8至尊版支持三個4800萬像素圖像傳感器同時進行30fps視頻拍攝。
通過在4K60fps拍攝中實時調用NPU,驍龍8至尊版將先進的AI算法直接引入圖像和視頻處理管線的核心,這一技術叫做“Insight AI”。
它是一系列AI算法的合集,能夠提升用戶的日常拍攝體驗。
其中之一是無限語義分割(Limitless Segmentation),支持對圖片進行超過250層的語義識別和分割,可以對照片的所有部分進行專門的調整和改善。
在完成圖像語義分割后,驍龍8至尊版可以利用實時皮膚和天空算法,并借助NPU的算力,識別光線條件,并進行修圖。
因此,即便是在昏暗、復雜的光線條件下,也能拍出自然的皮膚和天空色調,還原真實的人物與世界。
還有實時AI補光技術,比如在視頻通話或直播時存在嚴重背光,就可以添加一個虛擬的可移動光源,完美映射臉部輪廓,拍出更自然、更真實的人臉。
再比如視頻魔法消除。
一如照片消除功能,驍龍8至尊版在視頻上也可以做到,只需大致選擇需要消除的對象,就可以利用AI輕松完成。
目前,該功能支持30fps視頻。
AI寵物套件,基于NPU,針對寵物快速移動造成拍攝模糊,可以快速修正,讓照片更加銳利、清晰。
關鍵是,這些功能都是在本地端側完成的,無需上傳云端,既能提升速度,也有利于保護隱私。
驍龍8至尊版還是全球首個支持AI增強5G和Wi-Fi連接的移動平臺,集成驍龍X80 5G基帶及射頻系統(tǒng),也是第二代5G AI處理器。
驍龍80基帶實現(xiàn)了多個行業(yè)第一:首個支持下行6載波聚合、首個支持6個Rx接收器路徑、首個支持AI/5G-A融合、首個支持AI多天線管理、首個支持CPEAI增強通信、首個支持NB-NTN(非地面網絡)衛(wèi)星通信。
相信隨著驍龍8至尊版的上市,支持衛(wèi)星直連通信的手機會迎來一波爆發(fā),說不定會成為中高端手機的標配。
FastConnect 7900移動連接系統(tǒng)支持AI增強的Wi-Fi 7。
它是首個單芯片集成Wi-Fi、藍牙、UWB的方案,首個支持320MHz通道高頻并發(fā)HBS多連接,峰值速度號稱是競品的2.4倍。
通過高通XPAN,它可以支持更高級的24-bit、96kHz無損音頻。
華碩、榮耀、iQOO、摩托羅拉、努比亞、一加、OPPO、紅魔、Redmi、realme、三星、vivo、小米、中興等終端廠商,都將陸續(xù)推出基于驍龍8至尊版的新機。
最后,一圖看懂驍龍8至尊版!