華碩Tony大叔近日在社交平臺發(fā)布了RTX 5090/D顯卡的深度評測報告,內(nèi)容涵蓋了詳盡的跑分?jǐn)?shù)據(jù)和液氮超頻演示。令人矚目的是,他還首次展示了RTX 5090/5090D所搭載的GB202 GPU核心的內(nèi)部構(gòu)造照片,為公眾揭開了這款高端顯卡的神秘面紗。
GB202 GPU核心采用了臺積電升級的4NP工藝制造,相較于上一代AD102所使用的4N工藝,它被視為一種增強(qiáng)版,盡管兩者都屬于5nm級別范疇。這種定制化的命名方式確實顯得有些復(fù)雜。GB202集成了高達(dá)922億的晶體管,與AD102的763億相比,增加了約21%。同時,其面積從616平方毫米擴(kuò)展至761平方毫米,增幅約為23.5%,但晶體管的密度卻略有降低。
在結(jié)構(gòu)方面,GB202保持了12組GPC(圖形處理集群)的設(shè)計,但每組GPC內(nèi)的TPC(紋理處理集群)數(shù)量從6組增加到了8組。而每組TPC依舊包含兩組SM(流多處理器),每組SM則維持了128個CUDA核心。因此,滿血版的GB202核心總計擁有24756個CUDA核心。不過,RTX 5090/5090D分別屏蔽了11組TPC,約占11%的比例。
值得注意的是,RTX 5090D在Tensor核心數(shù)量上并未進(jìn)行縮減,依舊保留了680個。這引發(fā)了推測,其AI算力的限制可能是通過底層軟件實現(xiàn)的。這不禁讓人好奇,是否存在破解這種限制的可能性。
在緩存方面,GB202的一級緩存從16MB提升至21.5MB,二級緩存也從72MB增加到96MB,這一增長比例與CUDA核心的增加比例保持一致,實現(xiàn)了同步擴(kuò)張。計算單元中間的豎向長條區(qū)域是編解碼器,滿血核心配備了4組第九代編碼引擎NVENC和4組第九代解碼引擎NVEDC。然而,RTX 5090/5090D分別僅啟用了3組和2組。
在顯卡的底部邊緣,可以看到PCIe 5.0 x16 PHY物理層和5條視頻輸出接口。而頂部、左側(cè)和右側(cè)邊緣則分布著GDDR7顯存控制器,每組32-bit,總共16組,構(gòu)成了512-bit的位寬。
在超頻測試中,Tony大叔成功將RTX 5090的核心頻率超至3390MHz,顯存等效頻率則達(dá)到了34GHz。這一成績在3DMark基準(zhǔn)測試中得到了驗證:Time Spy Extreme突破了3萬分,位列世界第三;Fire Strike Ultra接近3.7萬分,奪得世界第一;Port Royal更是超過了4.3萬分,同樣位居榜首。