【ITBEAR科技資訊】1月9日消息,英偉達據(jù)傳將在2024年第二季度為中國市場特別打造并量產一款AI芯片,以符合美國最新的出口管制規(guī)定。這款芯片被命名為H20,并被認為是這一系列中最強大的型號。然而,當被問及此事時,英偉達選擇了不發(fā)表任何評論。
除了高端的HGX H20之外,英偉達還有意推出兩款新的PCIe芯片,分別是L20和L2。這兩款芯片同樣被設計成能夠滿足美國的出口限制要求。不過,目前關于這兩款芯片的具體細節(jié)仍然保持神秘。
據(jù)ITBEAR科技資訊了解,H20芯片原本計劃在去年11月面市,但由于服務器制造商在集成過程中遭遇難題,這一計劃被迫延后。有知情人士透露,由于初期產能有限,英偉達將優(yōu)先滿足其主要客戶的需求。
根據(jù)行業(yè)分析機構SemiAnalysis的報告,盡管H20、L20和L2在算力上有所降低以符合新規(guī)定,但它們仍然保留了英偉達在AI領域的大部分功能特性。在LLM推理方面,這三款新芯片的性能預計將比現(xiàn)有的H100高出20%以上。
公開資料顯示,NVIDIA的H100 Tensor Core GPU采用了創(chuàng)新的Hopper架構,并基于臺積電的N4工藝制造,集成了驚人的800億個晶體管。與前代產品相比,H100在多專家(MoE)模型的訓練速度上提高了9倍。
此外,H100還配備了第四代Tensor Core和Transformer引擎(支持FP8精度),以及高度可擴展的NVLink互連技術。這項技術最多可以連接256個H100 GPU,與上一代相比,其帶寬速度提高了9倍,達到了驚人的900GB/s,這得益于HDR Quantum InfiniBand網絡的應用。