11月19日,在世界超算界的頂級盛會SC20期間,多名國際專家聯(lián)合發(fā)布了新一期IO500榜單。鵬城實(shí)驗(yàn)室等單位聯(lián)合研制的“鵬城云腦II”分別以7043.99和1129.75的得分,位居IO500總榜榜首和10節(jié)點(diǎn)榜單榜首。這是國內(nèi)系統(tǒng)首次占據(jù)該榜單榜首位置。
據(jù)了解,在大規(guī)模算力系統(tǒng)設(shè)計(jì)中,存儲系統(tǒng)的性能日益受到關(guān)注。IO500榜單是高性能計(jì)算領(lǐng)域針對存儲性能最權(quán)威的世界排行榜之一。自2017年11月開始,IO500榜單在高性能計(jì)算領(lǐng)域的頂級會議(美國的SC和德國的ISC大會)上發(fā)布。
為證明“鵬城云腦II”項(xiàng)目的世界級先進(jìn)算力,鵬城實(shí)驗(yàn)室、清華大學(xué)和華為技術(shù)有限公司共同開展IO500測試工作。對系統(tǒng)軟硬件性能進(jìn)行了極限測試,包括數(shù)據(jù)帶寬BW(GiB/S)和元數(shù)據(jù)性能MD(KIOP/S)兩大部分,需要具有各種規(guī)模下的良好擴(kuò)展性和穩(wěn)定性。
本次“鵬城云腦II”的存儲系統(tǒng)基于清華大學(xué)計(jì)算機(jī)系開發(fā)的超算緩存文件系統(tǒng)MadFS研制,針對“鵬城云腦II”的硬件特征,提出了基于RUST語言的高可擴(kuò)展并發(fā)訪問、大粒度數(shù)據(jù)緩存/旁路訪問、數(shù)據(jù)訪問/落盤流水化、零拷貝極速RPC處理技術(shù)等創(chuàng)新方法。
IO500的兩項(xiàng)桂冠反映了“鵬城云腦II”面向?qū)嶋H應(yīng)用的設(shè)計(jì)原則。不但全系統(tǒng)得分四倍于上屆冠軍,實(shí)現(xiàn)大幅度超越,在小規(guī)模數(shù)據(jù)吞吐的10節(jié)點(diǎn)榜單上,得分也超過上屆冠軍近一半,成為首個(gè)10節(jié)點(diǎn)得分超過1000分的系統(tǒng)。這意味著對于各種規(guī)模的人工智能應(yīng)用,“鵬城云腦II”均能提供世界領(lǐng)先的數(shù)據(jù)吞吐能力和頂級算力。據(jù)悉,“鵬城云腦II”于2020年10月建成試運(yùn)行,擁有超過1000P OPS的人工智能算力,即將服務(wù)于從基礎(chǔ)研究到產(chǎn)業(yè)賦能的廣泛領(lǐng)域。
公開資料顯示,“鵬城云腦Ⅱ”系統(tǒng)的AI計(jì)算子系統(tǒng)包含4096顆AI處理器,提供理論上1E OPS FP16和2E OPS INT8的AI運(yùn)算能力。通用算力由基于ARM架構(gòu)的2048顆CPU組成,每個(gè)CPU提供不少于0.49T Flops的通用算力。