一個(gè)歐洲大學(xué)生團(tuán)隊(duì)組裝出第一臺(tái)能夠平衡功耗和性能的 RISC-V 超級(jí)計(jì)算機(jī)。
更重要的是,它展示了 RISC-V 在高性能計(jì)算方面的巨大潛力,為歐洲擺脫對(duì)美國(guó)芯片技術(shù)的依賴(lài)提供了機(jī)會(huì)。
“Monte Cimone”集群不會(huì)很快用于處理大規(guī)模的天氣模擬等,因?yàn)樗皇且慌_(tái)實(shí)驗(yàn)機(jī)器。
這臺(tái)設(shè)備由博洛尼亞大學(xué)和意大利最大的超級(jí)計(jì)算中心 CINECA 的人員構(gòu)建,六節(jié)點(diǎn)集群設(shè)計(jì),旨在展示除浮點(diǎn)能力之外的各種 HPC 性能元素。
它使用 SiFive 的 Freedom U740 片上系統(tǒng)RISC-V 的電源模塊,這個(gè)2020 年推出的 SoC 有五個(gè) 64 位 RISC-V CPU 內(nèi)核——四個(gè) U7 應(yīng)用程序內(nèi)核和一個(gè) S7 系統(tǒng)管理內(nèi)核——2MB 二級(jí)緩存、千兆以太網(wǎng)以及各種外圍設(shè)備和硬件控制器。
它可以運(yùn)行在大約 1.4GHz頻率,以下是 Monte Cimone 的組件以及速度:
六臺(tái)雙板服務(wù)器,外形尺寸為 4.44 厘米 (1U) 高、42.5 厘米寬、40 厘米深。每塊板都遵循行業(yè)標(biāo)準(zhǔn) Mini-ITX 外形尺寸(每 170 毫米 170 毫米);
每塊主板配備一個(gè) SiFive Freedom U740 SoC 和 16GB 的 64 位 DDR 內(nèi)存,運(yùn)行速度為 1866s MT/s,以及一個(gè)運(yùn)行速度為 7.8 GB/s 的 PCIe Gen 3 x8 總線、一個(gè)千兆以太網(wǎng)端口和 USB 3.2 Gen 1 接口;
每個(gè)節(jié)點(diǎn)都有一個(gè) M.2 M-key 擴(kuò)展槽,由操作系統(tǒng)使用的 1TB NVME 2280 SSD 占用。每塊板上都插有一張 microSD 卡,用于 UEFI 啟動(dòng);
每個(gè)節(jié)點(diǎn)內(nèi)部集成了兩個(gè) 250 W 電源,以支持硬件和未來(lái)的 PCIe 加速器和擴(kuò)展板。
每個(gè)節(jié)點(diǎn)的俯視圖,顯示了兩個(gè) SiFive Freedom SoC 板
Freedom SoC 主板本質(zhì)上是 SiFive 的 HiFive Unmatched 主板。正如大多數(shù)超級(jí)計(jì)算機(jī)使用的那樣,六個(gè)計(jì)算節(jié)點(diǎn)中的兩個(gè)配備了 Infiniband 主機(jī)通道適配器 (HCA)。目標(biāo)是部署 56GB/s Infiniband 以允許 RDMA 實(shí)現(xiàn) I/O 性能。
這對(duì)于一個(gè)年輕的架構(gòu)來(lái)說(shuō)是雄心勃勃的,而且并非沒(méi)有一些小問(wèn)題。
“供應(yīng)商目前僅支持 PCIe Gen 3 通道,”集群團(tuán)隊(duì)寫(xiě)道?!暗谝粋€(gè)實(shí)驗(yàn)結(jié)果表明,內(nèi)核能夠識(shí)別設(shè)備驅(qū)動(dòng)程序并掛載內(nèi)核模塊來(lái)管理 Mellanox OFED 堆棧。由于尚未確定軟件堆棧和內(nèi)核驅(qū)動(dòng)程序的不兼容性,我們無(wú)法使用 HCA 的所有 RDMA 功能。
盡管如此,我們還是成功地在兩個(gè)板之間以及一個(gè)板和一個(gè) HPC 服務(wù)器之間運(yùn)行了 IB ping 測(cè)試,表明完全支持 Infiniband 是可行的。
”事實(shí)證明,HPC 軟件堆棧比人們想象的要容易?!拔覀?cè)?Monte Cimone 上移植了在生產(chǎn)環(huán)境中運(yùn)行 HPC 工作負(fù)載所需的所有基本服務(wù),即 NFS、LDAP 和 SLURM 作業(yè)調(diào)度程序。將所有必要的軟件包移植到 RISC-V 相對(duì)簡(jiǎn)單。
該集群最終將成為這將為進(jìn)一步測(cè)試 RISC-V 平臺(tái)本身及其與其他架構(gòu)良好配合的能力鋪平道路,這是一個(gè)重要元素因?yàn)橹辽僭谖磥?lái)幾年內(nèi)我們不太可能看到百億億級(jí)的 RISC-V 系統(tǒng)。
現(xiàn)在,就連英特爾也在關(guān)注RISC-V的未來(lái)。