來源:機(jī)器之心
機(jī)器之心報(bào)道
編輯:陳萍、澤南
Frontier 的算力達(dá)到了 1.102 Exaflops(10^18),實(shí)現(xiàn)了每秒百億億次運(yùn)算。
5 月 30 日,第 59 屆 ISC 2022(國際超算大會(huì))發(fā)布最新 Top500 榜單,美國田納西州橡樹嶺國家實(shí)驗(yàn)室(ORNL)的 Frontier 成為第一個(gè)真正突破 Exascale 大關(guān)的超算,性能達(dá)到 1.102 exaflops,該榜單正式標(biāo)志著超級計(jì)算新時(shí)代的到來。
Frontier 超算突破 Exaflops
Frontier 由 74 個(gè) Cray EX 機(jī)柜組成,可容納 9408 個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)配備一個(gè) AMD Milan「Trento」7A53 Epyc CPU 和四個(gè) AMD Instinct MI250X GPU,GPU 總數(shù)為 37632。節(jié)點(diǎn)通過 HPE 的 Slingshot-11 互連連接。每個(gè)節(jié)點(diǎn) CPU 支持 512GiB DDR4 內(nèi)存,跨節(jié)點(diǎn)支持 512GiB HMB2e(每 GPU 128GiB)內(nèi)存。
Frontier 的 Linpack 性能為 1.102 exaflops,比 Top500 中的排名靠前的 7 個(gè)系統(tǒng)加起來還要快。來自田納西州橡樹嶺國家實(shí)驗(yàn)室的 Thomas Zacharia 表示:「我們不能低估 0.1 的差距,一個(gè) 0.1 代表 100petaflops,0.1 看起來很小,很容易被四舍五入。但每個(gè)小數(shù)點(diǎn)都代表著一種巨大的能力?!?/p>
Frontier 在 OLCF(美國橡樹嶺國家實(shí)驗(yàn)室領(lǐng)先運(yùn)算機(jī)構(gòu))占地 372 平方米,聚合了 9.2 PB 的內(nèi)存(4.6 PB 的 DDR4 和 4.6 PB 的 HBM2e),有 37 PB 的節(jié)點(diǎn)本地存儲(chǔ),并可訪問 716 PB 的中心范圍存儲(chǔ)。
Top10 榜單
四次登頂?shù)娜毡境?strong>富岳本次排在第二位,性能 442 petaflops,其采用 Arm A64FX 系統(tǒng)。
部署在芬蘭國家超算中心的 LUMI 排名第三,使其成為歐洲最強(qiáng)大超算系統(tǒng)。LUMI 實(shí)現(xiàn)了 151.90 Linpack petaflops,理論峰值可達(dá)到 214.3 petaflops,這個(gè)數(shù)字大約為 71% 的 Linpack 效率。
IBM 的 Summit 排名第四、Sierra 排名第五;中國的天河 1A,排名第六;美國勞倫斯伯克利實(shí)驗(yàn)室的國家能源研究科學(xué)計(jì)算中心(NERSC) 的 Perlmutter HPE Cray EX 排名第七;緊隨其后的是英偉達(dá) Selene 排在第八位;中國的天河 2A 排名第九。
部署在法國國家大型計(jì)算中心的 Adastra 系統(tǒng)排名第十,其 Linpack 實(shí)現(xiàn) 46.1 Linpack petaflops,理論峰值為 61.6 千萬億次,Linpack 效率為 75%。
值得一提的是,Top10 中新上榜的 3 臺(tái)新系統(tǒng)(美國的 Frontier、芬蘭的 LUMI 和 法國的 Adastra)都是采用了 HPE Cray EX235a 架構(gòu)。
僅僅在四年前,也就是 2018 年 6 月,整個(gè) Top500 榜單首次以 1.22 exaflops 的總和超過 exaflops 大關(guān)?,F(xiàn)在 Frontier 的單個(gè)系統(tǒng)算力就達(dá)到了 1.102 Exaflops。
本次 Top500 榜單共迎來 39 個(gè)新系統(tǒng),地域分布廣泛。美國最多,有 9 個(gè),其次是德國的 5 個(gè)。近十年來,中國首次沒有新系統(tǒng)上榜,盡管如此,中國仍然擁有列表中最多的系統(tǒng):173 個(gè),而美國系統(tǒng)數(shù)量為 127 個(gè),就系統(tǒng)數(shù)量而言,美國位居第二。然而,美國由于 Frontier 的性能顯著拉長了領(lǐng)先優(yōu)勢。
中國的超算進(jìn)展
在國內(nèi)的超級計(jì)算機(jī)計(jì)劃中已有三個(gè) E 級超算上馬,這些系統(tǒng)本質(zhì)上不是由 Top500 或 HPL 基準(zhǔn)驗(yàn)證的,而是由戈登貝爾獎(jiǎng)。其中一個(gè)是無錫超級計(jì)算中心運(yùn)營的神威太湖之光(新機(jī)位于青島)。
另一個(gè)系統(tǒng)天河三號位于天津市。Tianhe-3 基于 Phytium 2000+ FTP Arm 芯片和 Matrix 2000+ MTP 加速器。該系統(tǒng)據(jù)報(bào)道已于去年秋天完成,估計(jì)可以提供 1.7 exaflops 的峰值性能,在 Linpack 上提供了略高于 1.3 exaflops 的性能。
在漢堡舉行的 ISC 2022 之前,有消息人士表示,中國正計(jì)劃在 2025-2026 年的時(shí)間范圍內(nèi)制造一臺(tái) 10 exaflops 的機(jī)器。另有消息人士稱,有兩臺(tái)目標(biāo) 2025 年上線的 10 exaflops 系統(tǒng)正在開發(fā)中,但現(xiàn)在更大的可能是在 2026 年只推出一臺(tái) 10 exaflops 系統(tǒng)。與太湖之光一樣,它將是神威架構(gòu),即基于 Alpha 核心。
上海交通大學(xué)網(wǎng)絡(luò)信息中心副主任,HPC 專家林新華表示,Top500 已成為事實(shí)上的實(shí)體名單。「中國頂級超級計(jì)算機(jī)的供應(yīng)商和主機(jī)中心都在名單上,」他表示?!高M(jìn)入 Top500 是為了促進(jìn)國際合作,但結(jié)果卻適得其反。我們提交 Top500 并不是為了維持聯(lián)系?!?/p>
近年來,在 Top500 基準(zhǔn)上的幾家中國系統(tǒng)的支持實(shí)體和供應(yīng)商確實(shí)被列入了美國實(shí)體名單。
技術(shù)供應(yīng)商
聯(lián)想是 Top500 榜單上的???,其參與基準(zhǔn)測試的新系統(tǒng)數(shù)量最多(17 個(gè)),在 14 個(gè)新系統(tǒng)中,HPE 的數(shù)量位居第二(其中 7 個(gè)采用 AMD+AMD 節(jié)點(diǎn),通過 Slingshot-11 連接,包括 三個(gè) NNSA/LLNL 系統(tǒng))。在所有 500 個(gè)系統(tǒng)中,按純系統(tǒng)數(shù)量計(jì)算的陣容是聯(lián)想(180 個(gè))、HPE(84 個(gè))和浪潮(50 個(gè))。按性能份額比較的話,排名依次為:HPE(18.6%)、富士通(18.1%)和聯(lián)想(15.1%)。
名單上沒有新的英偉達(dá)系統(tǒng)。其自用的 Eos 超算將會(huì)展示它的最新實(shí)力,但為 Eos 提供算力的 DGX H100 節(jié)點(diǎn)預(yù)計(jì)直到下個(gè)季度才會(huì)發(fā)貨。
英偉達(dá)是該列表中 19 個(gè)系統(tǒng)的制造商,并且它合作參與了另外 5 個(gè)系統(tǒng)的構(gòu)建,包括第五位的 Sierra、第 22 位的 Chervonenkis 、第 30 位的 Lassen、第 40 位的 Galushkin 和第 43 位的 Lyapunov。
英特爾聲稱在 Top500 排行榜中占有 77.40% 的份額,這個(gè)數(shù)字低于六個(gè)月前的 81.60%。AMD 共有 94 個(gè)系統(tǒng),在該列表中的份額已從六個(gè)月前的 14.60% 增長到 18.80%。
IBM 的超算數(shù)量仍然未變是 9 個(gè):第 4 名的 Summit、第 5 名的 Sierra、第 21 名的 Marconi-100、第 30 名的 Lassen、第 33 名的 PANGEA II、第 24 名的 AiMOS、第 160 名的 HPC2 第 205 名的 SuperMUC Phase2(與聯(lián)想合作)和第 303 名的 Longhorn。