對(duì)于傳統(tǒng)計(jì)算機(jī)架構(gòu)來(lái)說(shuō),想要每秒分析多達(dá) 10 億次質(zhì)子碰撞、或數(shù)萬(wàn)次極其復(fù)雜的鉛碰撞,顯然并非易事。隨著大型強(qiáng)子對(duì)撞機(jī)(LHC)Run 3 數(shù)據(jù)處理需求的飆升,歐洲核子研究中心(CERN)也正通過四個(gè)大型實(shí)驗(yàn)項(xiàng)目,來(lái)探索通過 GPU 改善其計(jì)算基礎(chǔ)設(shè)施的方法。
據(jù)悉,LHC 實(shí)驗(yàn)的最新升級(jí),即將于 2023 年投入使用。
考慮到傳統(tǒng)中央處理器(CPU)難以應(yīng)付新的計(jì)算挑戰(zhàn),目前正有四個(gè)大型項(xiàng)目在嘗試采用 GPU 并行計(jì)算方案。
圖上圖所示,某 Run 3 候選 HLT 節(jié)點(diǎn)裝配了雙路 AMD Milan 64 核 CPU + 兩張英偉達(dá) Tesla T4 GPU 。
GPU 在圖像處理等應(yīng)用場(chǎng)景下具有極高的效率,最初只是為了加速計(jì)算機(jī) 3D 圖形渲染而打造。
但在過去的幾年里,LHC 實(shí)驗(yàn)、全球 LHC 計(jì)算網(wǎng)格(WLCG)和 CERN openlab 就已展開過這方面的研究嘗試。
而在高能物理應(yīng)用中加大 GPU 的計(jì)算投入,不僅能夠提升 CERN 計(jì)算基礎(chǔ)設(shè)施的質(zhì)量和規(guī)模,還有助于提升系統(tǒng)的整體能效。
CERN IT 部門負(fù)責(zé)人 Enrica Porcari 表示:
LHC 雄心勃勃的升級(jí)計(jì)劃,帶來(lái)了一系列令人興奮的計(jì)算挑戰(zhàn)。好消息是,GPU 能夠在機(jī)器學(xué)習(xí)(DL)方面提供有力的支撐,幫助研究人員解決許多問題。
自 2020 年以來(lái),CERN IT 部門提供了對(duì)數(shù)據(jù)中心 GPU 平臺(tái)的訪問權(quán)限,其已被證明在一系列應(yīng)用中很受歡迎。
更重要的是,CERN openlab 正通過與工業(yè)界的合作研發(fā)項(xiàng)目,對(duì)將 GPU 用于機(jī)器學(xué)習(xí)一事展開鄭重深入的調(diào)查。
與此同時(shí),CERN 的科學(xué)計(jì)算協(xié)作小組,目前正努力幫助移植和優(yōu)化實(shí)驗(yàn)中的關(guān)鍵代碼。
多年前,ALICE 項(xiàng)目就率先在其“高級(jí)觸發(fā)在線計(jì)算機(jī)農(nóng)場(chǎng)”(HLT)中使用了 GPU,但也是迄今唯一大規(guī)模運(yùn)用 GPU 的實(shí)驗(yàn)。
而新升級(jí)的 ALICE 探測(cè)器擁有超過 120 億個(gè)連續(xù)讀取的電子傳感器元件,每秒可生成超過 3.5 TB 的數(shù)據(jù)流。即使經(jīng)過一級(jí)數(shù)據(jù)處理,數(shù)據(jù)流量仍高達(dá) 600 GB/s 。
這些數(shù)據(jù)會(huì)被放到具有 250 個(gè)節(jié)點(diǎn)的 HPC 農(nóng)場(chǎng)展開在線分析,每個(gè)節(jié)點(diǎn)包含 8 路 GPU + 32 核 CPU 。
大多數(shù)情況下,可將單個(gè)粒子檢測(cè)器信號(hào)組裝成粒子軌跡的軟件(事件重建)工作,現(xiàn)均已適應(yīng)了在 GPU 上并行工作。
從 2022 年開始,LHCb 實(shí)驗(yàn)將處理 4 TB/s 的數(shù)據(jù)流,并對(duì)每秒篩選出的最有趣的 10 GB/s LHC 碰撞數(shù)據(jù)展開物理分析。
其獨(dú)特方法是不卸載工作,而是分析 GPU 上每秒 3000 萬(wàn)個(gè)粒子束交叉點(diǎn)。自 2018 年以來(lái),隨著 CPU 處理的改進(jìn),LHCb 的探測(cè)器重建能效也提升了將近 20 倍。
目前研究人員正期待著使用 2022 年的首批新系統(tǒng)調(diào)試數(shù)據(jù),并在此基礎(chǔ)上讓升級(jí)后的 LHCb 探測(cè)器得以發(fā)揮其完整的物理潛力。
(舉報(bào))