近年來,全球科技巨頭紛紛加大對專用比較優(yōu)秀計(jì)算機(jī)的研發(fā)力度,力求在瞬息萬變的未來市場占據(jù)主導(dǎo)地位。例如,今年早些時(shí)候,算力巨頭英偉達(dá)推出了專為AI任務(wù)設(shè)計(jì)的企業(yè)級超算Eos,其在純AI計(jì)算領(lǐng)域的性能堪稱翹楚。與此同時(shí),特斯拉也不甘示弱,為加速自動(dòng)駕駛技術(shù)與人形機(jī)器人項(xiàng)目的研發(fā),其自主研發(fā)的比較優(yōu)秀計(jì)算機(jī)Dojo已于2023年7月開始落地投產(chǎn),其強(qiáng)大的算力已在全球范圍內(nèi)嶄露頭角。為何科技巨頭紛紛投身專用比較優(yōu)秀計(jì)算機(jī)?
來源:特斯拉
投身專用比較優(yōu)秀計(jì)算機(jī) ?只為實(shí)現(xiàn)理想計(jì)算效率
全球超算競賽持續(xù)白熱化,從不斷刷新的全球超算Top500推薦榜中可見一斑,尤其在短短六年間,比較強(qiáng)超算的性能增速超過了十倍。然而,除了圍繞運(yùn)算速度的激烈角逐,專用比較優(yōu)秀計(jì)算機(jī)領(lǐng)域逐漸嶄露頭角,成為一個(gè)不可忽視的焦點(diǎn)。這類超算在特定應(yīng)用場景下追求計(jì)算效率的較好的優(yōu)化,通過犧牲一定的通用性,實(shí)現(xiàn)針對特定問題的比較高性能表現(xiàn)和計(jì)算效率,從而在各專業(yè)細(xì)分領(lǐng)域展現(xiàn)無可比擬的競爭優(yōu)勢。不過,這類專用超算由于往往不會(huì)參選諸如超算Top500的榜單,一直以來都鮮少受到關(guān)注。
科技巨頭們紛紛研發(fā)專用超算,是因?yàn)樗鼈円庾R(shí)到只有針對特定領(lǐng)域或任務(wù)進(jìn)行深度定制化設(shè)計(jì),才能有效克服通用比較優(yōu)秀計(jì)算機(jī)在處理復(fù)雜計(jì)算密集型問題時(shí)可能出現(xiàn)的數(shù)據(jù)傳輸慢、內(nèi)存訪問效率低等瓶頸。通過定制硬件、軟件架構(gòu)和算法優(yōu)化,專用超算不僅在科學(xué)研究、工程技術(shù)等領(lǐng)域?qū)崿F(xiàn)重大突破,搶占技術(shù)高地,而且在保證高性能計(jì)算需求的同時(shí),降低了成本和能耗,滿足了企業(yè)和研究機(jī)構(gòu)追求科研創(chuàng)新與經(jīng)濟(jì)效益的雙重訴求。
近期,隨著AI大模型的興起,針對算力需求的AI超算也開始嶄露頭角,專門解決大規(guī)模密集AI訓(xùn)練和推理等計(jì)算難題,再次證實(shí)了專用超算在特定領(lǐng)域內(nèi)的巨大價(jià)值和潛力。
如果要談?wù)搶S贸?,那么在生物?jì)算領(lǐng)域最為知名的安騰(Anton)比較優(yōu)秀計(jì)算機(jī)無疑相當(dāng)代表性。它在執(zhí)行分子動(dòng)力學(xué)模擬任務(wù)時(shí)展現(xiàn)出了驚人的計(jì)算效率,甚至比通用超算Top500榜首的比較強(qiáng)超算 Frontier還要高出50倍以上。自2007年初次發(fā)布以來,安騰超算迭代升級了三次, 每一代在執(zhí)行分子動(dòng)力學(xué)模擬時(shí)的計(jì)算效率都要比同一時(shí)期比較強(qiáng)大的通用超算快約100倍。憑借其在高性能計(jì)算領(lǐng)域的出色表現(xiàn),安騰比較優(yōu)秀計(jì)算機(jī)曾兩度榮膺高性能計(jì)算領(lǐng)域的比較高榮譽(yù)——“ACM戈登貝爾獎(jiǎng)”。
安騰比較優(yōu)秀計(jì)算機(jī)憑什么能降維打擊通用超算?
在1683年的荷蘭,生物學(xué)家安東尼·范·列文虎克(Antonie van Leeuwenhoek)自制顯微鏡,為人類打開了認(rèn)識(shí)微觀生物結(jié)構(gòu)和生命現(xiàn)象的窗口。
三百多年后,一臺(tái)以他的名字命名的計(jì)算顯微鏡——專用比較優(yōu)秀計(jì)算機(jī)「安騰」(Anton),在美國的 D. E. Shaw 研究所橫空出世,極大地加速了分子運(yùn)動(dòng)模擬的計(jì)算過程,使得我們能在微秒級別上看到蛋白質(zhì)運(yùn)動(dòng)的「影片」,更進(jìn)一步打開了微觀世界的“視界”。而在超算安騰出現(xiàn)之前,我們只能看到蛋白質(zhì)運(yùn)動(dòng)的「照片」。
分子動(dòng)力學(xué)模擬(Molecular Dynamics Simulation, 簡稱MD)旨在揭示生物分子在原子級別上的運(yùn)動(dòng)規(guī)律和相互作用機(jī)制,為科研人員提供一個(gè)觀察藥物靶標(biāo)分子行為的超高分辨率窗口,進(jìn)而助力設(shè)計(jì)出更為準(zhǔn)確的藥物療法來應(yīng)對各種疾病。自上世紀(jì)80年代以來,計(jì)算效率一直是制約分子動(dòng)力學(xué)模擬技術(shù)在生物計(jì)算領(lǐng)域取得重大突破的關(guān)鍵瓶頸。由于分子行為模擬涉及海量的計(jì)算需求,在計(jì)算速度受限的情況下,能夠模擬的實(shí)際生物時(shí)間尺度相對較短。而安騰比較優(yōu)秀計(jì)算機(jī)(Anton)通過優(yōu)化計(jì)算能耗和提升計(jì)算效率,成功地延長了此類分子模擬的可持續(xù)時(shí)長,為科學(xué)研究開辟了新的途徑。
在安騰比較優(yōu)秀計(jì)算機(jī)的助力下,美國在基礎(chǔ)生命科學(xué)研究和生物制藥領(lǐng)域取得了顯著優(yōu)勢,許多基于安騰超算進(jìn)行的蛋白質(zhì)折疊和分子動(dòng)力學(xué)模擬的重要研究成果,已在Nature、Science、Cell等保障學(xué)術(shù)期刊上陸續(xù)發(fā)表,其科研成果的數(shù)量和質(zhì)量上的突出表現(xiàn),使得全球科研工作者都為之震撼。
不僅如此,在科研成果轉(zhuǎn)化為實(shí)際應(yīng)用的過程中,安騰比較優(yōu)秀計(jì)算機(jī)同樣發(fā)揮了關(guān)鍵作用。它極大地推動(dòng)了美國生物制藥領(lǐng)域的技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展,創(chuàng)造出可觀的市場價(jià)值,為新藥研發(fā)、疾病治療和醫(yī)療健康科技進(jìn)步注入了強(qiáng)大動(dòng)力。
Relay Therapeutics 這家美國公司成為藥物研發(fā)行業(yè)龍頭的背后,就離不開安騰超算。
新藥研發(fā)是個(gè)黃金賽道,但它回報(bào)周期長、成本高,在以往的經(jīng)驗(yàn)和認(rèn)知中,要研發(fā)一款新藥起碼要花上10年、10億美金。而且這個(gè)領(lǐng)域充滿了失敗,據(jù)一項(xiàng)來自麻省理工學(xué)院的研究統(tǒng)計(jì),2000年至2015年間開發(fā)的候選藥物中,有86% 以失敗告終。而 Relay 這家于2016年才創(chuàng)立的年輕公司,竟僅用了18個(gè)月、不到1億美金的投入,就確認(rèn)了一款膽管癌治療藥物 RLY-40089(一種高度選擇性的 FGFR2不可逆和口服小分子抑制劑)的結(jié)構(gòu),在藥物發(fā)現(xiàn)行業(yè)一鳴驚人。
Relay成為行業(yè)新星的背后,離不開安騰超算。從技術(shù)路徑上來說,Relay成功的關(guān)鍵,在于其創(chuàng)造性地提出了基于運(yùn)動(dòng)的藥物設(shè)計(jì)(Motion Based Drug Design(TM),MBDD)的方法,這種方法將以往的蛋白質(zhì)靜視圖轉(zhuǎn)變?yōu)榈鞍踪|(zhì)運(yùn)動(dòng)的動(dòng)態(tài)視圖,這有助于在突變蛋白中發(fā)現(xiàn)新的變構(gòu)袋,從而開展對難成藥靶點(diǎn)的研發(fā)。
而讓蛋白質(zhì)動(dòng)起來的,就是第二代安騰比較優(yōu)秀計(jì)算機(jī)(Anton2)。Relay 在公司成立伊始,就跟 D.E.Shaw 研究所建立了合作關(guān)系,他們的研發(fā)人員利用超算安騰對藥物靶點(diǎn)和成藥小分子的結(jié)構(gòu)進(jìn)行分子動(dòng)力學(xué)模擬和篩選設(shè)計(jì),從而突破了長時(shí)間大尺度分子動(dòng)力學(xué)模擬的計(jì)算瓶頸。
如果沒有安騰超算,恐怕 Relay 就不會(huì)那么快在2020年就登陸納斯達(dá)克,成為全球第二家上市的 AI 制藥公司。
另一個(gè)值得一提的案例,是在2020年3月27日,D. E. Shaw 研究所發(fā)布了由安騰超算模擬的、100微秒新冠病毒3CL 蛋白酶 MD 模擬動(dòng)畫及數(shù)據(jù)。這種蛋白酶是新冠藥物開發(fā)的一個(gè)熱門靶點(diǎn),安騰超算以最短的時(shí)間,當(dāng)時(shí)針對3CL 蛋白酶研發(fā)抑制劑提供了非常寶貴的數(shù)據(jù)。這長達(dá)100微秒的模擬結(jié)果,安騰這臺(tái)分子動(dòng)力學(xué)模擬專用超算只用了十幾天的時(shí)間完成計(jì)算,這是當(dāng)今全球比較強(qiáng)超算也難以企及的。
那么,為什么安騰比較優(yōu)秀計(jì)算機(jī)能算這么快?
顯而易見的原因就是它在設(shè)計(jì)之初就只瞄準(zhǔn)了一種計(jì)算問題,即加速分子動(dòng)力學(xué)模擬計(jì)算。從最初的規(guī)劃階段開始,安騰比較優(yōu)秀計(jì)算機(jī)就被定向設(shè)計(jì)為專注于解決單一但計(jì)算密集型的分子動(dòng)力學(xué)模擬問題,區(qū)別于通用型比較優(yōu)秀計(jì)算機(jī)需要應(yīng)對多種不同類型計(jì)算任務(wù)的特點(diǎn)。正是這種對特定計(jì)算領(lǐng)域的深度聚焦,使安騰在分子動(dòng)力學(xué)模擬方面突破了通用比較優(yōu)秀計(jì)算機(jī)的傳統(tǒng)性能極限。
安騰比較優(yōu)秀計(jì)算機(jī)在進(jìn)行分子動(dòng)力學(xué)模擬時(shí),尤其注重優(yōu)化針對通訊密集型并行計(jì)算問題的解決方案。不同于普遍服務(wù)于訪存密集型任務(wù)的GPU和通用比較優(yōu)秀計(jì)算機(jī),安騰采取了集成定制化ASIC專用芯片的方式,以比較大限度地減少無效數(shù)據(jù)傳輸,優(yōu)化數(shù)據(jù)存儲(chǔ)布局與本地計(jì)算操作,并簡化指令集以規(guī)避非必要的計(jì)算步驟。此外,超算安騰通過細(xì)粒度劃分芯片內(nèi)部的計(jì)算任務(wù),并根據(jù)不同精度需求進(jìn)行差異化調(diào)度和分配,使得在模擬分子間復(fù)雜相互作用時(shí),能夠?qū)崿F(xiàn)遠(yuǎn)高于一般計(jì)算平臺(tái)的有效計(jì)算性能。
同時(shí),安騰比較優(yōu)秀計(jì)算機(jī)的設(shè)計(jì)理念嚴(yán)格遵循了阿姆達(dá)爾定律。這一定律由計(jì)算機(jī)科學(xué)家Gene Amdahl于1967年提出,描述了在系統(tǒng)性能優(yōu)化過程中,某一組件的改進(jìn)對其整體性能提升的影響。D.E.Shaw研究所運(yùn)用這一原理,找準(zhǔn)了系統(tǒng)性能提升的關(guān)鍵瓶頸,有針對性地對軟硬件資源進(jìn)行集中優(yōu)化,以犧牲一定程度的通用性為代價(jià),換取在分子動(dòng)力學(xué)模擬計(jì)算領(lǐng)域的巨大性能提升。
中國超算之路:專用化大有可為
在世界超算的競技場中,中國顯然也是其中一支實(shí)力強(qiáng)大的隊(duì)伍。在2023年底的超算 Top500榜單統(tǒng)計(jì)中,中國比較強(qiáng)超算「神威·太湖之光」已經(jīng)達(dá)到了93.01PFlop/s(接近每秒十億億次浮點(diǎn)運(yùn)算)的速度。2014-2017年期間,「天河二號(hào)”和「神威·太湖之光」和「天河二號(hào)」還曾連續(xù)4年染指 Top500的榜首。這些閃亮的數(shù)字和名次都顯示了我國通用比較優(yōu)秀計(jì)算機(jī)沖擊科學(xué)研究頂峰的勢頭,但在特定科學(xué)領(lǐng)域的應(yīng)用上,國內(nèi)的整體步伐則顯得沒有那么快,而且應(yīng)用領(lǐng)域較單一,目前主要還是集中在量子計(jì)算或者人工智能方面,大規(guī)模產(chǎn)業(yè)化落地的成果也不是十分突出。
通用型超算固然算力驚人,但在特定的計(jì)算問題上,未必比得上規(guī)模更小的專用超算。對中國超算的未來發(fā)展而言,應(yīng)用于特定領(lǐng)域的專用超算無疑是一片藍(lán)海,這也是安騰比較優(yōu)秀計(jì)算機(jī)帶給我們的啟示。
不過,在專用超算這條賽道上,無論是從0到1還是跟跑世界先進(jìn)水平,都不是簡單之事。就以安騰比較優(yōu)秀計(jì)算機(jī)為例,目前全球僅有的幾臺(tái)機(jī)器分別位于美國紐約市 D. E. Shaw 研究所和匹茲堡超算中心,其他機(jī)構(gòu)需要提交美國國家科學(xué)院獨(dú)立專家委員會(huì)一份研究提案,可以排隊(duì)免費(fèi)使用,但并不接受其他國家學(xué)術(shù)機(jī)構(gòu)的申請,這已然形成了一種技術(shù)壟斷。
不僅是美國,其他有實(shí)力的國家也都在競相打造專用超算,比如英偉達(dá) CEO 黃仁勛最近大力鼓吹生物計(jì)算,開始和制造商諾和諾德(Novo Nordisk Foundation)聯(lián)手,在丹麥建立世界上比較強(qiáng)大的 AI 超算「Gefion」。在去年年底《自然》發(fā)布的“2024年值得關(guān)注的科學(xué)事件”中,專用比較優(yōu)秀計(jì)算機(jī)也有上榜:文章預(yù)測2024年研究人員啟動(dòng)歐洲頭個(gè)百億億次的比較優(yōu)秀計(jì)算機(jī)「Jupiter」,它每秒能執(zhí)行一千萬億次計(jì)算,后續(xù)將被應(yīng)用于構(gòu)建醫(yī)療目的的人類心臟和大腦數(shù)字孿生模型,以及進(jìn)行地球氣候的高分辨率模擬。美國也會(huì)安裝兩臺(tái)百億億次級別的比較優(yōu)秀計(jì)算機(jī),一臺(tái)是位于伊利諾伊州勒蒙的阿貢國家實(shí)驗(yàn)室的「Aurora」,用來繪制大腦神經(jīng)回路地圖;另一臺(tái)是位于加利福尼亞州勞倫斯利弗莫爾國家實(shí)驗(yàn)室的「El Capitan」,它將被用于模擬核武器爆炸效果。
總之,專用超算擺在我們面前的機(jī)遇是巨大的,同時(shí)這場科技的角逐顯然是激烈的,而研發(fā)之路必然道阻且長,我們可能會(huì)走得慢,但方向要走對,我們需要突出重圍,打造一臺(tái)屬于中國自己的「安騰」。
(推廣)