今天,NVIDIA(英偉達(dá)) 宣布,與 xAI 合作打造的 Colossus 超級計算機(jī)集群正式上線,這可是全球最強(qiáng)AI訓(xùn)練集群Colossus,整整由10萬顆 NVIDIA Hopper GPU 組成。
這個龐然大物之所以能達(dá)到這樣的規(guī)模,得益于 NVIDIA Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺的支持。這個平臺專門為多租戶、超大規(guī)模的 AI 工廠設(shè)計,能夠通過標(biāo)準(zhǔn)以太網(wǎng)實現(xiàn)遠(yuǎn)程直接內(nèi)存訪問,提供卓越的性能。
Colossus 主要用于訓(xùn)練 xAI 的 Grok 系列大型語言模型,同時還為 X Premium 用戶提供聊天機(jī)器人服務(wù)。更令人興奮的是,xAI 正在計劃將 Colossus 的規(guī)模翻倍,屆時將達(dá)到20萬顆 NVIDIA Hopper GPU。
NVIDIA 的高級副總裁 Gilad Shainer 表示,AI 已經(jīng)成為各行各業(yè)的關(guān)鍵需求,因此對性能、安全性、可擴(kuò)展性和成本效率的要求也在不斷提升。而 Spectrum-X 平臺的出現(xiàn),則為像 xAI 這樣的創(chuàng)新者提供了更快的數(shù)據(jù)處理、分析和執(zhí)行能力,從而加速 AI 解決方案的開發(fā)、部署和上市時間。
埃隆?馬斯克也對此表示贊賞,他稱 Colossus 為世界上最強(qiáng)大的訓(xùn)練系統(tǒng),稱贊了 xAI 團(tuán)隊、NVIDIA 以及他們的眾多合作伙伴的努力。值得一提的是,Colossus 的搭建過程相當(dāng)高效,僅用了122天就完成,而一般情況下,類似規(guī)模的系統(tǒng)可能需要數(shù)月甚至數(shù)年的時間才能完成。從第一臺機(jī)架進(jìn)入到培訓(xùn)開始,整個過程只花了19天。
在這個超級計算機(jī)的支持下,Spectrum-X 平臺可以提供高達(dá)400Gbps 的帶寬,顯著提高數(shù)據(jù)傳輸速率,降低延遲。這個特性對那些需要快速數(shù)據(jù)處理和實時分析的企業(yè)至關(guān)重要。此外,Spectrum-X 還經(jīng)過優(yōu)化,專門支持 AI 應(yīng)用,使數(shù)據(jù)路由和管理更為智能,從而提升整體系統(tǒng)性能。
Colossus 架構(gòu)的設(shè)計旨在高效擴(kuò)展,以應(yīng)對現(xiàn)代應(yīng)用產(chǎn)生的海量數(shù)據(jù)。同時,Spectrum-X 還關(guān)注可持續(xù)發(fā)展,力求在維持高性能的同時,減少數(shù)據(jù)中心的能源消耗,幫助組織降低碳足跡。
備注:資訊來源AIbase基地劃重點:
?? Colossus 超級計算機(jī)由100,000個 NVIDIA Hopper GPU 組成,正在訓(xùn)練大型語言模型,并計劃擴(kuò)大至200,000個 GPU。
? Spectrum-X 網(wǎng)絡(luò)平臺提供高達(dá)400Gbps 的帶寬,優(yōu)化了數(shù)據(jù)傳輸和實時分析能力。
?? 該平臺關(guān)注可持續(xù)性,旨在減少數(shù)據(jù)中心的能源消耗,同時保持高性能。
AiBase副業(yè)搞錢交流群
歡迎大家加入AiBase交流群, 掃碼進(jìn)入,暢談AI賺錢心得,共享最新行業(yè)動態(tài),發(fā)現(xiàn)潛在合作伙伴,迎接未來的賺錢機(jī)遇!。