新年伊始,焱融科技再次在存儲性能領(lǐng)域取得突破。通過比較新的實驗室測試,焱融 AI 存儲產(chǎn)品——焱融追光全閃存儲一體機 F9000X,搭載 4 張 NVIDIA 400Gbps NDR InfiniBand 網(wǎng)卡,并結(jié)合自主研發(fā)的 Multi-Channel 多網(wǎng)卡聚合技術(shù),實現(xiàn)了 1.6Tb/s 的網(wǎng)絡(luò)帶寬聚合。3 節(jié)點存儲集群的測試結(jié)果顯示,性能達到 480GBps 帶寬和 750 萬 IOPS,相較市場同類產(chǎn)品提升了 3 倍。
這一突破性方案不僅大幅提升了性能,還有效降低了企業(yè)的總擁有成本:每 GB/s 成本減少 75%,每 IOPS 成本降低 30%。焱融科技憑借業(yè)界優(yōu)質(zhì)性能,為大規(guī)模 AI 計算提供了理想的存儲解決方案,加速了 AGI 時代的全面到來。
AI技術(shù)發(fā)展催生存儲性能升級
近年來,AI 技術(shù)特別是生成式 AI 迎來了飛速發(fā)展的黃金時期,不斷刷新著能力邊界。伴隨而來的是不斷提升的對數(shù)據(jù)處理速度和效率的要求,這也在引發(fā)一場新的存儲技術(shù)革命,對存儲性能的要求不斷提高。
AI模型復(fù)雜度不斷提升,存儲性能需求攀升
隨著生成式 AI 技術(shù)的持續(xù)創(chuàng)新,基礎(chǔ)大模型已邁入多模態(tài)時代,模型參數(shù)和計算復(fù)雜度均呈指數(shù)級增長。這種發(fā)展顯著提升了對存儲帶寬、容量和計算性能的要求。此外,隨著模型規(guī)模和訓練精度的不斷提升,Checkpoint 也變得更大,進一步加劇了對存儲吞吐量的壓力。如果存儲性能無法匹配模型的復(fù)雜度,整個 AI 訓練鏈條將因“存儲瓶頸”而受阻,影響模型迭代的效率。
而在模型推理環(huán)節(jié),更大的數(shù)據(jù)量、更龐大的模型,以及更長的上下文窗口能夠顯著提升人工智能的效能。然而,推理過程需要應(yīng)對大量并發(fā)請求且對響應(yīng)時間要求很高。同時,AI 模型頻繁更新和快速部署的需求也在不斷增加。這使得存儲系統(tǒng)必須具備低延遲和高吞吐量,以滿足不斷增長的應(yīng)用需求。
算力資源緊缺,GPU利用率提升需求迫切
AI 技術(shù)的發(fā)展推動了算力需求的急劇增長,GPU 等算力資源供需矛盾突出。隨著模型參數(shù)和復(fù)雜度的提升,模型訓練所需的 GPU 算力也隨之增加,目前比較高已擴展到萬卡乃至十萬卡規(guī)模的大型 AI 算力集群。但現(xiàn)有基礎(chǔ)設(shè)施在算力資源的可用性和優(yōu)化方面仍存在諸多挑戰(zhàn)。頻繁的 CheckPoint 數(shù)據(jù)寫入和斷點續(xù)訓造成算力資源閑置,算力集群的利用率偏低,增加了訓練時間和計算成本。
在這種情況下,若能夠?qū)?GPU 利用率提升,就相當于增加了額外算力,從而能在更短的時間內(nèi)完成更多的計算任務(wù),降低模型訓練的時間成本和經(jīng)濟成本。而提升 GPU 利用率的關(guān)鍵之一便是存儲性能的升級。通過提升數(shù)據(jù)加載效率、加快斷點續(xù)訓速度,顯著減少訓練過程中的等待時間,提升算力資源的使用效率。
焱融存儲全面激發(fā)大規(guī)模AI計算集群效能釋放
作為國內(nèi)專注于 AI 存儲領(lǐng)域的領(lǐng)先存儲解決方案提供商,焱融科技針對日益復(fù)雜的 AI 模型訓練和推理需求,不斷進行存儲技術(shù)創(chuàng)新,持續(xù)帶來存儲性能突破,以滿足不斷提升的 AI 計算需求。此次,焱融科技推出的 4 張 NVIDIA 400Gbps NDR InfiniBand 網(wǎng)卡的存儲方案,依托于焱融追光全閃存儲一體機 F9000X,通過公司自主研發(fā)的 Multi-Channel 多網(wǎng)卡聚合技術(shù),提供 1.6Tb/s 網(wǎng)絡(luò)帶寬接入能力,美好適配 PCIe 5.0 NVMe 閃存,大幅提升數(shù)據(jù)訪問速度和處理效率,釋放 AI 算力的全新潛能。
焱融全閃 F9000X3 節(jié)點存儲集群帶寬性能對比
上圖展示了焱融全閃分布式文件存儲 F9000X 分別搭載 2 張和 4 張 NVIDIA 400Gbps NDR InfiniBand 網(wǎng)卡的 3 節(jié)點存儲集群的實測性能??梢钥吹?,采用 4 張 InfiniBand 400Gbps 網(wǎng)卡的焱融全閃 F9000X 存儲方案,3 節(jié)點存儲集群的帶寬性能達到了 480GBps, 相較于 2 卡方案性能提升了近 80%,相比市場同類產(chǎn)品性能提升 3 倍;同時,其 IOPS 性能也達到了 750 萬,保持業(yè)界領(lǐng)先水平。
在性能大幅提升的同時,用戶的成本效益也得到了顯著優(yōu)化,年省算力成本達到萬級。每 GB/s 的成本降低了 75%,每 IOPS 的成本降低了 30%。這一成本優(yōu)勢意味著,企業(yè)在享受高性能存儲帶來的業(yè)務(wù)效率和競爭力提升的同時,還能夠有效降低總體擁有成本,是大規(guī)模 AI 計算場景下的理想全閃存儲解決方案。
先進的 AI 存儲需要緊跟技術(shù)發(fā)展的步伐,滿足日益增長的計算需求,提升用戶體驗。繼在國際保障 AI 測評舞臺 MLPerf Storage 中嶄露頭角后,焱融全閃 F9000X 再次實現(xiàn)性能飛躍。這不僅再次彰顯了焱融科技在 AI 高性能存儲領(lǐng)域的領(lǐng)先地位,也為行業(yè)樹立了新的標桿,為不斷迭代的大規(guī)模 AI 模型訓練和推理等各類復(fù)雜計算任務(wù)提供強有力的支撐。面向未來,焱融科技將繼續(xù)深耕 AI 存儲技術(shù)創(chuàng)新,持續(xù)提供領(lǐng)先的 AI 存儲產(chǎn)品,為 AI 大模型、智算中心、自動駕駛、生信分析、金融量化等領(lǐng)域提供更強大的數(shù)據(jù)存儲基座,推動這些領(lǐng)域的持續(xù)發(fā)展和創(chuàng)新。
(推廣)