當(dāng)?shù)貢r間2025年1月6日下午,英偉達CEO黃仁勛在美國拉斯維加斯進行了CES2025媒體日的最后一場主題演講。在活動中,黃仁勛發(fā)布了包括RTX50系列顯卡、AI基礎(chǔ)模型、NIM微服務(wù)等一系列新產(chǎn)品與新技術(shù)。除此之外,黃仁勛也在現(xiàn)場帶來了英偉達的“One More Thing”——搭載Grace Blackwell芯片的NVIDIA Project Digits桌面AI超級計算機。
圖片來源:雷科技
作為CES2025報道的一部份,雷科技內(nèi)容團隊也親臨拉斯維加斯主題演講現(xiàn)場,為大家?guī)硪皇謭蟮馈?/p>
活動伊始,身著標(biāo)志性黑色皮衣的黃仁勛,先簡單回顧了英偉達1993年創(chuàng)立后的多個重要時間節(jié)點,比如英偉達在1999年發(fā)明了GPU;2006年推出了GeForce8800Ultra顯卡,并提出了CUDA(統(tǒng)一計算架構(gòu))這一概念,引領(lǐng)了后續(xù)的GPU算力發(fā)展。在AI領(lǐng)域,英偉達在十多年前就已經(jīng)洞察到AI的影響力,并一路伴隨著AI行業(yè)的發(fā)展。
到了AI時代,傳統(tǒng)基于CPU的說明式硬編碼開發(fā)模式,也應(yīng)該轉(zhuǎn)型為基于GPU、機器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的AI模式。而強大的GPU,正是這一轉(zhuǎn)變的起點。
就這樣,在幾乎沒有太多轉(zhuǎn)折的情況下,英偉達發(fā)布了CES2025期間的第一波新品——全新的Blackwell架構(gòu)與新一代RTX50系顯卡。
RTX50與DLSS4:AI賦能,“以下克上”
作為第一批產(chǎn)品,此次英偉達公布了RTX5090、RTX5080、RTX5070Ti、RTX5070四款桌面平臺GPU(受美國出口管制,中國市場的5090為RTX5090D)和對應(yīng)的四款移動平臺GPU。桌面GPU最快于今年1月發(fā)售,移動GPU最快3月發(fā)售。
以本次發(fā)布的旗艦RTX GPU——RTX5090為例,全新的RTX Blackwell核心讓RTX5090的晶體管數(shù)量從上一代的763億(Ada Lovelace架構(gòu))提升至920億,AI TOPS算力達3352,是RTX4090算力的253%。RTX5090還配備32GB GDDR7顯存,顯存帶寬高達1792GB/s,幾乎是RTX4090的兩倍。
圖片來源:雷科技
由于美國出口管制,英偉達無法在中國市場銷售RTX5090,取而代之是RTX5090D。和RTX5090相比,RTX5090D的AI TOPS算力為2375,是RTX5090的70%,是RTX4090D的200%。
圖片來源:雷科技
為了凸顯RTX50系的性能飛躍,黃仁勛也強調(diào)“RTX5070擁有和RTX4090相同的性能表現(xiàn)”。當(dāng)然了,熟悉英偉達這種跨代對比的朋友應(yīng)該早就猜到了,這里比的自然是特定游戲在開啟DLSS之后的表現(xiàn)。
在RTX50系顯卡上,英偉達同步推出了最新一代的DLSS4。簡單來說,DLSS4改用了由英偉達超級計算機訓(xùn)練的全新Transformer AI模型,提升了DLSS4的渲染精度和穩(wěn)定性。
另外,基于第五代Tensor Core的能力,RTX50系列的DLSS多幀生成技術(shù)(不是RTX40系的DLSS幀生成)也可以為每一個實際渲染幀額外生成最多3幀畫面,這對游戲平均幀率有相當(dāng)顯著的提升。
圖片來源:雷科技
不過發(fā)布會上英偉達似乎沒提到NVIDIA Reflex能否與DLSS多幀生成技術(shù)配合使用。關(guān)于“DLSS多幀生成是否會導(dǎo)致畫面響應(yīng)時間變長”這個問題,我們還需要等待進一步的信息補充。
圖片來源:雷科技
售價方面,桌面顯卡中,RTX5090美國定價1999美元、RTX5090D中國定價人民幣16499元。
Project DIGITS:AI計算的新起點
除了面向游戲玩家等終端消費者的RTX50系產(chǎn)品,黃仁勛還在現(xiàn)場發(fā)布了基于Blackwell架構(gòu)的NVLink72高速互聯(lián)技術(shù)產(chǎn)品。我知道大家對NVLink72都非常陌生,這里我嘗試用簡單的例子給大家講解一下。
簡單來說,大型計算設(shè)備往往會用多塊GPU,而要做的第一件事就是讓多塊GPU之間能互相連通。但常規(guī)通道的帶寬難以應(yīng)對多塊GPU之間的高速數(shù)據(jù)吞吐。而NVLink技術(shù),允許GPU之間點對點通信,不需要經(jīng)過本身就繁忙的PCIe總線。
圖片來源:雷科技
而Blackwell架構(gòu)下的NVLink72,內(nèi)置了18個NVLink交換機、“縫合”了72顆Blackwell GPU核心,將TF FP4性能提升至驚人的1.4ExaFLOPS,內(nèi)存容量也來到了14TB。
為了直觀展示NVLink72的“壯觀”設(shè)計,黃仁勛甚至在臺上“舉盾”表演,恰到好處的背景音樂也逗樂了現(xiàn)場觀眾,帶動了現(xiàn)場氣氛。
但這還算不上是英偉達此次主題演講的高光時刻。
在主題演講快結(jié)束時,黃仁勛提到了英偉達的第一臺AI超級計算機DGX-1。根據(jù)黃仁勛現(xiàn)場回憶,他們當(dāng)時把這臺DGX-1送給了OpenAI,而OpenAI確實也不負眾望,成為了如今AI發(fā)展的代表。
圖片來源:英偉達
但在2025年,AI已經(jīng)成為了科技發(fā)展的主戰(zhàn)場。像DGX-1這種昂貴、龐大的AI超算,從某種程度上其實也阻礙了AI的進步。對此,英偉達決定重新打造一款人人都能用上的AI超算。而最終得到的,就是這款名為Project Digits的桌面AI超級計算機。
圖片來源:雷科技
核心方面,Project Digits搭載的GB10超級芯片由Blackwell CPU和Grace CPU組成,其中Grace CPU包含20個ARM核心。此外,Project Digits也配備了128GB LPDDR5X內(nèi)存和4TB SSD。值得一提的是,Project Digits除了可以單獨使用,還可以兩個單元疊加使用,疊加狀態(tài)下甚至可以運行超過4000億參的模型。
根據(jù)英偉達介紹,Project Digits定價3000美元,最快5月上市。
NVIDIA Cosmo:推動AI訓(xùn)練進入新時代?
除了硬件外,英偉達在主題演講中還推出了多項“軟創(chuàng)新”,而其中重點當(dāng)屬世界基礎(chǔ)模型平臺——NVIDIA Cosmo。
簡單來說,Cosmo是一個可以模擬現(xiàn)實物理的模型平臺?;贑osmo背后2000萬小時視頻訓(xùn)練,開發(fā)者可以利用英偉達Omniverse創(chuàng)建虛擬的三維場景,再由Cosmo生成如同高度擬真的訓(xùn)練場景,以便開發(fā)者訓(xùn)練自己的模型。
以如今相當(dāng)常見的自動駕駛訓(xùn)練為例,“Omniverse-Cosmo”的流程可以在短時間內(nèi)打造多種復(fù)雜的多視角訓(xùn)練材料。同時開發(fā)者也可以隨時對訓(xùn)練素材進行調(diào)整,比如加入雨天、封路、低能見度等環(huán)境因素。
值得一提的是,Cosmo本身已經(jīng)學(xué)習(xí)了大量現(xiàn)實中已經(jīng)存在的事件,但如果生成的訓(xùn)練素材不符合實際需要,開發(fā)者甚至可以通過Prompt提示詞的方式,直接生成想要的訓(xùn)練場景,比如“在能見度極低的大雨天有行人突然橫穿車道”。
從此次發(fā)布的產(chǎn)品來看,英偉達在AI領(lǐng)域的進度已經(jīng)甩掉同行一大截,而在CUDA、Tensor的“封鎖下”,英偉達還將繼續(xù)引領(lǐng)高算力AI平臺,乃至整個AI行業(yè)的發(fā)展,成為AI產(chǎn)業(yè)名副其實的“柱石”。
圖片來源:英偉達
與此同時,Project Digits的出現(xiàn)也代表著傳統(tǒng)AI PC行業(yè)將迎來“算力節(jié)點”的沖擊,這對如今AI PC、AI手機等品類中“濫竽充數(shù)”的現(xiàn)象也將起到一定的凈化作用。長期來看,這將提高AI產(chǎn)品的準(zhǔn)入門檻,同時推動整個行業(yè)向更好發(fā)展。
但如果你對剛剛提到的這些AI技術(shù)完全不感興趣,其實也沒關(guān)系。對于你我這樣的游戲玩家來說,光是“549美元的RTX5070幀率比得上4090”這個好消息,就已經(jīng)足夠了。
(舉報)