在 2021 年的架構(gòu)日活動(dòng)期間,英特爾披露了有關(guān)其即將推出的 Xe HPG 顯卡的諸多新細(xì)節(jié),包括一份完整的路線圖。首先,代號(hào)為“Alchemist”的英特爾 DG2 獨(dú)顯將于 2022 年 1 季度上市。緊隨其后的是 Xe2、Xe3 和 Xe NG,分別被稱作 Battlemage、Celestial 和 Druid 。
(圖 via WCCFTech)
英特爾表示:作為本次架構(gòu)變革的一部分,其重新定義了“計(jì)算構(gòu)建塊”,并將之作為 Xe 架構(gòu)的基礎(chǔ)。
該公司還借此機(jī)會(huì)更新了一些命名,比如大家不再聽到所謂的“執(zhí)行單元”(EU)。理由是隨著數(shù)字變得越來越大,代際之間的推理對(duì)比都會(huì)變得相當(dāng)麻煩。
Xe GPU 核心中包括了高效的算數(shù)、緩存、負(fù)載存儲(chǔ)邏輯等單元,其中算術(shù)單元整合了用于傳統(tǒng)浮點(diǎn)、整數(shù)向量運(yùn)算,以及用于加速、卷積和矩陣運(yùn)算的引擎,此類引擎在 AI 工作負(fù)載中較為常見。
參照新的標(biāo)準(zhǔn),一個(gè)基礎(chǔ)的 Xe Alchemist GPU 核心單元,將擁有 16 組“向量引擎”(256 bit)和 16 組“矩陣引擎”(1024 bit)。
每個(gè) Xe Core 都有自己的專用采樣器、幾何圖形、緩存,以及共享的像素后端。4 個(gè) Xe 核心單元(Xe Core)將構(gòu)成一個(gè)渲染切片(Render Slice),且每個(gè)渲染切片也都有自己的光線追蹤(RT)單元。
初代 Xe HPG GPU 將擁有 8 個(gè)切片,每個(gè)由 4 個(gè) Xe Core 組成,總計(jì) 512(8×4×16)的向量 / 矩陣。
對(duì)于技術(shù)愛好者來說,這點(diǎn)與之前的執(zhí)行單元(EU)也沒有多大差別。假設(shè)基礎(chǔ)架構(gòu)是相通的,那它還是 4096 個(gè) ALLU(512*8)。
臺(tái)積電業(yè)務(wù)發(fā)展高級(jí)副總裁 Kevin Zhang 博士
值得一提的是,為追求更高的 GPU 性能 / 功耗表現(xiàn),臺(tái)積電對(duì)英特爾 Alchemist 獨(dú)顯選擇了該公司的 N6 制程工藝表示相當(dāng)歡迎。
借助臺(tái)積電 N6 工藝,Alchemist GPU 將可在性能、密度和能效之間實(shí)現(xiàn)最佳的平衡,是現(xiàn)代 GPU 代工的理想選擇。
如果一切順利,采用臺(tái)積電 N6 工藝制造的英特爾 Xe HPG 產(chǎn)品線,將具有能耗和晶體管密度方面的顯著優(yōu)勢(shì),從而在正式上市時(shí)取得不錯(cuò)的銷量。
據(jù)悉,英特爾 Xe HPG 架構(gòu)將能夠?qū)崿F(xiàn) 1.5 倍于 Xe LP 的時(shí)鐘速率,且每瓦性能也是后者的 1.5 倍。
鑒于 Xe LP GPU 已經(jīng)跑到 1.4 GHz,這意味著我們有望迎來 2.1 GHz 的 Xe HPG GPU 時(shí)鐘速率。
另一方面,英特爾也將能夠在不消耗額外功耗的情況下,從新架構(gòu)中榨取出更多的性能。或在性能不變的基礎(chǔ)上,降低新一代 GPU 的功耗。
(舉報(bào))