突破算力限制！Meta開(kāi)源“記憶層”，重塑Transformer架構(gòu)大模型

2025-01-03 13:44 · 稿源： ?AIGC開(kāi)放社區(qū)公眾號(hào)

聲明:本文來(lái)自于微信公眾號(hào) AIGC開(kāi)放社區(qū)，作者:AIGC開(kāi)放社區(qū)，授權(quán)站長(zhǎng)之家轉(zhuǎn)載發(fā)布。

今天凌晨3點(diǎn)，全球社交巨頭Meta分享了一個(gè)創(chuàng)新研究——Memory layers（記憶層）。

目前，Transformer架構(gòu)的預(yù)訓(xùn)練大模型在存儲(chǔ)、查詢(xún)數(shù)據(jù)時(shí)，隨著參數(shù)的變大對(duì)算力的需求呈指數(shù)級(jí)增長(zhǎng)?！坝洃泴印碧岢隽诵碌母咝Р樵?xún)機(jī)制替代了傳統(tǒng)的查詢(xún)方法，通過(guò)比較查詢(xún)鍵與兩個(gè)較小集合中的鍵，可以快速找到最相關(guān)的鍵，而無(wú)需遍歷模型的整個(gè)記憶層。

這也就是說(shuō)，可以在不增加算力的情況下顯著增加大模型的參數(shù)。例如，研究人員在僅有1.3億參數(shù)的模型中添加了128億額外的記憶參數(shù)，其性能與Meta開(kāi)源的Llama2-70相當(dāng)，而算力卻比它低了10倍左右。

開(kāi)源地址:https://github.com/facebookresearch/memory

Product - Key Lookup

在傳統(tǒng)的鍵值查找中，每個(gè)查詢(xún)都需要與記憶層中的每個(gè)鍵進(jìn)行比較，以找到最匹配的值。該方法在鍵的數(shù)量較少時(shí)是可行的，但隨著記憶層規(guī)模的增長(zhǎng)，這種暴力搜索的方式變得非常低效，需要消耗巨大算力和時(shí)間。

給大家舉一個(gè)簡(jiǎn)單的例子，你想在一個(gè)巨大的圖書(shū)館里找一本書(shū)。這個(gè)圖書(shū)館有成千上萬(wàn)本書(shū)，每本書(shū)都有一個(gè)唯一的編號(hào)（相當(dāng)于記憶層中的“鍵”）。如果你要找到一本特定的書(shū)(相當(dāng)于查詢(xún))，傳統(tǒng)的方法是逐個(gè)檢查每一本書(shū)的編號(hào)來(lái)查找你要的那一本。

這種方法在圖書(shū)館只有幾百本本書(shū)時(shí)可能還行得通，當(dāng)圖書(shū)館藏書(shū)量達(dá)到數(shù)萬(wàn)時(shí)，逐本查找方法就變得極其耗時(shí)和低效了。

Product - Key Lookup是“記憶層”的核心算法之一，使用了一種分而治之的策略，將傳統(tǒng)的單一鍵集合分解為兩個(gè)較小的鍵集合，通過(guò)兩個(gè)階段的查找來(lái)減少必要的比較次數(shù)，從而提高查找效率。

首先，查詢(xún)鍵被分割為兩個(gè)子查詢(xún)，每個(gè)子查詢(xún)分別與兩個(gè)半鍵集合進(jìn)行比較。由于每個(gè)半鍵集合的大小只有原始鍵集合的平方根大小，因此這個(gè)階段的計(jì)算量大幅減少。在第一階段，每個(gè)半鍵集合中找到與子查詢(xún)最相似的k個(gè)鍵，這個(gè)過(guò)程稱(chēng)為top-k查找。

在第二階段，兩個(gè)半鍵集合中找到的top-k鍵被合并，以確定最終的top-k鍵。這一步驟涉及到對(duì)兩個(gè)半鍵集合中找到的鍵進(jìn)行綜合評(píng)分，以確定它們與原始查詢(xún)鍵的整體相似度。需要考慮到兩個(gè)半鍵集合中的鍵的組合，以找到最佳的匹配。

除了計(jì)算效率之外，Product-Key Lookup模塊還優(yōu)化了內(nèi)存和帶寬的使用。由于每個(gè)GPU只需要處理一半的鍵，因此內(nèi)存的使用量減少了一半。由于每個(gè)GPU只需要返回與自己處理的鍵相關(guān)的值，所以?xún)?nèi)存帶寬的需求也得到了優(yōu)化。

Product-Key Lookup算法不僅提高了記憶層的查詢(xún)效率，還為記憶層的應(yīng)用開(kāi)辟了新的可能性，使得記憶層可以被應(yīng)用于更大規(guī)模的數(shù)據(jù)集和更復(fù)雜的任務(wù)中，包括大規(guī)模知識(shí)圖譜的查詢(xún)、長(zhǎng)文本的語(yǔ)義檢索等。

并行記憶層和共享記憶參數(shù)

并行記憶層主要是用于對(duì)硬件GPU的優(yōu)化。在傳統(tǒng)的Transformer架構(gòu)模型中，隨著模型規(guī)模的增加，計(jì)算和內(nèi)存需求也隨之增長(zhǎng)。特別是在處理大規(guī)模數(shù)據(jù)集時(shí)，單一的計(jì)算單元很難滿(mǎn)足這種需求。并行記憶層通過(guò)在多個(gè)GPU之間分配任務(wù)，有效解決這一難題。

在并行記憶層的設(shè)計(jì)中，每個(gè)計(jì)算單元只負(fù)責(zé)處理一部分?jǐn)?shù)據(jù)，這樣可以減少單個(gè)計(jì)算單元的負(fù)擔(dān)，同時(shí)提高整體的處理速度。這種設(shè)計(jì)允許模型在保持單個(gè)計(jì)算單元負(fù)載合理的同時(shí)，處理更大規(guī)模的記憶層。使得模型可以擴(kuò)展到數(shù)十億甚至數(shù)百億的參數(shù)，而不會(huì)受到單個(gè)計(jì)算單元性能的限制。

共享記憶參數(shù)則是另外一個(gè)重要優(yōu)化方法，允許不同層的記憶層共享同一個(gè)參數(shù)集合。這種設(shè)計(jì)的優(yōu)勢(shì)在于，它減少了模型的總參數(shù)數(shù)量，同時(shí)提高了參數(shù)的利用率。

當(dāng)一個(gè)記憶層接收到輸入后，它會(huì)先從共享記憶池中查找最相似的記憶單元，然后根據(jù)查詢(xún)結(jié)果生成輸出。由于所有記憶層都指向同一個(gè)記憶池，因此它們可以在不影響彼此的情況下同時(shí)進(jìn)行操作。

為了應(yīng)對(duì)訓(xùn)練期間可能出現(xiàn)的變化，研究人員開(kāi)發(fā)了一套動(dòng)態(tài)調(diào)整策略。每當(dāng)有新的鍵加入或舊有的鍵被更新時(shí)，系統(tǒng)會(huì)自動(dòng)調(diào)整相應(yīng)的子集，而無(wú)需對(duì)整個(gè)記憶池進(jìn)行全面改造。這樣的設(shè)計(jì)既簡(jiǎn)化了維護(hù)流程，又提高了系統(tǒng)的靈活性和適應(yīng)性。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

Meta

AI+教育：Meta Dot攜手GPTBots，打造教育行業(yè)智能化新標(biāo)桿

在教育領(lǐng)域，人工智能的應(yīng)用正日益深入，徹底顛覆了傳統(tǒng)的教學(xué)模式。MetaDotLimited，作為一家領(lǐng)先的STEAM教育服務(wù)提供商，選擇與GPTBots合作，打造了ZenseAI平臺(tái)。隨著技術(shù)的不斷進(jìn)步，MetaDot計(jì)劃繼續(xù)深化與GPTBots的合作，不斷優(yōu)化ZenseAI的功能，探索出更多的教育行業(yè)應(yīng)用場(chǎng)景，為教育注入AI新活力。

?人工智能教育 ?STEAM教育 ?ZenseAI平臺(tái)
格局大了！小米官方開(kāi)源Home Assistant米家集成：更開(kāi)放地使用IoT設(shè)備

小米公司在GitHub上正式開(kāi)源了名為HomeAssistant米家集成”的項(xiàng)目。這是由小米官方提供支持的HomeAssistant集成組件，允許用戶(hù)在HomeAssistant這一開(kāi)源家庭自動(dòng)化平臺(tái)中無(wú)縫使用小米的IoT智能設(shè)備。更多具體詳細(xì)信息可以查看官方文檔。

?小米 ?Home ?Assistant
薦AI日?qǐng)?bào)：百川智能金融大模型發(fā)布；ChatGPT新增跨對(duì)話(huà)記憶功能；DeepSeek大模型一開(kāi)發(fā)者將加盟小米；OpenAI最強(qiáng)推理模型o3

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI發(fā)布o(jì)3:AI推理能力的重大突破，得分高達(dá)87.5%OpenAI最近推出了其最新的o-Model推理系列模型o3，標(biāo)志著在數(shù)學(xué)和科學(xué)推理領(lǐng)域的重大進(jìn)展。閃極還推出了一個(gè)吸引人的促銷(xiāo)活動(dòng)，用戶(hù)在300天內(nèi)打卡200天可獲得全額退款。

?人工智能 ?OpenAI ?推理能力
李開(kāi)復(fù)周志華縱論AI大模型，萬(wàn)字梳理MEET'25大咖激辯，320萬(wàn)觀眾同見(jiàn)證

「ScalingLaw」和「打臉時(shí)刻」，絕對(duì)是2024年科技智能領(lǐng)域的年度關(guān)鍵詞。這是20余位工業(yè)界、學(xué)術(shù)界乃至投資界的頂流大咖，在量子位MEET2025智能未來(lái)大會(huì)上反復(fù)提及、探討的話(huà)題。后續(xù)還將有大會(huì)嘉賓更詳細(xì)版內(nèi)容分享，敬請(qǐng)關(guān)注！

?科技智能 ?Scaling ?Law
薦OpenAI科學(xué)家盛贊中國(guó)大模型：算法非常強(qiáng)，算力用到極致！

OpenAI創(chuàng)始團(tuán)隊(duì)成員、高級(jí)研究科學(xué)家AndrejKarpathy很罕見(jiàn)地，分享了一個(gè)來(lái)自中國(guó)的開(kāi)源大模型——DeepSeek-v3。Karpathy表示，DeepSeek僅用了280萬(wàn)小時(shí)的GPU算力，就訓(xùn)練出了比Llama-3405B更強(qiáng)的前沿模型，整體成本節(jié)省了11倍左右，將算力發(fā)揮到了極致。值得一提的是可以使用像o1模型那樣的深度思考模式，并且會(huì)把整個(gè)推理過(guò)程全部寫(xiě)出來(lái)。

?DeepSeek-v3 ?Andrej ?Karpathy
GitHub直線漲粉！Home Assistant小米官方集成揭秘

前兩天，小米公司在官方GitHub上正式公布了HA米家官方集成，為HA高階玩家用戶(hù)帶來(lái)更安全、更穩(wěn)定的設(shè)備控制與管理方案。吸引了大批極客用戶(hù)下載使用，截至今天中午，GitHubStar數(shù)量已經(jīng)超7K。小米中樞網(wǎng)關(guān)、小米路由器BE6500Pro、小米全屋路由BE3600Pro套裝等設(shè)備已支持中樞能力，未來(lái)小米還將增加更多支持中樞的設(shè)備，進(jìn)一步提升用戶(hù)的智能家居體驗(yàn)。

?小米 ?Home ?Assistant
系列首款！華為nova 12 Ultra開(kāi)啟HarmonyOS NEXT公測(cè)

華為官方宣布，nova12Ultra2款設(shè)備開(kāi)啟HarmonyOSNEXT公測(cè)版嘗鮮升級(jí)。值得注意的是，這也是nova系列首款開(kāi)啟HarmonyOSNEXT公測(cè)的機(jī)型。在HarmonyOSNEXT升級(jí)期間，備份記錄在原有可保存30天的基礎(chǔ)上再增加30天，共計(jì)60天。

?華為 ?nova ?12
小米SU7最新版本OTA推送：正式接入VLM視覺(jué)語(yǔ)言大模型

小米汽車(chē)官方宣布，小米SU7汽車(chē)已接收到XiaomiHyperOS1.4.5版本的OTA更新，此次更新帶來(lái)了13項(xiàng)新功能和26項(xiàng)體驗(yàn)優(yōu)化。更新亮點(diǎn)包括VLM視覺(jué)語(yǔ)言大模型的接入，使系統(tǒng)能夠識(shí)別復(fù)雜道路環(huán)境和特殊交通規(guī)則區(qū)域，并通過(guò)文字和語(yǔ)音提示駕駛員。還優(yōu)化了胎壓報(bào)警觸發(fā)時(shí)的報(bào)警彈窗、制動(dòng)系統(tǒng)熱衰后報(bào)警提示、電動(dòng)尾翼功能和電動(dòng)尾翼與后備箱之間的邏輯。

?小米汽車(chē) ?Xiaomi ?HyperOS
薦剛拿下NeurIPS最佳論文，字節(jié)就開(kāi)源VAR文生圖版本，拿下SOTA擊敗擴(kuò)散模型

自回歸文生圖，迎來(lái)新王者——新開(kāi)源模型Infinity，字節(jié)商業(yè)化技術(shù)團(tuán)隊(duì)出品，超越DiffusionModel。值得一提的是，這其實(shí)是從前段時(shí)間斬獲NeurIPS最佳論文VAR衍生來(lái)的文生圖版本。Infinity2B和20B的模型都已經(jīng)開(kāi)放了網(wǎng)站體驗(yàn)，感興趣的同學(xué)可以試一試效果。

?自回歸文生圖 ?新開(kāi)源模型Infinity ?字節(jié)商業(yè)化技術(shù)團(tuán)隊(duì)
薦大模型拿單江湖

11月29日，智譜AgentOpenDay會(huì)后，現(xiàn)場(chǎng)有記者問(wèn)了CEO張鵬一個(gè)問(wèn)題:“ToB進(jìn)展如何?”“還行吧”，至此張鵬沒(méi)有再多說(shuō)一句。這家明星AI公司深度參與到大模型的廝殺當(dāng)中，其同臺(tái)競(jìng)爭(zhēng)對(duì)手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見(jiàn)底了。

?智譜Agent ?大模型 ?AI公司

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

突破算力限制！Meta開(kāi)源“記憶層”，重塑Transformer架構(gòu)大模型

AI+教育：Meta Dot攜手GPTBots，打造教育行業(yè)智能化新標(biāo)桿

格局大了！小米官方開(kāi)源Home Assistant米家集成：更開(kāi)放地使用IoT設(shè)備

薦AI日?qǐng)?bào)：百川智能金融大模型發(fā)布；ChatGPT新增跨對(duì)話(huà)記憶功能；DeepSeek大模型一開(kāi)發(fā)者將加盟小米；OpenAI最強(qiáng)推理模型o3

李開(kāi)復(fù)周志華縱論AI大模型，萬(wàn)字梳理MEET'25大咖激辯，320萬(wàn)觀眾同見(jiàn)證

薦OpenAI科學(xué)家盛贊中國(guó)大模型：算法非常強(qiáng)，算力用到極致！

GitHub直線漲粉！Home Assistant小米官方集成揭秘

系列首款！華為nova 12 Ultra開(kāi)啟HarmonyOS NEXT公測(cè)

小米SU7最新版本OTA推送：正式接入VLM視覺(jué)語(yǔ)言大模型

薦剛拿下NeurIPS最佳論文，字節(jié)就開(kāi)源VAR文生圖版本，拿下SOTA擊敗擴(kuò)散模型

薦大模型拿單江湖

熱文

蘋(píng)果市值一夜蒸發(fā)7248億此前官網(wǎng)已開(kāi)啟降價(jià)活動(dòng)

辛巴要花15億開(kāi)超市：號(hào)稱(chēng)將改變大家消費(fèi)習(xí)慣

雷軍親自出面海底撈正式入駐小米科技園全體員工88折

周鴻祎：打工不可能賺大錢(qián) 創(chuàng)業(yè)才能財(cái)富自由

法拉第未來(lái)股價(jià)一夜暴漲超50% 第二品牌FX原型車(chē)即將亮相

胖東來(lái)正式規(guī)定員工不得收付彩禮、依靠父母買(mǎi)房買(mǎi)車(chē)

1999元全球首款媽祖平安智能手表發(fā)布：搭載華為智能機(jī)芯

抖音宣布將加強(qiáng)內(nèi)容推薦多樣性破除“信息繭房”

格力申請(qǐng)董瓷、明珠瓷和格力好老公等商標(biāo)

周鴻祎：我也要送車(chē) 什么車(chē)大家算了算

雷軍辟謠只招聘35歲以下員工：僅針對(duì)未來(lái)之星項(xiàng)目

雷軍曬健身房照片：此前設(shè)定100次健身打卡目標(biāo)

雷軍感謝網(wǎng)友祝他年入百萬(wàn)：愿大家夢(mèng)想成真今晚8點(diǎn)跨年直播

阿里巴巴AI“生意管家”: 400萬(wàn)商家的秘密武器

拼手氣分紅包！支付寶宣布2025年集五福1月20日開(kāi)啟

蘋(píng)果市值一夜蒸發(fā)7248億此前官網(wǎng)已開(kāi)啟降價(jià)活動(dòng)

董明珠曾喊話(huà)雷軍給股民分多少錢(qián)！格力：擬分紅超55億

抖音副總裁回應(yīng)吳柳芳同名賬號(hào)被封：仿冒當(dāng)事人

俞敏洪稱(chēng)東方甄選是火藥桶：未來(lái)一定會(huì)更加美好

蘋(píng)果官網(wǎng)突然降價(jià) 客服回應(yīng)能否退差價(jià)

站長(zhǎng)商機(jī)

突破算力限制！Meta開(kāi)源“記憶層”，重塑Transformer架構(gòu)大模型

熱文

站長(zhǎng)商機(jī)

突破算力限制！Meta開(kāi)源“記憶層”，重塑Transformer架構(gòu)大模型