微軟開發(fā)新型大模型壓縮方法SliceGPT

2024-01-29 16:57 · 稿源：站長之家

站長之家（ChinaZ.com）1月29日消息:SliceGPT是微軟開發(fā)的一種新型的大語言模型壓縮方法。通過SLICE GPT，可以在保持99%，99%，和90%零樣本任務(wù)性能的同時(shí)，將LLAMA2-70B、OPT66B和Phi-2模型分別去除高達(dá)25%的模型參數(shù)（包括嵌入）。

這意味著使用SLICE GPT的模型可以在更少的GPU上運(yùn)行，并且運(yùn)行速度更快，無需任何額外的代碼優(yōu)化。在24GB的消費(fèi)級GPU上，將LLAMA2-70B的總計(jì)算量減少到密集模型的64%;在40GB的A100GPU上減少到66%。

論文地址:https://arxiv.org/pdf/2401.15024.pdf

SLICE GPT的主要特點(diǎn)包括解決了大語言模型在存儲(chǔ)和計(jì)算資源上的高需求問題，并提供了一種有效減輕這些資源需求的方法，同時(shí)保持或僅輕微犧牲模型性能，這對于推廣大型模型的應(yīng)用和降低運(yùn)行成本具有重要意義。

具體來說，SLICE GPT能夠減少大型語言模型的尺寸，通過在不損失顯著性能的前提下，減少模型參數(shù)數(shù)量，SLICE GPT能夠減少大型語言模型的尺寸。它還能提高模型在硬件上的運(yùn)行效率，減少了所需的計(jì)算資源，并且能夠在去除一定比例的模型參數(shù)的同時(shí)，保持模型的性能。此外，SLICE GPT不僅適用于特定的模型或架構(gòu)，它的方法可以廣泛應(yīng)用于各種變換器網(wǎng)絡(luò)模型。

SLICE GPT的工作原理基于一種新的后訓(xùn)練稀疏化方案，通過兩個(gè)關(guān)鍵步驟來減少大型語言模型的計(jì)算和內(nèi)存需求。首先是替換權(quán)重矩陣，通過將模型中的每個(gè)權(quán)重矩陣替換為一個(gè)更小的（密集的）矩陣來減少網(wǎng)絡(luò)的嵌入維度，有效地縮減了模型的大小。

其次是維持計(jì)算不變性，SLICE GPT引入了變換器網(wǎng)絡(luò)中的“計(jì)算不變性”概念，通過特定的變換操作，改變權(quán)重矩陣的形狀，而不改變其在模型中的功能和影響，從而達(dá)到減少模型參數(shù)的目的，同時(shí)保持模型的性能。這種方法的核心優(yōu)勢在于，它允許模型在去除一定比例的參數(shù)后，仍然能夠保持接近原始模型的性能，適用于資源受限的設(shè)備上部署大型模型，比如普通的個(gè)人電腦或者移動(dòng)設(shè)備。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

SliceGPT

薦AI日報(bào)：百川智能金融大模型發(fā)布；ChatGPT新增跨對話記憶功能；DeepSeek大模型一開發(fā)者將加盟小米；OpenAI最強(qiáng)推理模型o3

歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI發(fā)布o(jì)3:AI推理能力的重大突破，得分高達(dá)87.5%OpenAI最近推出了其最新的o-Model推理系列模型o3，標(biāo)志著在數(shù)學(xué)和科學(xué)推理領(lǐng)域的重大進(jìn)展。閃極還推出了一個(gè)吸引人的促銷活動(dòng)，用戶在300天內(nèi)打卡200天可獲得全額退款。

?人工智能 ?OpenAI ?推理能力
薦ChatGPT兩周年，國產(chǎn)o1大模型們緊追不舍

ChatGPT誕生的第二年，OpenAI和國內(nèi)的一眾企業(yè)正在試著“拋棄”它。在ScalingLaw被質(zhì)疑能力“見頂”的情況下，今年9月，OpenAI帶著以全新系列命名的模型o1一經(jīng)發(fā)布，“會(huì)思考的大模型”再度成為焦點(diǎn)。在如何不過度思考的情況下，平衡大模型的推理進(jìn)化和用戶對效率的需求?這是楊植麟幾個(gè)月前在云棲大會(huì)上的提問，這個(gè)問題需要留給國內(nèi)大模型廠商們繼續(xù)解決。

?AI發(fā)展 ?o1模型 ?深度學(xué)習(xí)
薦大模型拿單江湖

11月29日，智譜AgentOpenDay會(huì)后，現(xiàn)場有記者問了CEO張鵬一個(gè)問題:“ToB進(jìn)展如何?”“還行吧”，至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當(dāng)中，其同臺(tái)競爭對手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

?智譜Agent ?大模型 ?AI公司
OpenAI世界最貴大模型上熱搜：每月200美元 ChatGPT Pro擁有無限使用權(quán)

OpenAI公司在“12天12場直播”活動(dòng)的首秀中宣布了推理大模型o1的完整版本和進(jìn)階模式，同時(shí)推出了每月200美元的ChatGPTPro訂閱服務(wù)。ChatGPTPlus用戶將逐步獲得完整版o1模型的使用權(quán)限，該模型以o1預(yù)覽版形式于9月上線，其特點(diǎn)在于回答用戶問題時(shí)會(huì)形成類似人類思維方式的內(nèi)部思維鏈條，提高回答專業(yè)問題時(shí)的準(zhǔn)確性。OpenAI計(jì)劃未來為這一訂閱服務(wù)添加更多強(qiáng)大、計(jì)算密集型的功能。

?推理大模型 ?ChatGPT ?Pro
薦AI日報(bào)：階躍星辰內(nèi)測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開啟內(nèi)測可在躍問視頻申請階躍星辰的Step-Video模型正式開啟內(nèi)測，用戶可以通過躍問視頻官網(wǎng)申請資格。用戶可在最新版本的WPSOffice中輕松找到?

?人工智能 ?視頻生成 ?技術(shù)趨勢
薦谷歌“狙擊”O(jiān)penAI，發(fā)布新一代大模型，主打Agent+多模態(tài)

繼量子芯片之后，谷歌又來搶“OpenAI雙12直播”的流量了!就在剛剛，谷歌新一代大模型Gemini2.0突然登場，再次由谷歌CEO皮猜親自官宣。新一代模型專為AIAgent打造，谷歌表示目前已經(jīng)將2.0版本提供給了一些開發(fā)者內(nèi)測，正在迅速將其集成在Gemini和搜索等產(chǎn)品線中。從OpenAI跳槽到谷歌的LoganKilpatrick表示，他們在GoogleAIStudio中創(chuàng)建了一個(gè)全新體驗(yàn)，展示了Gemini2.0視頻理解、原生工具?

?谷歌 ?Gemini ?2.0
薦Andrej Karpathy：神奇大模型不存在的，只是對人類標(biāo)注的拙劣模仿

也許是時(shí)候?qū)ふ倚碌姆椒?大模型回答人類的對話內(nèi)容，究竟有多少「智能」成分在里面?本周五，知名AI領(lǐng)域?qū)W者，OpenAI創(chuàng)始成員、特斯拉前AI高級總監(jiān)AndrejKarpathy發(fā)表觀點(diǎn):「人們對『向人工智能詢問某件事』的解釋過于夸張」，引發(fā)網(wǎng)友熱議。Karpathy稱:人工智能基本上是通過模仿人工標(biāo)注數(shù)據(jù)來進(jìn)行訓(xùn)練的語言模型。這或許為大模型下一步性能突破提供了新的思路。

?大模型
薦OpenAI發(fā)布強(qiáng)化微調(diào)API，能深度定制超復(fù)雜大模型了

今天凌晨兩點(diǎn)，OpenAI開啟了12天技術(shù)分享直播，發(fā)布了最新“強(qiáng)化微調(diào)”計(jì)劃。與傳統(tǒng)的微調(diào)相比，強(qiáng)化微調(diào)可以讓開發(fā)者使用經(jīng)過微調(diào)的更強(qiáng)專家大模型，來開發(fā)適用于金融、法律、醫(yī)療、科研等不同領(lǐng)域的AI助手。通過這些反饋訓(xùn)練一個(gè)獎(jiǎng)勵(lì)模型，該模型能夠?qū)φZ言模型的輸出進(jìn)行打分，以反映其質(zhì)量或符合人類期望。

?OpenAI ?強(qiáng)化微調(diào) ?AI助手
薦AI大模型時(shí)代，人才的需求已經(jīng)變了

什么是AI發(fā)展的第一驅(qū)動(dòng)力?最近，全球科技大廠都在用行動(dòng)告訴我們:人才。谷歌NotebookLM的核心團(tuán)隊(duì)共同宣布離職創(chuàng)業(yè)，他們新公司的網(wǎng)站已經(jīng)進(jìn)入了「建設(shè)中」的狀態(tài)。但要真正解決AI人才短缺的問題需要更多企業(yè)、高校和社會(huì)各界的共同努力。

?大模型
薦微軟發(fā)布Phi-4，最強(qiáng)小模型！參數(shù)極小、超GPT-4o

微軟研究院發(fā)布了最強(qiáng)小參數(shù)模型——Phi-4。Phi系列模型自今已經(jīng)發(fā)布了5代，Phi-4也延續(xù)了之前的小參數(shù)模式只有140億。值得一提的是，微軟AI副總裁、phi系列模型的靈魂人物之一SébastienBubeck已經(jīng)離開了微軟加入了OpenAI。

?Phi-4模型 ?微軟研究院 ?小參數(shù)模型

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

微軟開發(fā)新型大模型壓縮方法SliceGPT

薦AI日報(bào)：百川智能金融大模型發(fā)布；ChatGPT新增跨對話記憶功能；DeepSeek大模型一開發(fā)者將加盟小米；OpenAI最強(qiáng)推理模型o3

薦ChatGPT兩周年，國產(chǎn)o1大模型們緊追不舍

薦大模型拿單江湖

OpenAI世界最貴大模型上熱搜：每月200美元 ChatGPT Pro擁有無限使用權(quán)

薦AI日報(bào)：階躍星辰內(nèi)測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

薦谷歌“狙擊”O(jiān)penAI，發(fā)布新一代大模型，主打Agent+多模態(tài)

薦Andrej Karpathy：神奇大模型不存在的，只是對人類標(biāo)注的拙劣模仿

薦OpenAI發(fā)布強(qiáng)化微調(diào)API，能深度定制超復(fù)雜大模型了

薦AI大模型時(shí)代，人才的需求已經(jīng)變了

薦微軟發(fā)布Phi-4，最強(qiáng)小模型！參數(shù)極小、超GPT-4o

熱文

京東發(fā)布年終獎(jiǎng)通知部分員工年前可收到年終獎(jiǎng)

消息稱OpenAI新模型GPT-5研發(fā)未達(dá)到預(yù)期：成本高昂效果欠佳

央視曝光未成年人繞開防沉迷只需4元：通過租用游戲賬號規(guī)避

李斌回應(yīng)螢火蟲外觀設(shè)計(jì)：看過實(shí)車的人都喜歡這個(gè)設(shè)計(jì)

沒網(wǎng)也能聯(lián)絡(luò)！小米15系列星辰無網(wǎng)通12月底升級6km級通話范圍

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

FF再獲3000萬美元新一輪融資加速第二品牌FX戰(zhàn)略推進(jìn)

QQ音樂年度聽歌報(bào)告發(fā)布：誰是你最喜歡的歌手？

微信可以線上送實(shí)體禮物了：微信小店“藍(lán)包”功能正灰度測試逐

抖音上線“驗(yàn)證助手” 可幫助用戶識別電話等是否屬于抖音官方

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

微信朋友圈崩了上熱搜騰訊客服：請嘗試這幾種方法

小紅書封號上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

京東發(fā)布年終獎(jiǎng)通知部分員工年前可收到年終獎(jiǎng)

未成年人成部分博主流量密碼抖音治理涉“網(wǎng)紅兒童”違規(guī)內(nèi)容

極越員工善后方案已出爐：員工獲“N+1”賠償由百度吉利出資

螞蟻集團(tuán)否認(rèn)借殼上市：目前沒有上市計(jì)劃

小紅書被吐槽無理由封號客服回應(yīng)：未說明處罰時(shí)間就是永封

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車?yán)m(xù)航之王

消息稱OpenAI新模型GPT-5研發(fā)未達(dá)到預(yù)期：成本高昂效果欠佳

站長商機(jī)