幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關(guān)鍵詞  > SliceGPT最新資訊  > 正文

微軟開發(fā)新型大模型壓縮方法SliceGPT

2024-01-29 16:57 · 稿源:站長之家

站長之家(ChinaZ.com)1月29日 消息:SliceGPT是微軟開發(fā)的一種新型的大語言模型壓縮方法。通過SLICE GPT,可以在保持99%,99%,和90%零樣本任務(wù)性能的同時(shí),將LLAMA2-70B、OPT66B和Phi-2模型分別去除高達(dá)25%的模型參數(shù)(包括嵌入)。

這意味著使用SLICE GPT的模型可以在更少的GPU上運(yùn)行,并且運(yùn)行速度更快,無需任何額外的代碼優(yōu)化。在24GB的消費(fèi)級GPU上,將LLAMA2-70B的總計(jì)算量減少到密集模型的64%;在40GB的A100GPU上減少到66%。

image.png

論文地址:https://arxiv.org/pdf/2401.15024.pdf

SLICE GPT的主要特點(diǎn)包括解決了大語言模型在存儲(chǔ)和計(jì)算資源上的高需求問題,并提供了一種有效減輕這些資源需求的方法,同時(shí)保持或僅輕微犧牲模型性能,這對于推廣大型模型的應(yīng)用和降低運(yùn)行成本具有重要意義。

具體來說,SLICE GPT能夠減少大型語言模型的尺寸,通過在不損失顯著性能的前提下,減少模型參數(shù)數(shù)量,SLICE GPT能夠減少大型語言模型的尺寸。它還能提高模型在硬件上的運(yùn)行效率,減少了所需的計(jì)算資源,并且能夠在去除一定比例的模型參數(shù)的同時(shí),保持模型的性能。此外,SLICE GPT不僅適用于特定的模型或架構(gòu),它的方法可以廣泛應(yīng)用于各種變換器網(wǎng)絡(luò)模型。

SLICE GPT的工作原理基于一種新的后訓(xùn)練稀疏化方案,通過兩個(gè)關(guān)鍵步驟來減少大型語言模型的計(jì)算和內(nèi)存需求。首先是替換權(quán)重矩陣,通過將模型中的每個(gè)權(quán)重矩陣替換為一個(gè)更小的(密集的)矩陣來減少網(wǎng)絡(luò)的嵌入維度,有效地縮減了模型的大小。

其次是維持計(jì)算不變性,SLICE GPT引入了變換器網(wǎng)絡(luò)中的“計(jì)算不變性”概念,通過特定的變換操作,改變權(quán)重矩陣的形狀,而不改變其在模型中的功能和影響,從而達(dá)到減少模型參數(shù)的目的,同時(shí)保持模型的性能。這種方法的核心優(yōu)勢在于,它允許模型在去除一定比例的參數(shù)后,仍然能夠保持接近原始模型的性能,適用于資源受限的設(shè)備上部署大型模型,比如普通的個(gè)人電腦或者移動(dòng)設(shè)備。

舉報(bào)

  • 相關(guān)推薦
  • AI日報(bào):百川智能金融大模型發(fā)布;ChatGPT新增跨對話記憶功能;DeepSeek大模型開發(fā)者將加盟小米;OpenAI最強(qiáng)推理模型o3

    歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI發(fā)布o(jì)3:AI推理能力的重大突破,得分高達(dá)87.5%OpenAI最近推出了其最新的o-Model推理系列模型o3,標(biāo)志著在數(shù)學(xué)和科學(xué)推理領(lǐng)域的重大進(jìn)展。閃極還推出了一個(gè)吸引人的促銷活動(dòng),用戶在300天內(nèi)打卡200天可獲得全額退款。

  • ChatGPT兩周年,國產(chǎn)o1大模型們緊追不舍

    ChatGPT誕生的第二年,OpenAI和國內(nèi)的一眾企業(yè)正在試著“拋棄”它。在ScalingLaw被質(zhì)疑能力“見頂”的情況下,今年9月,OpenAI帶著以全新系列命名的模型o1一經(jīng)發(fā)布,“會(huì)思考的大模型”再度成為焦點(diǎn)。在如何不過度思考的情況下,平衡大模型的推理進(jìn)化和用戶對效率的需求?這是楊植麟幾個(gè)月前在云棲大會(huì)上的提問,這個(gè)問題需要留給國內(nèi)大模型廠商們繼續(xù)解決。

  • 大模型拿單江湖

    11月29日,智譜AgentOpenDay會(huì)后,現(xiàn)場有記者問了CEO張鵬一個(gè)問題:“ToB進(jìn)展如何?”“還行吧”,至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當(dāng)中,其同臺(tái)競爭對手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

  • OpenAI世界最貴大模型上熱搜:每月200美元 ChatGPT Pro擁有無限使用權(quán)

    OpenAI公司在“12天12場直播”活動(dòng)的首秀中宣布了推理大模型o1的完整版本和進(jìn)階模式,同時(shí)推出了每月200美元的ChatGPTPro訂閱服務(wù)。ChatGPTPlus用戶將逐步獲得完整版o1模型的使用權(quán)限,該模型以o1預(yù)覽版形式于9月上線,其特點(diǎn)在于回答用戶問題時(shí)會(huì)形成類似人類思維方式的內(nèi)部思維鏈條,提高回答專業(yè)問題時(shí)的準(zhǔn)確性。OpenAI計(jì)劃未來為這一訂閱服務(wù)添加更多強(qiáng)大、計(jì)算密集型的功能。

  • AI日報(bào):階躍星辰內(nèi)測視頻大模型Step-Video;即夢AI圖片2.1模型支持生成文字;騰訊發(fā)布混元視頻生成大模型

    歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開啟內(nèi)測可在躍問視頻申請階躍星辰的Step-Video模型正式開啟內(nèi)測,用戶可以通過躍問視頻官網(wǎng)申請資格。用戶可在最新版本的WPSOffice中輕松找到?

  • 谷歌“狙擊”O(jiān)penAI,發(fā)布新一代大模型,主打Agent+多模態(tài)

    繼量子芯片之后,谷歌又來搶“OpenAI雙12直播”的流量了!就在剛剛,谷歌新一代大模型Gemini2.0突然登場,再次由谷歌CEO皮猜親自官宣。新一代模型專為AIAgent打造,谷歌表示目前已經(jīng)將2.0版本提供給了一些開發(fā)者內(nèi)測,正在迅速將其集成在Gemini和搜索等產(chǎn)品線中。從OpenAI跳槽到谷歌的LoganKilpatrick表示,他們在GoogleAIStudio中創(chuàng)建了一個(gè)全新體驗(yàn),展示了Gemini2.0視頻理解、原生工具?

  • Andrej Karpathy:神奇大模型不存在的,只是對人類標(biāo)注的拙劣模仿

    也許是時(shí)候?qū)ふ倚碌姆椒?大模型回答人類的對話內(nèi)容,究竟有多少「智能」成分在里面?本周五,知名AI領(lǐng)域?qū)W者,OpenAI創(chuàng)始成員、特斯拉前AI高級總監(jiān)AndrejKarpathy發(fā)表觀點(diǎn):「人們對『向人工智能詢問某件事』的解釋過于夸張」,引發(fā)網(wǎng)友熱議。Karpathy稱:人工智能基本上是通過模仿人工標(biāo)注數(shù)據(jù)來進(jìn)行訓(xùn)練的語言模型。這或許為大模型下一步性能突破提供了新的思路。

  • OpenAI發(fā)布強(qiáng)化微調(diào)API,能深度定制超復(fù)雜大模型

    今天凌晨兩點(diǎn),OpenAI開啟了12天技術(shù)分享直播,發(fā)布了最新“強(qiáng)化微調(diào)”計(jì)劃。與傳統(tǒng)的微調(diào)相比,強(qiáng)化微調(diào)可以讓開發(fā)者使用經(jīng)過微調(diào)的更強(qiáng)專家大模型,來開發(fā)適用于金融、法律、醫(yī)療、科研等不同領(lǐng)域的AI助手。通過這些反饋訓(xùn)練一個(gè)獎(jiǎng)勵(lì)模型,該模型能夠?qū)φZ言模型的輸出進(jìn)行打分,以反映其質(zhì)量或符合人類期望。

  • AI大模型時(shí)代,人才的需求已經(jīng)變了

    什么是AI發(fā)展的第一驅(qū)動(dòng)力?最近,全球科技大廠都在用行動(dòng)告訴我們:人才。谷歌NotebookLM的核心團(tuán)隊(duì)共同宣布離職創(chuàng)業(yè),他們新公司的網(wǎng)站已經(jīng)進(jìn)入了「建設(shè)中」的狀態(tài)。但要真正解決AI人才短缺的問題需要更多企業(yè)、高校和社會(huì)各界的共同努力。

  • 微軟發(fā)布Phi-4,最強(qiáng)小模型!參數(shù)極小、超GPT-4o

    微軟研究院發(fā)布了最強(qiáng)小參數(shù)模型——Phi-4。Phi系列模型自今已經(jīng)發(fā)布了5代,Phi-4也延續(xù)了之前的小參數(shù)模式只有140億。值得一提的是,微軟AI副總裁、phi系列模型的靈魂人物之一SébastienBubeck已經(jīng)離開了微軟加入了OpenAI。

熱文

  • 3 天
  • 7天