華盛頓大學(xué)推高效大模型調(diào)優(yōu)方法“代理調(diào)優(yōu)”

2024-01-24 09:11 · 稿源：站長之家

要點(diǎn):
1、代理調(diào)優(yōu)方法無需接觸模型的內(nèi)部權(quán)重。
2、通過對比小型調(diào)整模型和未調(diào)整模型的預(yù)測結(jié)果來引導(dǎo)基礎(chǔ)模型的預(yù)測。
3、代理調(diào)優(yōu)方法能夠在解碼時(shí)更好地保留訓(xùn)練知識(shí)。

站長之家（ChinaZ.com）1月24日消息:華盛頓大學(xué)推出更高效的大模型調(diào)優(yōu)方法“代理調(diào)優(yōu)”，該方法通過對比小型調(diào)整模型和未調(diào)整模型的預(yù)測結(jié)果來引導(dǎo)基礎(chǔ)模型的預(yù)測，實(shí)現(xiàn)對模型的調(diào)優(yōu)而無需接觸模型的內(nèi)部權(quán)重。

隨著ChatGPT等生成式AI產(chǎn)品的發(fā)展，基礎(chǔ)模型的參數(shù)不斷增加，因此進(jìn)行權(quán)重調(diào)優(yōu)需要耗費(fèi)大量時(shí)間和算力。為提升調(diào)優(yōu)效率，該方法可以在解碼時(shí)更好地保留訓(xùn)練知識(shí)，同時(shí)保留更大規(guī)模預(yù)訓(xùn)練的優(yōu)勢。研究人員對LlAMA-2的13B、70B原始模型進(jìn)行了微調(diào)，結(jié)果顯示代理調(diào)優(yōu)的性能比直接調(diào)優(yōu)的模型更高。

論文地址:https://arxiv.org/pdf/2401.08565.pdf

該方法需要準(zhǔn)備一個(gè)小型的預(yù)訓(xùn)練語言模型M-，與基礎(chǔ)模型M共享相同的詞匯表，然后使用訓(xùn)練數(shù)據(jù)對M-進(jìn)行調(diào)優(yōu)得到調(diào)優(yōu)模型M+。

在解碼時(shí)，通過對比基礎(chǔ)模型M的輸出預(yù)測分布和調(diào)優(yōu)模型M+的輸出預(yù)測分布之間的差異，來引導(dǎo)基礎(chǔ)模型的預(yù)測，最后將預(yù)測差異應(yīng)用于基礎(chǔ)模型的預(yù)測結(jié)果，以引導(dǎo)基礎(chǔ)模型的預(yù)測朝向調(diào)優(yōu)模型的預(yù)測方向移動(dòng)。這一方法與大模型中的“蒸餾”技術(shù)恰恰相反，是一種創(chuàng)新性的調(diào)優(yōu)方法。

代理調(diào)優(yōu)方法的推出，為大模型的調(diào)優(yōu)提供了更高效的解決方案，同時(shí)也可以在解碼時(shí)更好地保留訓(xùn)練知識(shí)，使得模型的性能更高。這一方法的推出將為AI領(lǐng)域的發(fā)展帶來新的啟示，值得進(jìn)一步深入研究和應(yīng)用。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

大模型

薦大模型拿單江湖

11月29日，智譜AgentOpenDay會(huì)后，現(xiàn)場有記者問了CEO張鵬一個(gè)問題:“ToB進(jìn)展如何?”“還行吧”，至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當(dāng)中，其同臺(tái)競爭對手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

?智譜Agent ?大模型 ?AI公司
科龍睡眠空調(diào)小耳朵語音款LK上市，高配語音高效省電

隨著科技的迅猛發(fā)展，智能家居系統(tǒng)逐漸成為現(xiàn)代生活不可或缺的一部分。在這一科技不斷演進(jìn)的時(shí)代，人們對于創(chuàng)新生活方式的追求愈發(fā)強(qiáng)烈。通過持續(xù)的技術(shù)革新以及對用戶需求的深刻洞察，科龍空調(diào)致力于為消費(fèi)者提供更為舒適、健康、智能化的家居生活解決方案。

?智能家居 ?語音交互 ?科龍空調(diào)
薦大模型，在內(nèi)卷中尋找出口

2024年，大模型進(jìn)展不斷。從年初的Sora到最新的o3，更新更好的模型不斷被推出，“內(nèi)卷”到底有沒有發(fā)生?我們要先確定“內(nèi)卷”的定義，指某一類產(chǎn)業(yè)模式，發(fā)展到一種確定形式后，陷入“高水平均衡陷阱”，出現(xiàn)“沒有發(fā)展的增長”，這種局面一直無法被打破，那就會(huì)走向停滯和危機(jī)。大模型要取得商業(yè)成功，前提是用戶和開發(fā)者的業(yè)務(wù)能否成功，這是為什么完善的商業(yè)基

?大模型進(jìn)展 ?內(nèi)卷現(xiàn)象 ?scaling
九號(hào)機(jī)器人方糖，打造智能、高效送物解決方案

現(xiàn)代社會(huì)越來越講究高效率，對于一些簡單但高重復(fù)的工作，除了人手勞作，目前也有越來越多領(lǐng)域應(yīng)用到智能機(jī)器人。在酒店、寫字樓、商場、醫(yī)院等場景，配送機(jī)器人的普及率就越來越高。以上提到的九號(hào)機(jī)器人方糖，就可以為多種業(yè)務(wù)場景提供整套解決方案，為商業(yè)場景智慧化賦能。

?智能配送機(jī)器人 ?高效末端配送 ?精準(zhǔn)定位技術(shù)
身邊云攜手知名在線閱讀平臺(tái)，打造高效會(huì)員營銷體系

據(jù)《2023年度中國數(shù)字閱讀報(bào)告》顯示，我國數(shù)字閱讀用戶規(guī)模高達(dá)5.7億。在線閱讀平臺(tái)已成為人們獲取知識(shí)的重要渠道，各大平臺(tái)紛紛推出營銷活動(dòng)吸引并激活用戶，網(wǎng)絡(luò)紅包作為一種高效促活手段深受用戶喜愛，然其背后隱藏的稅務(wù)風(fēng)險(xiǎn)與高昂成本卻成為了制約平臺(tái)長遠(yuǎn)發(fā)展的痛點(diǎn)。身邊云將繼續(xù)深耕數(shù)字營銷領(lǐng)域，為更多企業(yè)提供高效、合規(guī)、創(chuàng)新的營銷解決方案，共同探索在線閱讀行業(yè)的新增長點(diǎn)，開啟智慧營銷的新篇章。

?數(shù)字閱讀 ?在線閱讀平臺(tái) ?網(wǎng)絡(luò)紅包
省電高效！小米空調(diào)技術(shù)獲節(jié)能減排科技進(jìn)步二等獎(jiǎng)

據(jù)小米官方消息，小米基于物聯(lián)網(wǎng)的智能空調(diào)低碳運(yùn)行技術(shù)”榮獲中國節(jié)能協(xié)會(huì)節(jié)能減排科技進(jìn)步二等獎(jiǎng)。該技術(shù)通過智能算法模型實(shí)時(shí)尋優(yōu)控制，實(shí)現(xiàn)不同工況下的高效運(yùn)行、智能省電，為用戶提供更節(jié)能、更舒適的使用體驗(yàn)。采用創(chuàng)新的上出風(fēng)設(shè)計(jì)，能夠使氣流在室內(nèi)形成環(huán)流，解決了傳統(tǒng)空調(diào)冷風(fēng)直吹帶來的不適問題。

?智能空調(diào) ?低碳運(yùn)行 ?節(jié)能減排
電動(dòng)貨車怎么選？高效環(huán)保又省心，看看上汽大通MAXUS新途EV80

隨著物流行業(yè)的快速發(fā)展，電動(dòng)貨車因其低成本、環(huán)保的特點(diǎn)逐漸成為許多消費(fèi)者的首選。不僅國家對新能源車型提供政策支持，電動(dòng)貨車自身的經(jīng)濟(jì)性也讓它在市場上站穩(wěn)了腳跟。它不僅是運(yùn)輸?shù)暮脦褪?，更是助你?shí)現(xiàn)事業(yè)騰飛的好伙伴！

?電動(dòng)貨車 ?物流行業(yè) ?環(huán)保運(yùn)輸
薦AI大模型時(shí)代，人才的需求已經(jīng)變了

什么是AI發(fā)展的第一驅(qū)動(dòng)力?最近，全球科技大廠都在用行動(dòng)告訴我們:人才。谷歌NotebookLM的核心團(tuán)隊(duì)共同宣布離職創(chuàng)業(yè)，他們新公司的網(wǎng)站已經(jīng)進(jìn)入了「建設(shè)中」的狀態(tài)。但要真正解決AI人才短缺的問題需要更多企業(yè)、高校和社會(huì)各界的共同努力。

?大模型
半導(dǎo)體存儲(chǔ)品牌企業(yè)江波龍，助力工業(yè)自動(dòng)化高效穩(wěn)定

固態(tài)硬盤SSD作為工業(yè)自動(dòng)化的核心，無論是運(yùn)動(dòng)控制、邏輯控制還是連續(xù)控制過程，無不需要核心的控制平臺(tái)。從PLC、PAC、DCS、工業(yè)PC、嵌入式到運(yùn)動(dòng)控制卡，不同的控制器核心在進(jìn)行各種指令接收處理和運(yùn)算的過程中，無不涉及存儲(chǔ)及運(yùn)行數(shù)據(jù)的一項(xiàng)關(guān)鍵——固態(tài)硬盤SSD。江波龍也將持續(xù)以PTM模式投身工業(yè)自動(dòng)化行業(yè)，與客戶聯(lián)合創(chuàng)新，持續(xù)攻關(guān)，為我國工業(yè)自動(dòng)化、數(shù)字化、智能化發(fā)展貢獻(xiàn)更多力量。

?固態(tài)硬盤SSD ?工業(yè)自動(dòng)化 ?控制平臺(tái)
豆包說要「普惠」，于是大模型處理圖片按「厘」計(jì)價(jià)了

OpenAI宣告連續(xù)12輪轟炸，讓2024年底的大模型領(lǐng)域熱鬧起來了。但堅(jiān)持每個(gè)凌晨看直播的話會(huì)發(fā)現(xiàn)，越到后面的發(fā)布越平淡，內(nèi)心的波動(dòng)也越少了。豆包大模型還有哪些驚喜?值得每一個(gè)人期待。

?大模型 ?OpenAI ?豆包視覺理解

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

華盛頓大學(xué)推高效大模型調(diào)優(yōu)方法“代理調(diào)優(yōu)”

薦大模型拿單江湖

科龍睡眠空調(diào)小耳朵語音款LK上市，高配語音高效省電

薦大模型，在內(nèi)卷中尋找出口

九號(hào)機(jī)器人方糖，打造智能、高效送物解決方案

身邊云攜手知名在線閱讀平臺(tái)，打造高效會(huì)員營銷體系

省電高效！小米空調(diào)技術(shù)獲節(jié)能減排科技進(jìn)步二等獎(jiǎng)

電動(dòng)貨車怎么選？高效環(huán)保又省心，看看上汽大通MAXUS新途EV80

薦AI大模型時(shí)代，人才的需求已經(jīng)變了

半導(dǎo)體存儲(chǔ)品牌企業(yè)江波龍，助力工業(yè)自動(dòng)化高效穩(wěn)定

豆包說要「普惠」，于是大模型處理圖片按「厘」計(jì)價(jià)了

熱文

蘋果市值一夜蒸發(fā)7248億此前官網(wǎng)已開啟降價(jià)活動(dòng)

雷軍親自出面海底撈正式入駐小米科技園全體員工88折

辛巴要花15億開超市：號(hào)稱將改變大家消費(fèi)習(xí)慣

周鴻祎：打工不可能賺大錢創(chuàng)業(yè)才能財(cái)富自由

法拉第未來股價(jià)一夜暴漲超50% 第二品牌FX原型車即將亮相

胖東來正式規(guī)定員工不得收付彩禮、依靠父母買房買車

1999元全球首款媽祖平安智能手表發(fā)布：搭載華為智能機(jī)芯

抖音宣布將加強(qiáng)內(nèi)容推薦多樣性破除“信息繭房”

周鴻祎：我也要送車什么車大家算了算

格力申請董瓷、明珠瓷和格力好老公等商標(biāo)

雷軍辟謠只招聘35歲以下員工：僅針對未來之星項(xiàng)目

雷軍曬健身房照片：此前設(shè)定100次健身打卡目標(biāo)

雷軍感謝網(wǎng)友祝他年入百萬：愿大家夢想成真今晚8點(diǎn)跨年直播

阿里巴巴AI“生意管家”: 400萬商家的秘密武器

蘋果市值一夜蒸發(fā)7248億此前官網(wǎng)已開啟降價(jià)活動(dòng)

拼手氣分紅包！支付寶宣布2025年集五福1月20日開啟

抖音副總裁回應(yīng)吳柳芳同名賬號(hào)被封：仿冒當(dāng)事人

董明珠曾喊話雷軍給股民分多少錢！格力：擬分紅超55億

蘋果官網(wǎng)突然降價(jià) 客服回應(yīng)能否退差價(jià)

俞敏洪稱東方甄選是火藥桶：未來一定會(huì)更加美好

站長商機(jī)