幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關(guān)鍵詞  > 大模型最新資訊  > 正文

華盛頓大學(xué)推高效大模型調(diào)優(yōu)方法“代理調(diào)優(yōu)”

2024-01-24 09:11 · 稿源:站長之家

要點(diǎn):

1、代理調(diào)優(yōu)方法無需接觸模型的內(nèi)部權(quán)重。

2、通過對比小型調(diào)整模型和未調(diào)整模型的預(yù)測結(jié)果來引導(dǎo)基礎(chǔ)模型的預(yù)測。

3、代理調(diào)優(yōu)方法能夠在解碼時(shí)更好地保留訓(xùn)練知識(shí)。

站長之家(ChinaZ.com)1月24日 消息:華盛頓大學(xué)推出更高效的大模型調(diào)優(yōu)方法“代理調(diào)優(yōu)”,該方法通過對比小型調(diào)整模型和未調(diào)整模型的預(yù)測結(jié)果來引導(dǎo)基礎(chǔ)模型的預(yù)測,實(shí)現(xiàn)對模型的調(diào)優(yōu)而無需接觸模型的內(nèi)部權(quán)重。

隨著ChatGPT等生成式AI產(chǎn)品的發(fā)展,基礎(chǔ)模型的參數(shù)不斷增加,因此進(jìn)行權(quán)重調(diào)優(yōu)需要耗費(fèi)大量時(shí)間和算力。為提升調(diào)優(yōu)效率,該方法可以在解碼時(shí)更好地保留訓(xùn)練知識(shí),同時(shí)保留更大規(guī)模預(yù)訓(xùn)練的優(yōu)勢。研究人員對LlAMA-2的13B、70B原始模型進(jìn)行了微調(diào),結(jié)果顯示代理調(diào)優(yōu)的性能比直接調(diào)優(yōu)的模型更高。

image.png

論文地址:https://arxiv.org/pdf/2401.08565.pdf

該方法需要準(zhǔn)備一個(gè)小型的預(yù)訓(xùn)練語言模型M-,與基礎(chǔ)模型M共享相同的詞匯表,然后使用訓(xùn)練數(shù)據(jù)對M-進(jìn)行調(diào)優(yōu)得到調(diào)優(yōu)模型M+。

在解碼時(shí),通過對比基礎(chǔ)模型M的輸出預(yù)測分布和調(diào)優(yōu)模型M+的輸出預(yù)測分布之間的差異,來引導(dǎo)基礎(chǔ)模型的預(yù)測,最后將預(yù)測差異應(yīng)用于基礎(chǔ)模型的預(yù)測結(jié)果,以引導(dǎo)基礎(chǔ)模型的預(yù)測朝向調(diào)優(yōu)模型的預(yù)測方向移動(dòng)。這一方法與大模型中的“蒸餾”技術(shù)恰恰相反,是一種創(chuàng)新性的調(diào)優(yōu)方法。

代理調(diào)優(yōu)方法的推出,為大模型的調(diào)優(yōu)提供了更高效的解決方案,同時(shí)也可以在解碼時(shí)更好地保留訓(xùn)練知識(shí),使得模型的性能更高。這一方法的推出將為AI領(lǐng)域的發(fā)展帶來新的啟示,值得進(jìn)一步深入研究和應(yīng)用。

舉報(bào)

  • 相關(guān)推薦
  • 大模型拿單江湖

    11月29日,智譜AgentOpenDay會(huì)后,現(xiàn)場有記者問了CEO張鵬一個(gè)問題:“ToB進(jìn)展如何?”“還行吧”,至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當(dāng)中,其同臺(tái)競爭對手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

  • 科龍睡眠空調(diào)小耳朵語音款LK上市,配語音高效省電

    隨著科技的迅猛發(fā)展,智能家居系統(tǒng)逐漸成為現(xiàn)代生活不可或缺的一部分。在這一科技不斷演進(jìn)的時(shí)代,人們對于創(chuàng)新生活方式的追求愈發(fā)強(qiáng)烈。通過持續(xù)的技術(shù)革新以及對用戶需求的深刻洞察,科龍空調(diào)致力于為消費(fèi)者提供更為舒適、健康、智能化的家居生活解決方案。

  • 大模型,在內(nèi)卷中尋找出口

    2024年,大模型進(jìn)展不斷。從年初的Sora到最新的o3,更新更好的模型不斷被推出,“內(nèi)卷”到底有沒有發(fā)生?我們要先確定“內(nèi)卷”的定義,指某一類產(chǎn)業(yè)模式,發(fā)展到一種確定形式后,陷入“高水平均衡陷阱”,出現(xiàn)“沒有發(fā)展的增長”,這種局面一直無法被打破,那就會(huì)走向停滯和危機(jī)。大模型要取得商業(yè)成功,前提是用戶和開發(fā)者的業(yè)務(wù)能否成功,這是為什么完善的商業(yè)基

  • 九號(hào)機(jī)器人方糖,打造智能、高效送物解決方案

    現(xiàn)代社會(huì)越來越講究高效率,對于一些簡單但高重復(fù)的工作,除了人手勞作,目前也有越來越多領(lǐng)域應(yīng)用到智能機(jī)器人。在酒店、寫字樓、商場、醫(yī)院等場景,配送機(jī)器人的普及率就越來越高。以上提到的九號(hào)機(jī)器人方糖,就可以為多種業(yè)務(wù)場景提供整套解決方案,為商業(yè)場景智慧化賦能。

  • 身邊云攜手知名在線閱讀平臺(tái),打造高效會(huì)員營銷體系

    據(jù)《2023年度中國數(shù)字閱讀報(bào)告》顯示,我國數(shù)字閱讀用戶規(guī)模高達(dá)5.7億。在線閱讀平臺(tái)已成為人們獲取知識(shí)的重要渠道,各大平臺(tái)紛紛推出營銷活動(dòng)吸引并激活用戶,網(wǎng)絡(luò)紅包作為一種高效促活手段深受用戶喜愛,然其背后隱藏的稅務(wù)風(fēng)險(xiǎn)與高昂成本卻成為了制約平臺(tái)長遠(yuǎn)發(fā)展的痛點(diǎn)。身邊云將繼續(xù)深耕數(shù)字營銷領(lǐng)域,為更多企業(yè)提供高效、合規(guī)、創(chuàng)新的營銷解決方案,共同探索在線閱讀行業(yè)的新增長點(diǎn),開啟智慧營銷的新篇章。

  • 省電高效!小米空調(diào)技術(shù)獲節(jié)能減排科技進(jìn)步二等獎(jiǎng)

    據(jù)小米官方消息,小米基于物聯(lián)網(wǎng)的智能空調(diào)低碳運(yùn)行技術(shù)”榮獲中國節(jié)能協(xié)會(huì)節(jié)能減排科技進(jìn)步二等獎(jiǎng)。該技術(shù)通過智能算法模型實(shí)時(shí)尋優(yōu)控制,實(shí)現(xiàn)不同工況下的高效運(yùn)行、智能省電,為用戶提供更節(jié)能、更舒適的使用體驗(yàn)。采用創(chuàng)新的上出風(fēng)設(shè)計(jì),能夠使氣流在室內(nèi)形成環(huán)流,解決了傳統(tǒng)空調(diào)冷風(fēng)直吹帶來的不適問題。

  • 電動(dòng)貨車怎么選?高效環(huán)保又省心,看看上汽大通MAXUS新途EV80

    隨著物流行業(yè)的快速發(fā)展,電動(dòng)貨車因其低成本、環(huán)保的特點(diǎn)逐漸成為許多消費(fèi)者的首選。不僅國家對新能源車型提供政策支持,電動(dòng)貨車自身的經(jīng)濟(jì)性也讓它在市場上站穩(wěn)了腳跟。它不僅是運(yùn)輸?shù)暮脦褪?,更是助你?shí)現(xiàn)事業(yè)騰飛的好伙伴!

  • AI大模型時(shí)代,人才的需求已經(jīng)變了

    什么是AI發(fā)展的第一驅(qū)動(dòng)力?最近,全球科技大廠都在用行動(dòng)告訴我們:人才。谷歌NotebookLM的核心團(tuán)隊(duì)共同宣布離職創(chuàng)業(yè),他們新公司的網(wǎng)站已經(jīng)進(jìn)入了「建設(shè)中」的狀態(tài)。但要真正解決AI人才短缺的問題需要更多企業(yè)、高校和社會(huì)各界的共同努力。

  • 半導(dǎo)體存儲(chǔ)品牌企業(yè)江波龍,助力工業(yè)自動(dòng)化高效穩(wěn)定

    固態(tài)硬盤SSD作為工業(yè)自動(dòng)化的核心,無論是運(yùn)動(dòng)控制、邏輯控制還是連續(xù)控制過程,無不需要核心的控制平臺(tái)。從PLC、PAC、DCS、工業(yè)PC、嵌入式到運(yùn)動(dòng)控制卡,不同的控制器核心在進(jìn)行各種指令接收處理和運(yùn)算的過程中,無不涉及存儲(chǔ)及運(yùn)行數(shù)據(jù)的一項(xiàng)關(guān)鍵——固態(tài)硬盤SSD。江波龍也將持續(xù)以PTM模式投身工業(yè)自動(dòng)化行業(yè),與客戶聯(lián)合創(chuàng)新,持續(xù)攻關(guān),為我國工業(yè)自動(dòng)化、數(shù)字化、智能化發(fā)展貢獻(xiàn)更多力量。

  • 豆包說要「普惠」,于是大模型處理圖片按「厘」計(jì)價(jià)了

    OpenAI宣告連續(xù)12輪轟炸,讓2024年底的大模型領(lǐng)域熱鬧起來了。但堅(jiān)持每個(gè)凌晨看直播的話會(huì)發(fā)現(xiàn),越到后面的發(fā)布越平淡,內(nèi)心的波動(dòng)也越少了。豆包大模型還有哪些驚喜?值得每一個(gè)人期待。

熱文

  • 3 天
  • 7天