鴨嘴獸-70B登頂HuggingFace開(kāi)源大模型排行榜

2023-08-24 09:52 · 稿源：站長(zhǎng)之家

要點(diǎn):
鴨嘴獸-70B使用優(yōu)化過(guò)的數(shù)據(jù)集Open-Platypus訓(xùn)練，刪除相似和重復(fù)問(wèn)題。
應(yīng)用LoRA和PEFT對(duì)模型進(jìn)行微調(diào)，重點(diǎn)優(yōu)化非注意力模塊。
檢查并解決測(cè)試數(shù)據(jù)泄漏和訓(xùn)練數(shù)據(jù)污染問(wèn)題。

站長(zhǎng)之家（ChinaZ.com）8月24日消息:最近，來(lái)自波士頓大學(xué)的鴨嘴獸-70B模型登頂了HuggingFace的開(kāi)源大模型排行榜，成為目前全球開(kāi)源領(lǐng)域中表現(xiàn)最強(qiáng)的語(yǔ)言模型。鴨嘴獸的變強(qiáng)有以下三個(gè)關(guān)鍵原因:

首先，鴨嘴獸使用了一個(gè)經(jīng)過(guò)優(yōu)化的開(kāi)源數(shù)據(jù)集Open-Platypus進(jìn)行訓(xùn)練。該數(shù)據(jù)集由11個(gè)開(kāi)源數(shù)據(jù)集組合而成，主要包含人工設(shè)計(jì)的問(wèn)題，只有約10%的問(wèn)題是由語(yǔ)言模型生成。同時(shí)，研究人員對(duì)數(shù)據(jù)集進(jìn)行了處理，刪除了相似和重復(fù)的問(wèn)題，最大限度地減少了數(shù)據(jù)冗余。這有助于模型在更小的數(shù)據(jù)集上獲取更強(qiáng)大的能力。

其次，研究人員使用了低秩逼近（LoRA）和參數(shù)高效微調(diào)(PEFT)對(duì)鴨嘴獸模型進(jìn)行了微調(diào)。與完全微調(diào)不同，LoRA只訓(xùn)練轉(zhuǎn)換層中的可訓(xùn)練參數(shù)，從而大大降低了計(jì)算訓(xùn)練成本。PEFT則主要微調(diào)了非注意力模塊，如門(mén)控單元和上下采樣模塊，這進(jìn)一步提升了模型性能。相比僅優(yōu)化注意力模塊，這種方法取得了更好的效果。

論文地址:https://arxiv.org/pdf/2308.07317.pdf

最后，研究人員深入探索了開(kāi)放式語(yǔ)言模型訓(xùn)練中存在的數(shù)據(jù)污染問(wèn)題，并針對(duì)鴨嘴獸的數(shù)據(jù)集進(jìn)行了嚴(yán)格過(guò)濾。他們開(kāi)發(fā)了一套啟發(fā)式方法，仔細(xì)檢查訓(xùn)練集中與測(cè)試集相似的問(wèn)題，刪除或以任何方式將其標(biāo)記為潛在的測(cè)試數(shù)據(jù)泄露，避免了測(cè)試數(shù)據(jù)非故意地進(jìn)入訓(xùn)練集，保證了模型評(píng)估的公平性。

通過(guò)數(shù)據(jù)集優(yōu)化、模型微調(diào)技巧以及數(shù)據(jù)質(zhì)量控制，鴨嘴獸-70B得以在眾多開(kāi)源大模型中脫穎而出，登上榜首。這為語(yǔ)言模型的訓(xùn)練提供了寶貴經(jīng)驗(yàn)，也使開(kāi)源社區(qū)對(duì)自主研發(fā)強(qiáng)大AI模型更具信心。如果社會(huì)各界能堅(jiān)持開(kāi)放創(chuàng)新、合作共贏的理念，我們離強(qiáng)人工智能的到來(lái)就不會(huì)太遠(yuǎn)了。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

開(kāi)源大模型

薦AI日?qǐng)?bào)：阿里通義開(kāi)源多模態(tài)推理模型QVQ-72B；OpenAI考慮自研人形機(jī)器人；QQ音樂(lè)上線首個(gè)AI大模型音效

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里發(fā)布多模態(tài)推理模型QVQ-72B!視覺(jué)、語(yǔ)言能力雙提升阿里巴巴最近推出的QVQ-72B多模態(tài)推理模型在語(yǔ)言和視覺(jué)能力上實(shí)現(xiàn)了顯著提升，能夠處理復(fù)雜的推理和分析任務(wù)，尤其在多步推理和數(shù)學(xué)推理方面表現(xiàn)突出。盡管o1-preview在某些方面表現(xiàn)優(yōu)秀，但在實(shí)際應(yīng)用中仍面臨高成本和不切實(shí)際的測(cè)試建議等問(wèn)題。

?人工智能 ?多模態(tài)推理 ?阿里巴巴
薦大模型拿單江湖

11月29日，智譜AgentOpenDay會(huì)后，現(xiàn)場(chǎng)有記者問(wèn)了CEO張鵬一個(gè)問(wèn)題:“ToB進(jìn)展如何?”“還行吧”，至此張鵬沒(méi)有再多說(shuō)一句。這家明星AI公司深度參與到大模型的廝殺當(dāng)中，其同臺(tái)競(jìng)爭(zhēng)對(duì)手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見(jiàn)底了。

?智譜Agent ?大模型 ?AI公司
薦突破算力限制！Meta開(kāi)源“記憶層”，重塑Transformer架構(gòu)大模型

今天凌晨3點(diǎn)，全球社交巨頭Meta分享了一個(gè)創(chuàng)新研究——Memorylayers。Transformer架構(gòu)的預(yù)訓(xùn)練大模型在存儲(chǔ)、查詢數(shù)據(jù)時(shí)，隨著參數(shù)的變大對(duì)算力的需求呈指數(shù)級(jí)增長(zhǎng)。這樣的設(shè)計(jì)既簡(jiǎn)化了維護(hù)流程，又提高了系統(tǒng)的靈活性和適應(yīng)性。

?Meta
昇騰AI平臺(tái)訓(xùn)練推理！中國(guó)聯(lián)通元景文生圖大模型開(kāi)源：真正懂中文

中國(guó)聯(lián)通宣布，聯(lián)通數(shù)據(jù)智能公司打造、首個(gè)完全在國(guó)產(chǎn)昇騰AI軟硬件平臺(tái)上實(shí)現(xiàn)訓(xùn)練和推理的中文原生文生圖模型聯(lián)通元景文生圖模型”，正式開(kāi)源。該模型實(shí)現(xiàn)了多項(xiàng)自主創(chuàng)新突破：首先是在架構(gòu)上，通過(guò)在SDXL架構(gòu)中融合復(fù)合語(yǔ)言編碼模塊，實(shí)現(xiàn)了對(duì)中文長(zhǎng)文本、多屬性對(duì)應(yīng)和中文特色詞匯的精確語(yǔ)義理解，對(duì)應(yīng)圖像的生成效果得到了極大提升。該模型已在聯(lián)通的多個(gè)內(nèi)?

?中國(guó)聯(lián)通 ?昇騰AI ?文生圖模型
薦大模型，在內(nèi)卷中尋找出口

2024年，大模型進(jìn)展不斷。從年初的Sora到最新的o3，更新更好的模型不斷被推出，“內(nèi)卷”到底有沒(méi)有發(fā)生?我們要先確定“內(nèi)卷”的定義，指某一類(lèi)產(chǎn)業(yè)模式，發(fā)展到一種確定形式后，陷入“高水平均衡陷阱”，出現(xiàn)“沒(méi)有發(fā)展的增長(zhǎng)”，這種局面一直無(wú)法被打破，那就會(huì)走向停滯和危機(jī)。大模型要取得商業(yè)成功，前提是用戶和開(kāi)發(fā)者的業(yè)務(wù)能否成功，這是為什么完善的商業(yè)基

?大模型進(jìn)展 ?內(nèi)卷現(xiàn)象 ?scaling
薦科研也完了，AI暴虐170位人類(lèi)專家，Nature子刊：大模型精準(zhǔn)預(yù)測(cè)研究結(jié)果，準(zhǔn)確率高達(dá)81%

知識(shí)密集型工作也敗了!大型語(yǔ)言模型在預(yù)測(cè)神經(jīng)科學(xué)結(jié)果方面超越了人類(lèi)專家，平均準(zhǔn)確率達(dá)到81%人類(lèi)專家僅為63%;模型通過(guò)整合大量文獻(xiàn)數(shù)據(jù)，展現(xiàn)出了驚人的前瞻性預(yù)測(cè)能力，預(yù)示著未來(lái)科研工作中人機(jī)協(xié)作的巨大潛力。在現(xiàn)代化工具的幫助下，科研人員的群體規(guī)模、效率都有顯著提升，發(fā)表科學(xué)文獻(xiàn)的數(shù)量幾乎是呈指數(shù)級(jí)增長(zhǎng)人類(lèi)的閱讀效率卻幾乎沒(méi)有提升，新入行的研

?大型語(yǔ)言模型 ?神經(jīng)科學(xué) ?人機(jī)協(xié)作
薦AI大模型時(shí)代，人才的需求已經(jīng)變了

什么是AI發(fā)展的第一驅(qū)動(dòng)力?最近，全球科技大廠都在用行動(dòng)告訴我們:人才。谷歌NotebookLM的核心團(tuán)隊(duì)共同宣布離職創(chuàng)業(yè)，他們新公司的網(wǎng)站已經(jīng)進(jìn)入了「建設(shè)中」的狀態(tài)。但要真正解決AI人才短缺的問(wèn)題需要更多企業(yè)、高校和社會(huì)各界的共同努力。

?大模型
豆包說(shuō)要「普惠」，于是大模型處理圖片按「厘」計(jì)價(jià)了

OpenAI宣告連續(xù)12輪轟炸，讓2024年底的大模型領(lǐng)域熱鬧起來(lái)了。但堅(jiān)持每個(gè)凌晨看直播的話會(huì)發(fā)現(xiàn)，越到后面的發(fā)布越平淡，內(nèi)心的波動(dòng)也越少了。豆包大模型還有哪些驚喜?值得每一個(gè)人期待。

?大模型 ?OpenAI ?豆包視覺(jué)理解
薦視頻生成大模型賽道，只是看上去擁擠

2024年最后一個(gè)月，國(guó)產(chǎn)大模型落地應(yīng)用突然加速。尤其視頻生成模型，就像密集射出子彈后的槍管，熱得發(fā)燙。AI一天，人間一年。

?國(guó)產(chǎn)大模型 ?視頻生成模型 ?AI導(dǎo)演
家用車(chē)優(yōu)選，大空間SUV排行榜中的上汽大通MAXUS領(lǐng)地

隨著SUV市場(chǎng)的不斷擴(kuò)大，大空間SUV逐漸成為家庭購(gòu)車(chē)的熱門(mén)選擇。大空間不僅意味著更舒適的乘坐體驗(yàn)，更為家庭出行、長(zhǎng)途旅行和日常購(gòu)物提供了更多的便利。并且提供5000元現(xiàn)金優(yōu)惠和最高4000元的置換補(bǔ)貼，再加上36-60期低息金融方案，不僅讓車(chē)主在購(gòu)車(chē)時(shí)能享受實(shí)實(shí)在在的優(yōu)惠能為未來(lái)的用車(chē)帶來(lái)更多的便利。

?大空間SUV ?上汽大通MAXUS ?家庭購(gòu)車(chē)選項(xiàng)

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

鴨嘴獸-70B登頂HuggingFace開(kāi)源大模型排行榜

薦AI日?qǐng)?bào)：阿里通義開(kāi)源多模態(tài)推理模型QVQ-72B；OpenAI考慮自研人形機(jī)器人；QQ音樂(lè)上線首個(gè)AI大模型音效

薦大模型拿單江湖

薦突破算力限制！Meta開(kāi)源“記憶層”，重塑Transformer架構(gòu)大模型

昇騰AI平臺(tái)訓(xùn)練推理！中國(guó)聯(lián)通元景文生圖大模型開(kāi)源：真正懂中文

薦大模型，在內(nèi)卷中尋找出口

薦科研也完了，AI暴虐170位人類(lèi)專家，Nature子刊：大模型精準(zhǔn)預(yù)測(cè)研究結(jié)果，準(zhǔn)確率高達(dá)81%

薦AI大模型時(shí)代，人才的需求已經(jīng)變了

豆包說(shuō)要「普惠」，于是大模型處理圖片按「厘」計(jì)價(jià)了

薦視頻生成大模型賽道，只是看上去擁擠

家用車(chē)優(yōu)選，大空間SUV排行榜中的上汽大通MAXUS領(lǐng)地

熱文

蘋(píng)果市值一夜蒸發(fā)7248億此前官網(wǎng)已開(kāi)啟降價(jià)活動(dòng)

雷軍親自出面海底撈正式入駐小米科技園全體員工88折

辛巴要花15億開(kāi)超市：號(hào)稱將改變大家消費(fèi)習(xí)慣

周鴻祎：打工不可能賺大錢(qián) 創(chuàng)業(yè)才能財(cái)富自由

法拉第未來(lái)股價(jià)一夜暴漲超50% 第二品牌FX原型車(chē)即將亮相

胖東來(lái)正式規(guī)定員工不得收付彩禮、依靠父母買(mǎi)房買(mǎi)車(chē)

1999元全球首款媽祖平安智能手表發(fā)布：搭載華為智能機(jī)芯

抖音宣布將加強(qiáng)內(nèi)容推薦多樣性破除“信息繭房”

周鴻祎：我也要送車(chē) 什么車(chē)大家算了算

格力申請(qǐng)董瓷、明珠瓷和格力好老公等商標(biāo)

雷軍辟謠只招聘35歲以下員工：僅針對(duì)未來(lái)之星項(xiàng)目

雷軍曬健身房照片：此前設(shè)定100次健身打卡目標(biāo)

雷軍感謝網(wǎng)友祝他年入百萬(wàn)：愿大家夢(mèng)想成真今晚8點(diǎn)跨年直播

阿里巴巴AI“生意管家”: 400萬(wàn)商家的秘密武器

蘋(píng)果市值一夜蒸發(fā)7248億此前官網(wǎng)已開(kāi)啟降價(jià)活動(dòng)

拼手氣分紅包！支付寶宣布2025年集五福1月20日開(kāi)啟

抖音副總裁回應(yīng)吳柳芳同名賬號(hào)被封：仿冒當(dāng)事人

董明珠曾喊話雷軍給股民分多少錢(qián)！格力：擬分紅超55億

俞敏洪稱東方甄選是火藥桶：未來(lái)一定會(huì)更加美好

蘋(píng)果官網(wǎng)突然降價(jià) 客服回應(yīng)能否退差價(jià)

站長(zhǎng)商機(jī)