勝率達(dá)94.08%！李開復(fù)Yi-34B成績(jī)超過LLaMA2等主流大模型

2023-12-11 14:31 · 稿源：站長(zhǎng)之家

要點(diǎn):
李開復(fù)的Yi-34B-Chat模型在多個(gè)評(píng)測(cè)中取得顯著成績(jī)，勝率達(dá)94.08%，超越主流大模型如LLaMA2和ChatGPT。
該模型在加州大學(xué)伯克利分校主導(dǎo)的LMSYS ORG排行榜中以1102的Elo評(píng)分追平GPT-3.5，展現(xiàn)強(qiáng)大性能。在中文能力評(píng)測(cè)中，Yi-34B-Chat在SuperCLUE排行榜上以31.82%的對(duì)戰(zhàn)勝率僅次于GPT4-Turbo。
Yi-34B-Chat的成功得益于零一萬物團(tuán)隊(duì)的AI Alignment團(tuán)隊(duì)采用創(chuàng)新對(duì)齊策略，包括輕量化指令微調(diào)方案、多能力融合、對(duì)數(shù)據(jù)的關(guān)注等。

站長(zhǎng)之家（ChinaZ.com）12月11日消息:近期，李開復(fù)的Yi-34B-Chat模型在多個(gè)評(píng)測(cè)中大放異彩。其94.08%的勝率超越了LLaMA2和ChatGPT等主流大模型，尤其在加州大學(xué)伯克利分校主導(dǎo)的LMSYS ORG排行榜中，以1102的Elo評(píng)分追平了GPT-3.5。此外，在中文SuperCLUE排行榜上，Yi-34B-Chat以31.82%的勝率僅次于GPT4-Turbo。

通過對(duì)話場(chǎng)景實(shí)測(cè)，Yi-34B-Chat在不同對(duì)話場(chǎng)景中展現(xiàn)出優(yōu)越的實(shí)力。從對(duì)Transformer模型結(jié)構(gòu)的發(fā)展方向到生成小紅書文案，Yi-34B-Chat的回答均顯示其有理有據(jù)，符合當(dāng)前主流風(fēng)格。在中文理解方面，Yi-34B-Chat在復(fù)雜的中文理解問題上也展現(xiàn)了出色的精準(zhǔn)性。

項(xiàng)目地址:https://huggingface.co/01-ai

Yi-34B-Chat模型的卓越表現(xiàn)不僅僅源于其強(qiáng)基座系列，還得益于人工智能對(duì)齊團(tuán)隊(duì)的創(chuàng)新對(duì)齊策略。采用輕量化指令微調(diào)方案，單項(xiàng)能力提升和多項(xiàng)能力融合兩個(gè)階段的創(chuàng)新訓(xùn)練方式，以及關(guān)注數(shù)據(jù)質(zhì)量和指令多樣性等方面的獨(dú)特設(shè)計(jì)，使Yi-34B-Chat在各方面均有出色表現(xiàn)。

Yi-34B模型開源首月表現(xiàn)亮眼，在Hugging Face社區(qū)下載量高達(dá)16.8萬，魔搭社區(qū)下載量也達(dá)到1.2萬，GitHub上獲得超過4900個(gè)Stars。多家知名公司和機(jī)構(gòu)基于Yi模型基座推出的微調(diào)模型，如獵戶星空公司的OrionStar-Yi-34B-Chat模型、IDEA研究院的SUS-Chat-34B等，性能表現(xiàn)優(yōu)異。在GPU加速大模型的實(shí)驗(yàn)中，Yi-6B成為范例項(xiàng)目。

開發(fā)者Eric Hartford提出Yi模型使用了與LLaMA模型相同的架構(gòu)，引發(fā)了一場(chǎng)關(guān)于“抄襲”的質(zhì)疑。零一萬物團(tuán)隊(duì)意識(shí)到問題，及時(shí)在各開源平臺(tái)重新提交模型及代碼，完成了版本更新。然而，這一小問題在國(guó)內(nèi)被曲解，引發(fā)了一場(chǎng)輿論風(fēng)暴。團(tuán)隊(duì)強(qiáng)調(diào)，他們是從零開始打造Yi系列模型，重新命名僅為對(duì)比實(shí)驗(yàn)需求。

這一系列的成績(jī)和問題共同勾勒出Yi-34B-Chat模型的成功軌跡，盡管受到一些質(zhì)疑，但其在技術(shù)創(chuàng)新和用戶體驗(yàn)方面的表現(xiàn)仍然備受矚目。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

李開復(fù)

李開復(fù)周志華縱論AI大模型，萬字梳理MEET'25大咖激辯，320萬觀眾同見證

「ScalingLaw」和「打臉時(shí)刻」，絕對(duì)是2024年科技智能領(lǐng)域的年度關(guān)鍵詞。這是20余位工業(yè)界、學(xué)術(shù)界乃至投資界的頂流大咖，在量子位MEET2025智能未來大會(huì)上反復(fù)提及、探討的話題。后續(xù)還將有大會(huì)嘉賓更詳細(xì)版內(nèi)容分享，敬請(qǐng)關(guān)注！

?科技智能 ?Scaling ?Law
李開復(fù)：中國(guó)能做出碾壓美國(guó)的AI應(yīng)用！

零一萬物首席執(zhí)行官，創(chuàng)新工場(chǎng)董事長(zhǎng)李開復(fù)公開表示，中國(guó)能做出碾壓美國(guó)的AI應(yīng)用。AI時(shí)代是用人工智能、超級(jí)人工智能，比人還聰明的人工智能，賦能每個(gè)應(yīng)用，讓每個(gè)應(yīng)用重寫一次這個(gè)革命就在今年和明年開始會(huì)爆發(fā)，這就是我們面臨的最巨大的一個(gè)機(jī)會(huì)。因?yàn)槲覈?guó)的模型可能落后美國(guó)一段時(shí)間，但是我們的應(yīng)用是結(jié)果超過美國(guó)的。

?人工智能 ?創(chuàng)新科技 ?AI應(yīng)用
薦2024，大模型殺進(jìn)“決賽圈”

HenryChesbrough在著作《通過技術(shù)創(chuàng)新盈利勢(shì)在必行》中，曾提出過一個(gè)創(chuàng)新的“漏斗模型”。開放式創(chuàng)新一開始鼓勵(lì)百花齊放，但最終只有10%的技術(shù)能夠通過這個(gè)漏斗，成功抵達(dá)目標(biāo)市場(chǎng)targetmarket，進(jìn)入到商業(yè)化與產(chǎn)業(yè)化的下一個(gè)階段其余的90%的技術(shù)，逐漸淡出人們的視野?！叭巳私钥葾I”的2025離我們?cè)絹碓浇恕?/p>

?開放式創(chuàng)新 ?技術(shù)創(chuàng)新 ?大模型
脈脈2024MAX年度職得去公司首推大模型榜單商湯、智譜、趣丸上榜

職場(chǎng)社交和社區(qū)平臺(tái)脈脈公布了2024MAX年度職得去公司評(píng)選獲獎(jiǎng)名單。字節(jié)跳動(dòng)、騰訊、京東、星巴克中國(guó)等企業(yè)榮獲年度職得去雇主。求職者也可以發(fā)現(xiàn)更多值得去的好公司，把握職場(chǎng)發(fā)展新機(jī)遇。

?脈脈 ?職場(chǎng)社交 ?年度職得去雇主
AMD RX 9070 XT功耗、性能有驚喜！可媲美RTX 4080

AMD新一代最高端顯卡已確認(rèn)命名為RX9070XT，當(dāng)然不是真正的旗艦，不可能去競(jìng)爭(zhēng)RTX5090甚至是RTX5080。之前有曝料顯示，RX9070XTTimeSpy基準(zhǔn)跑分只稍高于RX7900GRE不如現(xiàn)有次旗艦RX7900XT，對(duì)比競(jìng)品大致相當(dāng)于RTX4070Ti。RX9070XT應(yīng)該會(huì)和未來的RTX5070差不多，不太可能追上RTX5070Ti。

?AMD ?RX ?9070
華為鴻蒙智行尊界 S800開啟預(yù)訂 48 小時(shí)訂單達(dá) 2108 臺(tái)

尊界汽車近日宣布，其首款車型S800自預(yù)售開啟以來，在短短48小時(shí)內(nèi)便收獲了2108臺(tái)的訂單，這一成績(jī)對(duì)于一款起售價(jià)超過百萬元的國(guó)產(chǎn)轎車言，標(biāo)志著一個(gè)歷史性的突破。尊界S800是華為與江淮合作打造的百萬級(jí)旗艦轎車，預(yù)售價(jià)定在100-150萬元之間。這一訂單成績(jī)不僅是對(duì)尊界S800品質(zhì)的認(rèn)可，也是對(duì)國(guó)產(chǎn)汽車品牌向上突破的有力證明。

?尊界汽車 ?S800車型 ?華為江淮合作
薦大模型拿單江湖

11月29日，智譜AgentOpenDay會(huì)后，現(xiàn)場(chǎng)有記者問了CEO張鵬一個(gè)問題:“ToB進(jìn)展如何?”“還行吧”，至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當(dāng)中，其同臺(tái)競(jìng)爭(zhēng)對(duì)手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

?智譜Agent ?大模型 ?AI公司
·微星雷影17性價(jià)比新爆款：AMD 7840HX+滿血4060國(guó)補(bǔ)6080到手！

對(duì)于準(zhǔn)備購買游戲本的小伙伴，除了雙12大促國(guó)補(bǔ)政策的雙重福利，微星筆記本更是在打造爆款上，再次帶來驚喜：熱賣機(jī)型雷影17全新性價(jià)比配置，首發(fā)價(jià)7599元的基礎(chǔ)上，已經(jīng)進(jìn)入國(guó)補(bǔ)政策名單，至高補(bǔ)貼20%，到手價(jià)僅需6080元。*政府補(bǔ)貼20%優(yōu)惠，具體根據(jù)不同地區(qū)政策情況，詳情可咨詢客服雷影17——7840HXRTX4060全新爆款，國(guó)補(bǔ)到手價(jià)6080元：https://item.jd.com/100127748745.html雷影17作為AMD平臺(tái)游戲本的超高性價(jià)比擔(dān)當(dāng)，確實(shí)做到了“實(shí)惠又大杯”，此前的7945HX4060的配置，可以說在移動(dòng)端多核生產(chǎn)力上一騎絕塵，結(jié)合國(guó)補(bǔ)不到7K的售價(jià)簡(jiǎn)直不要太香！2年全國(guó)聯(lián)保2年到府服務(wù)的完善售后政策，500線下服務(wù)中心的覆蓋，各位龍騎士也可以放心購買~微星雷影17在“微星游戲本京東自營(yíng)官方旗艦店”爆款熱銷中，如此神仙單品，如此超值價(jià)格，你的下一臺(tái)游戲本很有可能就是它，不要錯(cuò)過哦！

?微星筆記本 ?雷影17 ?游戲本性價(jià)比
小米SU7最新版本OTA推送：正式接入VLM視覺語言大模型

小米汽車官方宣布，小米SU7汽車已接收到XiaomiHyperOS1.4.5版本的OTA更新，此次更新帶來了13項(xiàng)新功能和26項(xiàng)體驗(yàn)優(yōu)化。更新亮點(diǎn)包括VLM視覺語言大模型的接入，使系統(tǒng)能夠識(shí)別復(fù)雜道路環(huán)境和特殊交通規(guī)則區(qū)域，并通過文字和語音提示駕駛員。還優(yōu)化了胎壓報(bào)警觸發(fā)時(shí)的報(bào)警彈窗、制動(dòng)系統(tǒng)熱衰后報(bào)警提示、電動(dòng)尾翼功能和電動(dòng)尾翼與后備箱之間的邏輯。

?小米汽車 ?Xiaomi ?HyperOS
薦大模型，在內(nèi)卷中尋找出口

2024年，大模型進(jìn)展不斷。從年初的Sora到最新的o3，更新更好的模型不斷被推出，“內(nèi)卷”到底有沒有發(fā)生?我們要先確定“內(nèi)卷”的定義，指某一類產(chǎn)業(yè)模式，發(fā)展到一種確定形式后，陷入“高水平均衡陷阱”，出現(xiàn)“沒有發(fā)展的增長(zhǎng)”，這種局面一直無法被打破，那就會(huì)走向停滯和危機(jī)。大模型要取得商業(yè)成功，前提是用戶和開發(fā)者的業(yè)務(wù)能否成功，這是為什么完善的商業(yè)基

?大模型進(jìn)展 ?內(nèi)卷現(xiàn)象 ?scaling

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

勝率達(dá)94.08%！李開復(fù)Yi-34B成績(jī)超過LLaMA2等主流大模型

李開復(fù)周志華縱論AI大模型，萬字梳理MEET'25大咖激辯，320萬觀眾同見證

李開復(fù)：中國(guó)能做出碾壓美國(guó)的AI應(yīng)用！

薦2024，大模型殺進(jìn)“決賽圈”

脈脈2024MAX年度職得去公司首推大模型榜單商湯、智譜、趣丸上榜

AMD RX 9070 XT功耗、性能有驚喜！可媲美RTX 4080

華為鴻蒙智行尊界 S800開啟預(yù)訂 48 小時(shí)訂單達(dá) 2108 臺(tái)

薦大模型拿單江湖

·微星雷影17性價(jià)比新爆款：AMD 7840HX+滿血4060國(guó)補(bǔ)6080到手！

小米SU7最新版本OTA推送：正式接入VLM視覺語言大模型

薦大模型，在內(nèi)卷中尋找出口

熱文

余承東：華為明年將推出大家想不到的產(chǎn)品

董明珠回應(yīng)格力電器賣得貴：為消費(fèi)者帶來更長(zhǎng)遠(yuǎn)的價(jià)值

抖音完成100部老港片4K高清修復(fù)：已上線抖音、西瓜視頻

抖音副總裁回應(yīng)吳柳芳再次被禁：分歧很大將根據(jù)法律執(zhí)行好

周鴻祎稱被車門夾傷的手成頑固傷：近3個(gè)月沒攀巖

2024財(cái)富縮水最多的5位億萬富豪：拼多多創(chuàng)始人黃崢上榜今年夏

董明珠稱網(wǎng)暴編的太離譜：破壞網(wǎng)絡(luò)環(huán)境清者自清

小米申請(qǐng)新車YU7商標(biāo)：為明年6、7月量產(chǎn)上市做準(zhǔn)備！

漲薪30%之后京東：超2萬名京東客服月固定工資將大幅提升全員

吳柳芳賬號(hào)再次被禁粉絲從600萬被清理至4萬抖音：低俗內(nèi)容吸

余承東：華為明年將推出大家想不到的產(chǎn)品

劉強(qiáng)東提前發(fā)年終獎(jiǎng) 絕大多數(shù)員工可獲5到8個(gè)月年終獎(jiǎng)

京東發(fā)布年終獎(jiǎng)通知部分員工年前可收到年終獎(jiǎng)

肯德基中國(guó)漲價(jià) 官方回應(yīng)：運(yùn)營(yíng)成本變化導(dǎo)致

美團(tuán)回應(yīng)騎手穿點(diǎn)男模字樣工服：博流量惡意炒作

騰訊張軍辟謠微信送禮會(huì)議紀(jì)要：只想做點(diǎn)腳踏實(shí)地的事

董明珠回應(yīng)格力電器賣得貴：為消費(fèi)者帶來更長(zhǎng)遠(yuǎn)的價(jià)值

小米SU7最新版本OTA推送：正式接入VLM視覺語言大模型

李斌回應(yīng)螢火蟲外觀設(shè)計(jì)：看過實(shí)車的人都喜歡這個(gè)設(shè)計(jì)

站長(zhǎng)商機(jī)

勝率達(dá)94.08%！李開復(fù)Yi-34B成績(jī)超過LLaMA2等主流大模型

熱文

站長(zhǎng)商機(jī)

勝率達(dá)94.08%！李開復(fù)Yi-34B成績(jī)超過LLaMA2等主流大模型