幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關(guān)鍵詞  > 李開復(fù)最新資訊  > 正文

勝率達(dá)94.08%!李開復(fù)Yi-34B成績(jī)超過LLaMA2等主流大模型

2023-12-11 14:31 · 稿源:站長(zhǎng)之家

要點(diǎn):

  • 李開復(fù)的Yi-34B-Chat模型在多個(gè)評(píng)測(cè)中取得顯著成績(jī),勝率達(dá)94.08%,超越主流大模型如LLaMA2和ChatGPT。

  • 該模型在加州大學(xué)伯克利分校主導(dǎo)的LMSYS ORG排行榜中以1102的Elo評(píng)分追平GPT-3.5,展現(xiàn)強(qiáng)大性能。在中文能力評(píng)測(cè)中,Yi-34B-Chat在SuperCLUE排行榜上以31.82%的對(duì)戰(zhàn)勝率僅次于GPT4-Turbo。

  • Yi-34B-Chat的成功得益于零一萬物團(tuán)隊(duì)的AI Alignment團(tuán)隊(duì)采用創(chuàng)新對(duì)齊策略,包括輕量化指令微調(diào)方案、多能力融合、對(duì)數(shù)據(jù)的關(guān)注等。

站長(zhǎng)之家(ChinaZ.com)12月11日 消息:近期,李開復(fù)的Yi-34B-Chat模型在多個(gè)評(píng)測(cè)中大放異彩。其94.08%的勝率超越了LLaMA2和ChatGPT等主流大模型,尤其在加州大學(xué)伯克利分校主導(dǎo)的LMSYS ORG排行榜中,以1102的Elo評(píng)分追平了GPT-3.5。此外,在中文SuperCLUE排行榜上,Yi-34B-Chat以31.82%的勝率僅次于GPT4-Turbo。

通過對(duì)話場(chǎng)景實(shí)測(cè),Yi-34B-Chat在不同對(duì)話場(chǎng)景中展現(xiàn)出優(yōu)越的實(shí)力。從對(duì)Transformer模型結(jié)構(gòu)的發(fā)展方向到生成小紅書文案,Yi-34B-Chat的回答均顯示其有理有據(jù),符合當(dāng)前主流風(fēng)格。在中文理解方面,Yi-34B-Chat在復(fù)雜的中文理解問題上也展現(xiàn)了出色的精準(zhǔn)性。

image.png

項(xiàng)目地址:https://huggingface.co/01-ai

Yi-34B-Chat模型的卓越表現(xiàn)不僅僅源于其強(qiáng)基座系列,還得益于人工智能對(duì)齊團(tuán)隊(duì)的創(chuàng)新對(duì)齊策略。采用輕量化指令微調(diào)方案,單項(xiàng)能力提升和多項(xiàng)能力融合兩個(gè)階段的創(chuàng)新訓(xùn)練方式,以及關(guān)注數(shù)據(jù)質(zhì)量和指令多樣性等方面的獨(dú)特設(shè)計(jì),使Yi-34B-Chat在各方面均有出色表現(xiàn)。

Yi-34B模型開源首月表現(xiàn)亮眼,在Hugging Face社區(qū)下載量高達(dá)16.8萬,魔搭社區(qū)下載量也達(dá)到1.2萬,GitHub上獲得超過4900個(gè)Stars。多家知名公司和機(jī)構(gòu)基于Yi模型基座推出的微調(diào)模型,如獵戶星空公司的OrionStar-Yi-34B-Chat模型、IDEA研究院的SUS-Chat-34B等,性能表現(xiàn)優(yōu)異。在GPU加速大模型的實(shí)驗(yàn)中,Yi-6B成為范例項(xiàng)目。

開發(fā)者Eric Hartford提出Yi模型使用了與LLaMA模型相同的架構(gòu),引發(fā)了一場(chǎng)關(guān)于“抄襲”的質(zhì)疑。零一萬物團(tuán)隊(duì)意識(shí)到問題,及時(shí)在各開源平臺(tái)重新提交模型及代碼,完成了版本更新。然而,這一小問題在國(guó)內(nèi)被曲解,引發(fā)了一場(chǎng)輿論風(fēng)暴。團(tuán)隊(duì)強(qiáng)調(diào),他們是從零開始打造Yi系列模型,重新命名僅為對(duì)比實(shí)驗(yàn)需求。

這一系列的成績(jī)和問題共同勾勒出Yi-34B-Chat模型的成功軌跡,盡管受到一些質(zhì)疑,但其在技術(shù)創(chuàng)新和用戶體驗(yàn)方面的表現(xiàn)仍然備受矚目。

舉報(bào)

  • 相關(guān)推薦
  • 李開復(fù)周志華縱論AI大模型,萬字梳理MEET'25大咖激辯,320萬觀眾同見證

    「ScalingLaw」和「打臉時(shí)刻」,絕對(duì)是2024年科技智能領(lǐng)域的年度關(guān)鍵詞。這是20余位工業(yè)界、學(xué)術(shù)界乃至投資界的頂流大咖,在量子位MEET2025智能未來大會(huì)上反復(fù)提及、探討的話題。后續(xù)還將有大會(huì)嘉賓更詳細(xì)版內(nèi)容分享,敬請(qǐng)關(guān)注!

  • 李開復(fù):中國(guó)能做出碾壓美國(guó)的AI應(yīng)用!

    零一萬物首席執(zhí)行官,創(chuàng)新工場(chǎng)董事長(zhǎng)李開復(fù)公開表示,中國(guó)能做出碾壓美國(guó)的AI應(yīng)用。AI時(shí)代是用人工智能、超級(jí)人工智能,比人還聰明的人工智能,賦能每個(gè)應(yīng)用,讓每個(gè)應(yīng)用重寫一次這個(gè)革命就在今年和明年開始會(huì)爆發(fā),這就是我們面臨的最巨大的一個(gè)機(jī)會(huì)。因?yàn)槲覈?guó)的模型可能落后美國(guó)一段時(shí)間,但是我們的應(yīng)用是結(jié)果超過美國(guó)的。

  • 2024,大模型殺進(jìn)“決賽圈”

    HenryChesbrough在著作《通過技術(shù)創(chuàng)新盈利勢(shì)在必行》中,曾提出過一個(gè)創(chuàng)新的“漏斗模型”。開放式創(chuàng)新一開始鼓勵(lì)百花齊放,但最終只有10%的技術(shù)能夠通過這個(gè)漏斗,成功抵達(dá)目標(biāo)市場(chǎng)targetmarket,進(jìn)入到商業(yè)化與產(chǎn)業(yè)化的下一個(gè)階段其余的90%的技術(shù),逐漸淡出人們的視野?!叭巳私钥葾I”的2025離我們?cè)絹碓浇恕?/p>

  • 脈脈2024MAX年度職得去公司首推大模型榜單 商湯、智譜、趣丸上榜

    職場(chǎng)社交和社區(qū)平臺(tái)脈脈公布了2024MAX年度職得去公司評(píng)選獲獎(jiǎng)名單。字節(jié)跳動(dòng)、騰訊、京東、星巴克中國(guó)等企業(yè)榮獲年度職得去雇主。求職者也可以發(fā)現(xiàn)更多值得去的好公司,把握職場(chǎng)發(fā)展新機(jī)遇。

  • AMD RX 9070 XT功耗、性能有驚喜!可媲美RTX 4080

    AMD新一代最高端顯卡已確認(rèn)命名為RX9070XT,當(dāng)然不是真正的旗艦,不可能去競(jìng)爭(zhēng)RTX5090甚至是RTX5080。之前有曝料顯示,RX9070XTTimeSpy基準(zhǔn)跑分只稍高于RX7900GRE不如現(xiàn)有次旗艦RX7900XT,對(duì)比競(jìng)品大致相當(dāng)于RTX4070Ti。RX9070XT應(yīng)該會(huì)和未來的RTX5070差不多,不太可能追上RTX5070Ti。

  • 華為鴻蒙智行尊界 S800開啟預(yù)訂 48 小時(shí)訂單達(dá) 2108 臺(tái)

    尊界汽車近日宣布,其首款車型S800自預(yù)售開啟以來,在短短48小時(shí)內(nèi)便收獲了2108臺(tái)的訂單,這一成績(jī)對(duì)于一款起售價(jià)超過百萬元的國(guó)產(chǎn)轎車言,標(biāo)志著一個(gè)歷史性的突破。尊界S800是華為與江淮合作打造的百萬級(jí)旗艦轎車,預(yù)售價(jià)定在100-150萬元之間。這一訂單成績(jī)不僅是對(duì)尊界S800品質(zhì)的認(rèn)可,也是對(duì)國(guó)產(chǎn)汽車品牌向上突破的有力證明。

  • 大模型拿單江湖

    11月29日,智譜AgentOpenDay會(huì)后,現(xiàn)場(chǎng)有記者問了CEO張鵬一個(gè)問題:“ToB進(jìn)展如何?”“還行吧”,至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當(dāng)中,其同臺(tái)競(jìng)爭(zhēng)對(duì)手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

  • ·微星雷影17性價(jià)比新爆款:AMD 7840HX+滿血4060國(guó)補(bǔ)6080到手!

    對(duì)于準(zhǔn)備購買游戲本的小伙伴,除了雙12大促國(guó)補(bǔ)政策的雙重福利,微星筆記本更是在打造爆款上,再次帶來驚喜:熱賣機(jī)型雷影17全新性價(jià)比配置,首發(fā)價(jià)7599元的基礎(chǔ)上,已經(jīng)進(jìn)入國(guó)補(bǔ)政策名單,至高補(bǔ)貼20%,到手價(jià)僅需6080元。*政府補(bǔ)貼20%優(yōu)惠,具體根據(jù)不同地區(qū)政策情況,詳情可咨詢客服雷影17——7840HXRTX4060全新爆款,國(guó)補(bǔ)到手價(jià)6080元:https://item.jd.com/100127748745.html雷影17作為AMD平臺(tái)游戲本的超高性價(jià)比擔(dān)當(dāng),確實(shí)做到了“實(shí)惠又大杯”,此前的7945HX4060的配置,可以說在移動(dòng)端多核生產(chǎn)力上一騎絕塵,結(jié)合國(guó)補(bǔ)不到7K的售價(jià)簡(jiǎn)直不要太香!2年全國(guó)聯(lián)保2年到府服務(wù)的完善售后政策,500線下服務(wù)中心的覆蓋,各位龍騎士也可以放心購買~微星雷影17在“微星游戲本京東自營(yíng)官方旗艦店”爆款熱銷中,如此神仙單品,如此超值價(jià)格,你的下一臺(tái)游戲本很有可能就是它,不要錯(cuò)過哦!

  • 小米SU7最新版本OTA推送:正式接入VLM視覺語言大模型

    小米汽車官方宣布,小米SU7汽車已接收到XiaomiHyperOS1.4.5版本的OTA更新,此次更新帶來了13項(xiàng)新功能和26項(xiàng)體驗(yàn)優(yōu)化。更新亮點(diǎn)包括VLM視覺語言大模型的接入,使系統(tǒng)能夠識(shí)別復(fù)雜道路環(huán)境和特殊交通規(guī)則區(qū)域,并通過文字和語音提示駕駛員。還優(yōu)化了胎壓報(bào)警觸發(fā)時(shí)的報(bào)警彈窗、制動(dòng)系統(tǒng)熱衰后報(bào)警提示、電動(dòng)尾翼功能和電動(dòng)尾翼與后備箱之間的邏輯。

  • 大模型,在內(nèi)卷中尋找出口

    2024年,大模型進(jìn)展不斷。從年初的Sora到最新的o3,更新更好的模型不斷被推出,“內(nèi)卷”到底有沒有發(fā)生?我們要先確定“內(nèi)卷”的定義,指某一類產(chǎn)業(yè)模式,發(fā)展到一種確定形式后,陷入“高水平均衡陷阱”,出現(xiàn)“沒有發(fā)展的增長(zhǎng)”,這種局面一直無法被打破,那就會(huì)走向停滯和危機(jī)。大模型要取得商業(yè)成功,前提是用戶和開發(fā)者的業(yè)務(wù)能否成功,這是為什么完善的商業(yè)基

熱文

  • 3 天
  • 7天