幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 傳媒 > 關(guān)鍵詞  > 正文

SuperCLUE測評發(fā)布,360智腦大模型穩(wěn)居大模型梯隊

2024-07-10 20:22 · 稿源: 站長之家用戶

7月9日,國內(nèi)權(quán)威大模型評測機構(gòu)SuperCLUE發(fā)布《中文大模型基準測評2024上半年報告》,360智腦大模型(360gpt2-pro)在SuperCLUE基準6月測評中,取得總分72分,超過GPT-3.5-Turbo-0125,位列國內(nèi)大模型第4名次,穩(wěn)居大模型第一梯隊,并入選SuperCLUE“卓越領(lǐng)導者”模型象限。

《中文大模型基準測評2024上半年報告》選取國內(nèi)外具有代表性的33個大模型,采用多維度、多層次的綜合性測評方案,通過理科、文科和Hard三大維度真實反映大模型通用能力。報告顯示,國內(nèi)大模型市場已形成三大梯隊的格局,360gpt2-pro位列第一梯隊,并憑借在基礎(chǔ)和場景應用上的領(lǐng)先能力,入選“卓越領(lǐng)導者”模型象限,以快速迭代、技術(shù)積累或資源優(yōu)勢引領(lǐng)國內(nèi)大模型發(fā)展,不斷壓縮國內(nèi)外大模型差距。

值得關(guān)注的是,360gpt2-pro在文科方面取得75分的亮眼成績,排名第2,其中生成創(chuàng)作單項排名第1,與GPT-4o處于同一水平。相較其他國內(nèi)外頭部大模型,360智腦大模型在高語言處理質(zhì)量、內(nèi)容生成及理解水平等文科任務上擁有更強的競爭力。

在SuperCLUE中文檢索增強生成測評中,360智腦RAG排名第4,進一步縮小國內(nèi)外模型差距,體現(xiàn)了在中文檢索生成能力上的競爭力。此前,360宣布開源兩款大模型360Zhinao-search和360Zhinao-1.8B-Reranking,兩款模型聚焦于提升長文本檢索效果,在RAG技術(shù)的檢索、排序階段進行模型優(yōu)化,結(jié)合此前開源的360K長文本能力,全面打通了RAG技術(shù)鏈路,為行業(yè)提供可靠的降低大模型“幻覺”概率的能力。

據(jù)了解,360智腦大模型目前已形成多參數(shù)、多模態(tài)、多場景應用的大模型矩陣,首批通過國家標準符合性測試,綜合能力位列大模型第一梯隊。此外,360不斷夯實技術(shù)能力的同時,加速模型能力應用,打造新場景新應用,去解決用戶剛需和痛點。今年以來,360重塑國民級產(chǎn)品,相繼推出360AI瀏覽器、360AI搜索等產(chǎn)品,其中360AI搜索連續(xù)登榜全球AI產(chǎn)品數(shù)據(jù)增速榜榜首,領(lǐng)跑國內(nèi)AI搜索引擎市場。

推廣

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺用戶上傳并發(fā)布,本平臺僅提供信息存儲服務,對本頁面內(nèi)容所引致的錯誤、不確或遺漏,概不負任何法律責任,相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。任何單位或個人認為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,可及時向站長之家提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明(點擊查看反饋聯(lián)系地址)。本網(wǎng)站在收到上述法律文件后,將會依法依規(guī)核實信息,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

  • 相關(guān)推薦
  • 大模型拿單江湖

    11月29日,智譜AgentOpenDay會后,現(xiàn)場有記者問了CEO張鵬一個問題:“ToB進展如何?”“還行吧”,至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當中,其同臺競爭對手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

  • 華為盤古汽車大模型奪得第一 300+家車企都選它

    快科技11月22日消息,國際權(quán)威分析機構(gòu)沙利文最新發(fā)布了《中國行業(yè)大模型市場報告2024》。報告顯示,華為云的行業(yè)大模型在汽車、政務、工業(yè)、金融、醫(yī)療、藥物、氣象等7個領(lǐng)域都取得領(lǐng)先地位。其中,憑借在產(chǎn)品技術(shù)、應用落地等綜合競爭力優(yōu)勢,華為云在汽車大模型市場位居領(lǐng)導者象限,是更多車企智能化升級的選擇。根據(jù)IDC報告相關(guān)數(shù)據(jù)顯示,華為云連續(xù)三年斬獲?

  • OpenAI發(fā)布強化微調(diào)API,能深度定制超復雜大模型

    今天凌晨兩點,OpenAI開啟了12天技術(shù)分享直播,發(fā)布了最新“強化微調(diào)”計劃。與傳統(tǒng)的微調(diào)相比,強化微調(diào)可以讓開發(fā)者使用經(jīng)過微調(diào)的更強專家大模型,來開發(fā)適用于金融、法律、醫(yī)療、科研等不同領(lǐng)域的AI助手。通過這些反饋訓練一個獎勵模型,該模型能夠?qū)φZ言模型的輸出進行打分,以反映其質(zhì)量或符合人類期望。

  • AI日報:階躍星辰內(nèi)測視頻大模型Step-Video;即夢AI圖片2.1模型支持生成文字;騰訊發(fā)布混元視頻生成大模型

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開啟內(nèi)測可在躍問視頻申請階躍星辰的Step-Video模型正式開啟內(nèi)測,用戶可以通過躍問視頻官網(wǎng)申請資格。用戶可在最新版本的WPSOffice中輕松找到?

  • 重磅!OpenAI發(fā)布滿血o1、無限使用,最強大模型來了

    今天凌晨兩點,OpenAI正式開啟了12天技術(shù)分享直播,并發(fā)布了最新產(chǎn)品ChatGPTPro。ChatGPTPro可以無限使用完整版o1和Pro模式,同時可以使用高級語音和圖片上傳功能。這只是OpenAI的連續(xù)12天分享技術(shù)的第一天,后續(xù)「AIGC開放社區(qū)」將會繼續(xù)為大家介紹。

  • 百度大模型又拿了個冠軍!全部8個維度均第一、7項滿分

    時隔1個月,百度大模型又拿了個IDC報告的第一。IDC發(fā)布了《中國生成式AI應用開發(fā)平臺市場:企業(yè)統(tǒng)一AI開發(fā)平臺的雛形》。IDC發(fā)布的《中國人工智能公有云服務市場份額,2023》報告中,百度智能云市場份額排名第一,占比26.4%,連續(xù)5年蟬聯(lián)中國市場第一。

  • AI大模型時代,人才的需求已經(jīng)變了

    什么是AI發(fā)展的第一驅(qū)動力?最近,全球科技大廠都在用行動告訴我們:人才。谷歌NotebookLM的核心團隊共同宣布離職創(chuàng)業(yè),他們新公司的網(wǎng)站已經(jīng)進入了「建設中」的狀態(tài)。但要真正解決AI人才短缺的問題需要更多企業(yè)、高校和社會各界的共同努力。

  • 一手實測豆包新發(fā)布的視覺理解大模型,他們真的卷起飛了。

    人在字節(jié)火山發(fā)布會現(xiàn)場。眼睜睜看著他們發(fā)了一大堆的模型升級,眼花繚亂,有一種要一股腦把字節(jié)系的AI底牌往桌上亮的感覺。這可能才是,最酷的事吧。

  • 谷歌“狙擊”O(jiān)penAI,發(fā)布新一代大模型,主打Agent+多模態(tài)

    繼量子芯片之后,谷歌又來搶“OpenAI雙12直播”的流量了!就在剛剛,谷歌新一代大模型Gemini2.0突然登場,再次由谷歌CEO皮猜親自官宣。新一代模型專為AIAgent打造,谷歌表示目前已經(jīng)將2.0版本提供給了一些開發(fā)者內(nèi)測,正在迅速將其集成在Gemini和搜索等產(chǎn)品線中。從OpenAI跳槽到谷歌的LoganKilpatrick表示,他們在GoogleAIStudio中創(chuàng)建了一個全新體驗,展示了Gemini2.0視頻理解、原生工具?

  • 谷歌史上最強大模型!Gemini 2.0正式發(fā)布

    今天凌晨,谷歌正式發(fā)布了為新智能體時代構(gòu)建的下一代模型Gemini2.0。這是谷歌迄今為止功能最強的AI模型,帶來了更強的性能、更多的多模態(tài)表現(xiàn)和新的原生工具應用。Gemini2.0還會擴展到更多Google產(chǎn)品中。

熱文

  • 3 天
  • 7天