SuperCLUE測評發(fā)布，360智腦大模型穩(wěn)居大模型梯隊

2024-07-10 20:22 · 稿源：站長之家用戶

7月9日，國內(nèi)權(quán)威大模型評測機構(gòu)SuperCLUE發(fā)布《中文大模型基準測評2024上半年報告》，360智腦大模型（360gpt2-pro）在SuperCLUE基準6月測評中，取得總分72分，超過GPT-3.5-Turbo-0125，位列國內(nèi)大模型第4名次，穩(wěn)居大模型第一梯隊，并入選SuperCLUE“卓越領(lǐng)導者”模型象限。

《中文大模型基準測評2024上半年報告》選取國內(nèi)外具有代表性的33個大模型，采用多維度、多層次的綜合性測評方案，通過理科、文科和Hard三大維度真實反映大模型通用能力。報告顯示，國內(nèi)大模型市場已形成三大梯隊的格局，360gpt2-pro位列第一梯隊，并憑借在基礎(chǔ)和場景應用上的領(lǐng)先能力，入選“卓越領(lǐng)導者”模型象限，以快速迭代、技術(shù)積累或資源優(yōu)勢引領(lǐng)國內(nèi)大模型發(fā)展，不斷壓縮國內(nèi)外大模型差距。

值得關(guān)注的是，360gpt2-pro在文科方面取得75分的亮眼成績，排名第2，其中生成創(chuàng)作單項排名第1，與GPT-4o處于同一水平。相較其他國內(nèi)外頭部大模型，360智腦大模型在高語言處理質(zhì)量、內(nèi)容生成及理解水平等文科任務上擁有更強的競爭力。

在SuperCLUE中文檢索增強生成測評中，360智腦RAG排名第4，進一步縮小國內(nèi)外模型差距，體現(xiàn)了在中文檢索生成能力上的競爭力。此前，360宣布開源兩款大模型360Zhinao-search和360Zhinao-1.8B-Reranking，兩款模型聚焦于提升長文本檢索效果，在RAG技術(shù)的檢索、排序階段進行模型優(yōu)化，結(jié)合此前開源的360K長文本能力，全面打通了RAG技術(shù)鏈路，為行業(yè)提供可靠的降低大模型“幻覺”概率的能力。

據(jù)了解，360智腦大模型目前已形成多參數(shù)、多模態(tài)、多場景應用的大模型矩陣，首批通過國家標準符合性測試，綜合能力位列大模型第一梯隊。此外，360不斷夯實技術(shù)能力的同時，加速模型能力應用，打造新場景新應用，去解決用戶剛需和痛點。今年以來，360重塑國民級產(chǎn)品，相繼推出360AI瀏覽器、360AI搜索等產(chǎn)品，其中360AI搜索連續(xù)登榜全球AI產(chǎn)品數(shù)據(jù)增速榜榜首，領(lǐng)跑國內(nèi)AI搜索引擎市場。

（推廣）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺用戶上傳并發(fā)布，本平臺僅提供信息存儲服務，對本頁面內(nèi)容所引致的錯誤、不確或遺漏，概不負任何法律責任，相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。任何單位或個人認為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，可及時向站長之家提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明（點擊查看反饋聯(lián)系地址）。本網(wǎng)站在收到上述法律文件后，將會依法依規(guī)核實信息，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

相關(guān)推薦

關(guān)鍵詞：

薦大模型拿單江湖

11月29日，智譜AgentOpenDay會后，現(xiàn)場有記者問了CEO張鵬一個問題:“ToB進展如何?”“還行吧”，至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當中，其同臺競爭對手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

?智譜Agent ?大模型 ?AI公司
華為盤古汽車大模型奪得第一 300+家車企都選它

快科技11月22日消息，國際權(quán)威分析機構(gòu)沙利文最新發(fā)布了《中國行業(yè)大模型市場報告2024》。報告顯示，華為云的行業(yè)大模型在汽車、政務、工業(yè)、金融、醫(yī)療、藥物、氣象等7個領(lǐng)域都取得領(lǐng)先地位。其中，憑借在產(chǎn)品技術(shù)、應用落地等綜合競爭力優(yōu)勢，華為云在汽車大模型市場位居領(lǐng)導者象限，是更多車企智能化升級的選擇。根據(jù)IDC報告相關(guān)數(shù)據(jù)顯示，華為云連續(xù)三年斬獲?

?華為云 ?行業(yè)大模型 ?汽車市場
薦OpenAI發(fā)布強化微調(diào)API，能深度定制超復雜大模型了

今天凌晨兩點，OpenAI開啟了12天技術(shù)分享直播，發(fā)布了最新“強化微調(diào)”計劃。與傳統(tǒng)的微調(diào)相比，強化微調(diào)可以讓開發(fā)者使用經(jīng)過微調(diào)的更強專家大模型，來開發(fā)適用于金融、法律、醫(yī)療、科研等不同領(lǐng)域的AI助手。通過這些反饋訓練一個獎勵模型，該模型能夠?qū)φZ言模型的輸出進行打分，以反映其質(zhì)量或符合人類期望。

?OpenAI ?強化微調(diào) ?AI助手
薦AI日報：階躍星辰內(nèi)測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開啟內(nèi)測可在躍問視頻申請階躍星辰的Step-Video模型正式開啟內(nèi)測，用戶可以通過躍問視頻官網(wǎng)申請資格。用戶可在最新版本的WPSOffice中輕松找到?

?人工智能 ?視頻生成 ?技術(shù)趨勢
重磅！OpenAI發(fā)布滿血o1、無限使用，最強大模型來了

今天凌晨兩點，OpenAI正式開啟了12天技術(shù)分享直播，并發(fā)布了最新產(chǎn)品ChatGPTPro。ChatGPTPro可以無限使用完整版o1和Pro模式，同時可以使用高級語音和圖片上傳功能。這只是OpenAI的連續(xù)12天分享技術(shù)的第一天，后續(xù)「AIGC開放社區(qū)」將會繼續(xù)為大家介紹。

?OpenAI ?ChatGPT ?Pro
百度大模型又拿了個冠軍！全部8個維度均第一、7項滿分

時隔1個月，百度大模型又拿了個IDC報告的第一。IDC發(fā)布了《中國生成式AI應用開發(fā)平臺市場：企業(yè)統(tǒng)一AI開發(fā)平臺的雛形》。IDC發(fā)布的《中國人工智能公有云服務市場份額，2023》報告中，百度智能云市場份額排名第一，占比26.4%，連續(xù)5年蟬聯(lián)中國市場第一。

?百度大模型 ?生成式AI ?AI應用開發(fā)
薦AI大模型時代，人才的需求已經(jīng)變了

什么是AI發(fā)展的第一驅(qū)動力?最近，全球科技大廠都在用行動告訴我們:人才。谷歌NotebookLM的核心團隊共同宣布離職創(chuàng)業(yè)，他們新公司的網(wǎng)站已經(jīng)進入了「建設中」的狀態(tài)。但要真正解決AI人才短缺的問題需要更多企業(yè)、高校和社會各界的共同努力。

?大模型
薦一手實測豆包新發(fā)布的視覺理解大模型，他們真的卷起飛了。

人在字節(jié)火山發(fā)布會現(xiàn)場。眼睜睜看著他們發(fā)了一大堆的模型升級，眼花繚亂，有一種要一股腦把字節(jié)系的AI底牌往桌上亮的感覺。這可能才是，最酷的事吧。

?豆包
薦谷歌“狙擊”O(jiān)penAI，發(fā)布新一代大模型，主打Agent+多模態(tài)

繼量子芯片之后，谷歌又來搶“OpenAI雙12直播”的流量了!就在剛剛，谷歌新一代大模型Gemini2.0突然登場，再次由谷歌CEO皮猜親自官宣。新一代模型專為AIAgent打造，谷歌表示目前已經(jīng)將2.0版本提供給了一些開發(fā)者內(nèi)測，正在迅速將其集成在Gemini和搜索等產(chǎn)品線中。從OpenAI跳槽到谷歌的LoganKilpatrick表示，他們在GoogleAIStudio中創(chuàng)建了一個全新體驗，展示了Gemini2.0視頻理解、原生工具?

?谷歌 ?Gemini ?2.0
谷歌史上最強大模型！Gemini 2.0正式發(fā)布

今天凌晨，谷歌正式發(fā)布了為新智能體時代構(gòu)建的下一代模型Gemini2.0。這是谷歌迄今為止功能最強的AI模型，帶來了更強的性能、更多的多模態(tài)表現(xiàn)和新的原生工具應用。Gemini2.0還會擴展到更多Google產(chǎn)品中。

?谷歌 ?Gemini ?2.0

熱文

3 天
7天

站長商機

商務合作侵權(quán)投訴廣告服務版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

SuperCLUE測評發(fā)布，360智腦大模型穩(wěn)居大模型梯隊

薦大模型拿單江湖

華為盤古汽車大模型奪得第一 300+家車企都選它

薦OpenAI發(fā)布強化微調(diào)API，能深度定制超復雜大模型了

薦AI日報：階躍星辰內(nèi)測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

重磅！OpenAI發(fā)布滿血o1、無限使用，最強大模型來了

百度大模型又拿了個冠軍！全部8個維度均第一、7項滿分

薦AI大模型時代，人才的需求已經(jīng)變了

薦一手實測豆包新發(fā)布的視覺理解大模型，他們真的卷起飛了。

薦谷歌“狙擊”O(jiān)penAI，發(fā)布新一代大模型，主打Agent+多模態(tài)

谷歌史上最強大模型！Gemini 2.0正式發(fā)布

熱文

小紅書封號上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

小紅書被吐槽無理由封號客服回應：未說明處罰時間就是永封

極越公關(guān)負責人被開除本人回應：此前未接到任何通知

微信緊急提醒：警惕木馬病毒將加強對此類行為打擊

馬斯克稱星鏈可實現(xiàn)火星玩游戲：但存在約4到20分鐘延遲

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車續(xù)航之王

美團：冬至期間將針對餃子等應時食品訂單提供“超時保護”

沒網(wǎng)也能聯(lián)絡！小米15系列星辰無網(wǎng)通12月底升級6km級通話范圍

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

英偉達AI芯片最大買家揭曉！微軟力壓同行霸榜

微信朋友圈崩了上熱搜騰訊客服：請嘗試這幾種方法

極越員工萬字怒懟ceo：公關(guān)總監(jiān)徐繼業(yè)怒罵員工蒼蠅

馬斯克將推出X Mail電子郵箱服務

百度回應進軍短?。寒斍皟?nèi)容生態(tài)的一個重點發(fā)展方向

小紅書封號上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

極越員工善后方案已出爐：員工獲“N+1”賠償由百度吉利出資

螞蟻集團否認借殼上市：目前沒有上市計劃

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

阿里74億元出售銀泰！銀泰集團回應：與銀泰百貨無直接關(guān)聯(lián)

站長商機

SuperCLUE測評發(fā)布，360智腦大模型穩(wěn)居大模型梯隊

熱文

站長商機

SuperCLUE測評發(fā)布，360智腦大模型穩(wěn)居大模型梯隊