幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關(guān)鍵詞  > AGI最新資訊  > 正文

實現(xiàn)輸入到輸出「模態(tài)自由」, NUS華人團隊開源NExT-GPT,最接近AGI的大一統(tǒng)多模態(tài)大模型來了

2023-09-19 08:57 · 稿源: 機器之心公眾號

繼各類輸入端多模態(tài)大語言模型之后,新加坡國立大學(xué)華人團隊近期開源一種支持任意模態(tài)輸入和任意模態(tài)輸出的真正「大一統(tǒng)」多模態(tài)大模型,火爆 AI 社區(qū)。ChatGPT 的誕生,引爆了2023年的基于大語言模型的 AI 浪潮,此后各類開源大語言模型陸續(xù)問世,包括 Flan-T5、Vicuna、 LLaMA、

......

本文由站長之家合作伙伴自媒體作者“機器之心公眾號”授權(quán)發(fā)布于站長之家平臺,本平臺僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時間超過平臺更新維護時間,為了保證文章信息的及時性,內(nèi)容觀點的準(zhǔn)確性,平臺將不提供完全的內(nèi)容展現(xiàn),本頁面內(nèi)容僅為平臺搜索索引使用。需閱讀完整內(nèi)容的用戶,請查看原文,獲取內(nèi)容詳情。

舉報

  • 相關(guān)推薦
  • 谷歌“狙擊”O(jiān)penAI,發(fā)布新一代大模型,主打Agent+多模態(tài)

    繼量子芯片之后,谷歌又來搶“OpenAI雙12直播”的流量了!就在剛剛,谷歌新一代大模型Gemini2.0突然登場,再次由谷歌CEO皮猜親自官宣。新一代模型專為AIAgent打造,谷歌表示目前已經(jīng)將2.0版本提供給了一些開發(fā)者內(nèi)測,正在迅速將其集成在Gemini和搜索等產(chǎn)品線中。從OpenAI跳槽到谷歌的LoganKilpatrick表示,他們在GoogleAIStudio中創(chuàng)建了一個全新體驗,展示了Gemini2.0視頻理解、原生工具?

  • 智象多模態(tài)生成大模型3.0發(fā)布 離幻覺更遠與離落地更近

    12月28日,智象未來科技有限公司在安徽人工智能產(chǎn)業(yè)先導(dǎo)區(qū)啟動儀式中,正式發(fā)布智象多模態(tài)生成大模型3.0版。啟動儀式上,智象未來創(chuàng)始人兼首席執(zhí)行官梅濤總結(jié)了2024年人工領(lǐng)域技術(shù)發(fā)展的五個標(biāo)志性事件,分別是以Sora為代表的視覺生成物理世界模擬器、以ChatGPT4o為代表的多模態(tài)模型、以GPT-o1為代表的從預(yù)訓(xùn)練到后訓(xùn)練推理優(yōu)化、多模態(tài)大模型賦能具身智能實現(xiàn)軟硬件結(jié)合,以及人工智能學(xué)者榮獲諾貝爾化學(xué)獎表明AI賦能科研范式變革。本次活動現(xiàn)場,智象未來與人民網(wǎng)、上海電影集團、彩訊科技、捷成華視網(wǎng)聚、安徽聯(lián)通、中國移動咪咕音樂等12家生態(tài)伙伴企業(yè)代表簽約,共同打造集技術(shù)研發(fā)、產(chǎn)業(yè)化應(yīng)用、市場推廣于一體的生態(tài)體系。

  • 成都匯陽投資關(guān)于Sora 正式上線,多模態(tài)模型的里程碑

    事件12月10日,OpenAl正式上線Sora,并向包括美國在內(nèi)的多數(shù)國家用戶開放,用戶可在OpenAI官網(wǎng)上體驗Sora。Sora被包含在ChatGPTPlus和ChatGPTPro的會員訂閱方案中,用戶無需額外付費。股市有風(fēng)險,投資需謹(jǐn)慎。

  • AI日報:阿里通義開源多模態(tài)推理模型QVQ-72B;OpenAI考慮自研人形機器人;QQ音樂上線首個AI大模型音效

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、阿里發(fā)布多模態(tài)推理模型QVQ-72B!視覺、語言能力雙提升阿里巴巴最近推出的QVQ-72B多模態(tài)推理模型在語言和視覺能力上實現(xiàn)了顯著提升,能夠處理復(fù)雜的推理和分析任務(wù),尤其在多步推理和數(shù)學(xué)推理方面表現(xiàn)突出。盡管o1-preview在某些方面表現(xiàn)優(yōu)秀,但在實際應(yīng)用中仍面臨高成本和不切實際的測試建議等問題。

  • AI日報:OpenAI重磅上線Sora;智譜AI免費多模態(tài)模型GLM-4V-Flash;騰訊云打造AI代碼助手

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、OpenAI正式上線Sora,ChatGPTPro用戶可無限生成、最長20秒OpenAI在"ship-mas"系列活動中發(fā)布了SoraTurbo視頻生成AI,支持生成20秒1080p視頻,用戶可通過文本、圖片或視頻進行創(chuàng)作,具有多種風(fēng)格和剪輯功能。See3D已開源,支持多種3D創(chuàng)作應(yīng)用。

  • 機器人ChatGPT時刻!英偉達開源世界大模型,完美模擬物理世界!

    全球AI領(lǐng)導(dǎo)者NVIDIA在2025年CES展會上,開源了全新世界大模型NVIDIACosmos。Cosmos共有Nano、Super和Ultra三種型號:Nano針對實時、低延遲推理和邊緣部署進行了優(yōu)化;Super作為性能基線模型設(shè)計;Ultra專注于最大質(zhì)量和保真度,是蒸餾定制模型的理想選擇。通過與NVIDIA合作,我們有信心可以幫助加速安全和可擴展的自動駕駛解決方案。

  • 突破算力限制!Meta開源“記憶層”,重塑Transformer架構(gòu)大模型

    今天凌晨3點,全球社交巨頭Meta分享了一個創(chuàng)新研究——Memorylayers。Transformer架構(gòu)的預(yù)訓(xùn)練大模型在存儲、查詢數(shù)據(jù)時,隨著參數(shù)的變大對算力的需求呈指數(shù)級增長。這樣的設(shè)計既簡化了維護流程,又提高了系統(tǒng)的靈活性和適應(yīng)性。

  • OpenAI最強推理模型o3發(fā)布:AGI能力暴漲 接近人類水平

    OpenAI連續(xù)12日圣誕發(fā)布”終于迎來激動人心的大結(jié)局,OpenAI推出重磅收官新品,其迄今最強前沿推理模型的升級版o3。OpenAI號稱o3在一些條件下接近通用人工智能,共有o3和精簡版o3-mini兩個版本。12、o1下一代模型o3亮相,推出兩個版本,正式版o3以及精簡版o3-mini。

  • GPT-4o再暴露「弱智」缺陷,大模型無一幸免,港中文等發(fā)布「視覺聽覺」基準(zhǔn)AV-Odyssey:26個任務(wù)直指死角問題

    多模態(tài)大模型在聽覺上,居然也出現(xiàn)了「9.11>9.8」的現(xiàn)象,音量大小這種簡單問題都識別不了!港中文、斯坦福等大學(xué)聯(lián)合發(fā)布的AV-Odyssey基準(zhǔn)測試,包含26個視聽任務(wù),覆蓋了7種聲音屬性,跨越了10個不同領(lǐng)域,確保測試的深度和廣度。在人工智能領(lǐng)域,我們一直以為頂尖的多模態(tài)大模型已經(jīng)無所不能,GPT-4o在ASR任務(wù)上已經(jīng)達到了97%的正確率,更是凸顯了強大的音頻理解能力?

  • 周鴻祎:AGI發(fā)展遇瓶頸 智能體和專業(yè)大模型將扛大旗

    近兩年AI發(fā)展迅速,但目前種種跡象表明,一些AI巨頭寄予厚望的AGI之路似乎已經(jīng)遭遇瓶頸,尋找其他發(fā)展路徑正成為業(yè)界共識。360集團創(chuàng)始人周鴻祎在《財經(jīng)》年度對話2024上發(fā)表演講稱,目前AGI的發(fā)展面正臨挑戰(zhàn)智能體和專業(yè)大模型的應(yīng)用將推動大模型技術(shù)的落地。一個標(biāo)志是能提高10倍的體驗,即提高10倍的效率或降低10倍的成本,減少10倍的人力”。

熱文

  • 3 天
  • 7天