幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 傳媒 > 關(guān)鍵詞  > 人工智能最新資訊  > 正文

智象多模態(tài)生成大模型3.0發(fā)布 離幻覺更遠(yuǎn)與離落地更近

2024-12-31 15:42 · 稿源: 站長之家用戶

12 月 28 日,智象未來科技有限公司在安徽人工智能產(chǎn)業(yè)先導(dǎo)區(qū)啟動(dòng)儀式中,正式發(fā)布智象多模態(tài)生成大模型3. 0 版。

啟動(dòng)儀式上,智象未來創(chuàng)始人兼首席執(zhí)行官梅濤總結(jié)了 2024 年人工領(lǐng)域技術(shù)發(fā)展的五個(gè)標(biāo)志性事件,分別是以Sora為代表的視覺生成物理世界模擬器、以Chat GPT 4o為代表的多模態(tài)模型、以GPT-o1 為代表的從預(yù)訓(xùn)練到后訓(xùn)練推理優(yōu)化、多模態(tài)大模型賦能具身智能實(shí)現(xiàn)軟硬件結(jié)合,以及人工智能學(xué)者榮獲諾貝爾化學(xué)獎(jiǎng)表明AI賦能科研范式變革。可以說,過去一年中,AI技術(shù)的未來發(fā)展路徑和應(yīng)用實(shí)踐的方向正愈發(fā)清晰。

梅濤認(rèn)為,多模態(tài)大模型是通往AGI的必經(jīng)之路,其能夠比單一模態(tài)模型更好地模擬物理世界。而多模態(tài)大模型的技術(shù)演進(jìn)是線性的,但是在不同的技術(shù)路線中又可以實(shí)現(xiàn)跳躍式發(fā)展?;谝陨吓袛?,本次智象未來發(fā)布的智象多模態(tài)生成大模型3. 0 帶來了圖像和視頻生成能力的全面升級(jí),具體包含了畫面質(zhì)量與相關(guān)性提升、鏡頭運(yùn)動(dòng)和畫面運(yùn)動(dòng)更可控以及多場(chǎng)景驅(qū)動(dòng)的優(yōu)化。

同時(shí),智象未來還推出了智象多模態(tài)理解大模型1. 0 版,理解大模型1. 0 版通過對(duì)物體級(jí)別的畫面建模以及事件級(jí)別的時(shí)空建模,實(shí)現(xiàn)了更精細(xì)、準(zhǔn)確的圖像與視頻內(nèi)容理解。這一理解大模型也進(jìn)一步服務(wù)于理解增強(qiáng)的多模態(tài)生成技術(shù),搭配多模態(tài)生成大模型實(shí)現(xiàn)多模態(tài)檢索+多模態(tài)內(nèi)容編輯與生成的二創(chuàng)平臺(tái)系統(tǒng),進(jìn)一步降低用戶的使用門檻并且大幅提升基于IP的多模態(tài)內(nèi)容生成效果。

在模型升級(jí)的基礎(chǔ)上,智象未來旗下多款產(chǎn)品也有了新的體驗(yàn)提升。例如,智象創(chuàng)作工具平臺(tái)秉持“能打字,就能做視頻”的理念,基于智象多模態(tài)生成大模型呈現(xiàn)了全新的模型交互體驗(yàn)。在新版本中,平臺(tái)實(shí)現(xiàn)了與用戶的自然語言交互,在原有文生視頻的基礎(chǔ)上,增加了對(duì)視頻局部進(jìn)行語音指令輸入的調(diào)整。還可以基于用戶上傳的視頻內(nèi)容,整理成相關(guān)的模型輸出指令。這一功能將極大的降低創(chuàng)意工作者使用AIGC工具編輯視頻的學(xué)習(xí)門檻,從而提升視頻創(chuàng)作的工作效率。

目前,智象未來擁有國內(nèi)最全的多模態(tài)版權(quán)語料,包含數(shù)十萬小時(shí)版權(quán)視頻素材和上萬個(gè)授權(quán)IP,涵蓋國內(nèi)70%影視數(shù)據(jù),已形成上億條AIGC二次創(chuàng)作素材,在影視、文旅、通信、營銷、教育等多場(chǎng)景得到廣泛應(yīng)用,已累計(jì)服務(wù)全球一百多個(gè)國家和地區(qū)的一千多萬用戶和四萬多家企業(yè)客戶。

本次活動(dòng)現(xiàn)場(chǎng),智象未來與人民網(wǎng)、上海電影集團(tuán)、彩訊科技、捷成華視網(wǎng)聚、安徽聯(lián)通、中國移動(dòng)咪咕音樂等 12 家生態(tài)伙伴企業(yè)代表簽約,共同打造集技術(shù)研發(fā)、產(chǎn)業(yè)化應(yīng)用、市場(chǎng)推廣于一體的生態(tài)體系。

推廣

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺(tái)用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù),對(duì)本頁面內(nèi)容所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任,相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。任何單位或個(gè)人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),可及時(shí)向站長之家提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明(點(diǎn)擊查看反饋聯(lián)系地址)。本網(wǎng)站在收到上述法律文件后,將會(huì)依法依規(guī)核實(shí)信息,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

  • 相關(guān)推薦
  • 谷歌“狙擊”O(jiān)penAI,發(fā)布新一代大模型,主打Agent+多模態(tài)

    繼量子芯片之后,谷歌又來搶“OpenAI雙12直播”的流量了!就在剛剛,谷歌新一代大模型Gemini2.0突然登場(chǎng),再次由谷歌CEO皮猜親自官宣。新一代模型專為AIAgent打造,谷歌表示目前已經(jīng)將2.0版本提供給了一些開發(fā)者內(nèi)測(cè),正在迅速將其集成在Gemini和搜索等產(chǎn)品線中。從OpenAI跳槽到谷歌的LoganKilpatrick表示,他們?cè)贕oogleAIStudio中創(chuàng)建了一個(gè)全新體驗(yàn),展示了Gemini2.0視頻理解、原生工具?

  • 中國電信發(fā)布全自研視頻生成大模型 完成全模態(tài)體系構(gòu)建

    12月3日,在中國電信“2024數(shù)字科技生態(tài)大會(huì)”期間,首屆“TeleAI開發(fā)者大會(huì)”在廣州舉辦。TeleAI發(fā)布視頻生成大模型、視覺大模型產(chǎn)用一體化平臺(tái)、具身智能、智傳網(wǎng)等一系列創(chuàng)新技術(shù)、產(chǎn)品及科研成果,并發(fā)布開發(fā)者產(chǎn)業(yè)聯(lián)盟計(jì)劃。展出了星辰軟件工廠、星辰慧記、星辰智能體產(chǎn)品、中國電信家庭小管家、星辰大模型一體機(jī)等一系列智能產(chǎn)品,讓現(xiàn)場(chǎng)觀眾真實(shí)感受未來以來,AI就在每個(gè)人的身邊。

  • 成都匯陽投資關(guān)于Sora 正式上線,多模態(tài)模型的里程碑

    事件12月10日,OpenAl正式上線Sora,并向包括美國在內(nèi)的多數(shù)國家用戶開放,用戶可在OpenAI官網(wǎng)上體驗(yàn)Sora。Sora被包含在ChatGPTPlus和ChatGPTPro的會(huì)員訂閱方案中,用戶無需額外付費(fèi)。股市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。

  • 視頻生成大模型賽道,只是看上去擁擠

    2024年最后一個(gè)月,國產(chǎn)大模型落地應(yīng)用突然加速。尤其視頻生成模型,就像密集射出子彈后的槍管,熱得發(fā)燙。AI一天,人間一年。

  • AI日?qǐng)?bào):阿里通義開源多模態(tài)推理模型QVQ-72B;OpenAI考慮自研人形機(jī)器人;QQ音樂上線首個(gè)AI大模型音效

    歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里發(fā)布多模態(tài)推理模型QVQ-72B!視覺、語言能力雙提升阿里巴巴最近推出的QVQ-72B多模態(tài)推理模型在語言和視覺能力上實(shí)現(xiàn)了顯著提升,能夠處理復(fù)雜的推理和分析任務(wù),尤其在多步推理和數(shù)學(xué)推理方面表現(xiàn)突出。盡管o1-preview在某些方面表現(xiàn)優(yōu)秀,但在實(shí)際應(yīng)用中仍面臨高成本和不切實(shí)際的測(cè)試建議等問題。

  • 亞馬遜祭出地表最強(qiáng)全家桶,多模態(tài)Nova卻敗給Claude 3.5!

    【新智元導(dǎo)讀】圍剿英偉達(dá),數(shù)十萬顆自研二代芯片超算在建!亞馬遜祭出地表最強(qiáng)全家桶,多模態(tài)Nova擊敗GPT-4o。亞馬遜推出了號(hào)稱最強(qiáng)大的多模態(tài)模型Nova系列。IDC在2023年12月發(fā)布的最新研究報(bào)告顯示,英偉達(dá)當(dāng)前在AI芯片市場(chǎng)中占據(jù)著約95%的主導(dǎo)地位。

  • AI日?qǐng)?bào):OpenAI重磅上線Sora;智譜AI免費(fèi)多模態(tài)模型GLM-4V-Flash;騰訊云打造AI代碼助手

    歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI正式上線Sora,ChatGPTPro用戶可無限生成、最長20秒OpenAI在"ship-mas"系列活動(dòng)中發(fā)布了SoraTurbo視頻生成AI,支持生成20秒1080p視頻,用戶可通過文本、圖片或視頻進(jìn)行創(chuàng)作,具有多種風(fēng)格和剪輯功能。See3D已開源,支持多種3D創(chuàng)作應(yīng)用。

  • 大模型混戰(zhàn)這一年: 進(jìn)化之賽、效率之爭(zhēng)、落地之戰(zhàn)

    烈火烹油的兩年過去,飛速發(fā)展的大模型行業(yè)怎么樣了?與兩年前“百模大戰(zhàn)”為技術(shù)爭(zhēng)奪的景象不同,玩家們有兩個(gè)速度之爭(zhēng):一是技術(shù)迭代和產(chǎn)品更新的速度,二是商業(yè)化賺錢和應(yīng)用落地的速度。技術(shù)和產(chǎn)品的迭代很直觀,直接推動(dòng)大模型行業(yè)的百舸爭(zhēng)流。誰是這1%,誰能創(chuàng)造“新”世界,要等市場(chǎng)給出答案。

  • 你還說這是AI?我們體驗(yàn)了一波生成亞洲人最好看的文生圖大模型

    打開社交媒體平臺(tái),很多人正在熱烈討論一個(gè)叫做「AI模特」的玩法。點(diǎn)開幾個(gè)Demo,確實(shí)驚艷。在即將到來的2025年,你對(duì)國產(chǎn)AI以及可靈AI有怎樣的期許呢?歡迎在評(píng)論區(qū)討論。

  • 大模型拿單江湖

    11月29日,智譜AgentOpenDay會(huì)后,現(xiàn)場(chǎng)有記者問了CEO張鵬一個(gè)問題:“ToB進(jìn)展如何?”“還行吧”,至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當(dāng)中,其同臺(tái)競(jìng)爭(zhēng)對(duì)手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

熱文

  • 3 天
  • 7天