智象多模態(tài)生成大模型3.0發(fā)布離幻覺更遠(yuǎn)與離落地更近

2024-12-31 15:42 · 稿源：站長之家用戶

12 月 28 日，智象未來科技有限公司在安徽人工智能產(chǎn)業(yè)先導(dǎo)區(qū)啟動(dòng)儀式中，正式發(fā)布智象多模態(tài)生成大模型3. 0 版。

啟動(dòng)儀式上，智象未來創(chuàng)始人兼首席執(zhí)行官梅濤總結(jié)了 2024 年人工領(lǐng)域技術(shù)發(fā)展的五個(gè)標(biāo)志性事件，分別是以Sora為代表的視覺生成物理世界模擬器、以Chat GPT 4o為代表的多模態(tài)模型、以GPT-o1 為代表的從預(yù)訓(xùn)練到后訓(xùn)練推理優(yōu)化、多模態(tài)大模型賦能具身智能實(shí)現(xiàn)軟硬件結(jié)合，以及人工智能學(xué)者榮獲諾貝爾化學(xué)獎(jiǎng)表明AI賦能科研范式變革。可以說，過去一年中，AI技術(shù)的未來發(fā)展路徑和應(yīng)用實(shí)踐的方向正愈發(fā)清晰。

梅濤認(rèn)為，多模態(tài)大模型是通往AGI的必經(jīng)之路，其能夠比單一模態(tài)模型更好地模擬物理世界。而多模態(tài)大模型的技術(shù)演進(jìn)是線性的，但是在不同的技術(shù)路線中又可以實(shí)現(xiàn)跳躍式發(fā)展?；谝陨吓袛?，本次智象未來發(fā)布的智象多模態(tài)生成大模型3. 0 帶來了圖像和視頻生成能力的全面升級(jí)，具體包含了畫面質(zhì)量與相關(guān)性提升、鏡頭運(yùn)動(dòng)和畫面運(yùn)動(dòng)更可控以及多場(chǎng)景驅(qū)動(dòng)的優(yōu)化。

同時(shí)，智象未來還推出了智象多模態(tài)理解大模型1. 0 版，理解大模型1. 0 版通過對(duì)物體級(jí)別的畫面建模以及事件級(jí)別的時(shí)空建模，實(shí)現(xiàn)了更精細(xì)、準(zhǔn)確的圖像與視頻內(nèi)容理解。這一理解大模型也進(jìn)一步服務(wù)于理解增強(qiáng)的多模態(tài)生成技術(shù)，搭配多模態(tài)生成大模型實(shí)現(xiàn)多模態(tài)檢索+多模態(tài)內(nèi)容編輯與生成的二創(chuàng)平臺(tái)系統(tǒng)，進(jìn)一步降低用戶的使用門檻并且大幅提升基于IP的多模態(tài)內(nèi)容生成效果。

在模型升級(jí)的基礎(chǔ)上，智象未來旗下多款產(chǎn)品也有了新的體驗(yàn)提升。例如，智象創(chuàng)作工具平臺(tái)秉持“能打字，就能做視頻”的理念，基于智象多模態(tài)生成大模型呈現(xiàn)了全新的模型交互體驗(yàn)。在新版本中，平臺(tái)實(shí)現(xiàn)了與用戶的自然語言交互，在原有文生視頻的基礎(chǔ)上，增加了對(duì)視頻局部進(jìn)行語音指令輸入的調(diào)整。還可以基于用戶上傳的視頻內(nèi)容，整理成相關(guān)的模型輸出指令。這一功能將極大的降低創(chuàng)意工作者使用AIGC工具編輯視頻的學(xué)習(xí)門檻，從而提升視頻創(chuàng)作的工作效率。

目前，智象未來擁有國內(nèi)最全的多模態(tài)版權(quán)語料，包含數(shù)十萬小時(shí)版權(quán)視頻素材和上萬個(gè)授權(quán)IP，涵蓋國內(nèi)70%影視數(shù)據(jù)，已形成上億條AIGC二次創(chuàng)作素材，在影視、文旅、通信、營銷、教育等多場(chǎng)景得到廣泛應(yīng)用，已累計(jì)服務(wù)全球一百多個(gè)國家和地區(qū)的一千多萬用戶和四萬多家企業(yè)客戶。

本次活動(dòng)現(xiàn)場(chǎng)，智象未來與人民網(wǎng)、上海電影集團(tuán)、彩訊科技、捷成華視網(wǎng)聚、安徽聯(lián)通、中國移動(dòng)咪咕音樂等 12 家生態(tài)伙伴企業(yè)代表簽約，共同打造集技術(shù)研發(fā)、產(chǎn)業(yè)化應(yīng)用、市場(chǎng)推廣于一體的生態(tài)體系。

（推廣）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺(tái)用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)，對(duì)本頁面內(nèi)容所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任，相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。任何單位或個(gè)人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，可及時(shí)向站長之家提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明（點(diǎn)擊查看反饋聯(lián)系地址）。本網(wǎng)站在收到上述法律文件后，將會(huì)依法依規(guī)核實(shí)信息，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

相關(guān)推薦

關(guān)鍵詞：

薦谷歌“狙擊”O(jiān)penAI，發(fā)布新一代大模型，主打Agent+多模態(tài)

繼量子芯片之后，谷歌又來搶“OpenAI雙12直播”的流量了!就在剛剛，谷歌新一代大模型Gemini2.0突然登場(chǎng)，再次由谷歌CEO皮猜親自官宣。新一代模型專為AIAgent打造，谷歌表示目前已經(jīng)將2.0版本提供給了一些開發(fā)者內(nèi)測(cè)，正在迅速將其集成在Gemini和搜索等產(chǎn)品線中。從OpenAI跳槽到谷歌的LoganKilpatrick表示，他們?cè)贕oogleAIStudio中創(chuàng)建了一個(gè)全新體驗(yàn)，展示了Gemini2.0視頻理解、原生工具?

?谷歌 ?Gemini ?2.0
中國電信發(fā)布全自研視頻生成大模型完成全模態(tài)體系構(gòu)建

12月3日，在中國電信“2024數(shù)字科技生態(tài)大會(huì)”期間，首屆“TeleAI開發(fā)者大會(huì)”在廣州舉辦。TeleAI發(fā)布視頻生成大模型、視覺大模型產(chǎn)用一體化平臺(tái)、具身智能、智傳網(wǎng)等一系列創(chuàng)新技術(shù)、產(chǎn)品及科研成果，并發(fā)布開發(fā)者產(chǎn)業(yè)聯(lián)盟計(jì)劃。展出了星辰軟件工廠、星辰慧記、星辰智能體產(chǎn)品、中國電信家庭小管家、星辰大模型一體機(jī)等一系列智能產(chǎn)品，讓現(xiàn)場(chǎng)觀眾真實(shí)感受未來以來，AI就在每個(gè)人的身邊。

?TeleAI大模型 ?數(shù)字科技生態(tài)大會(huì) ?人工智能發(fā)展
成都匯陽投資關(guān)于Sora 正式上線，多模態(tài)模型的里程碑

事件12月10日，OpenAl正式上線Sora，并向包括美國在內(nèi)的多數(shù)國家用戶開放，用戶可在OpenAI官網(wǎng)上體驗(yàn)Sora。Sora被包含在ChatGPTPlus和ChatGPTPro的會(huì)員訂閱方案中，用戶無需額外付費(fèi)。股市有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。

?OpenAI ?Sora ?視頻生成
薦視頻生成大模型賽道，只是看上去擁擠

2024年最后一個(gè)月，國產(chǎn)大模型落地應(yīng)用突然加速。尤其視頻生成模型，就像密集射出子彈后的槍管，熱得發(fā)燙。AI一天，人間一年。

?國產(chǎn)大模型 ?視頻生成模型 ?AI導(dǎo)演
薦AI日?qǐng)?bào)：阿里通義開源多模態(tài)推理模型QVQ-72B；OpenAI考慮自研人形機(jī)器人；QQ音樂上線首個(gè)AI大模型音效

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里發(fā)布多模態(tài)推理模型QVQ-72B!視覺、語言能力雙提升阿里巴巴最近推出的QVQ-72B多模態(tài)推理模型在語言和視覺能力上實(shí)現(xiàn)了顯著提升，能夠處理復(fù)雜的推理和分析任務(wù)，尤其在多步推理和數(shù)學(xué)推理方面表現(xiàn)突出。盡管o1-preview在某些方面表現(xiàn)優(yōu)秀，但在實(shí)際應(yīng)用中仍面臨高成本和不切實(shí)際的測(cè)試建議等問題。

?人工智能 ?多模態(tài)推理 ?阿里巴巴
薦亞馬遜祭出地表最強(qiáng)全家桶，多模態(tài)Nova卻敗給Claude 3.5！

【新智元導(dǎo)讀】圍剿英偉達(dá)，數(shù)十萬顆自研二代芯片超算在建!亞馬遜祭出地表最強(qiáng)全家桶，多模態(tài)Nova擊敗GPT-4o。亞馬遜推出了號(hào)稱最強(qiáng)大的多模態(tài)模型Nova系列。IDC在2023年12月發(fā)布的最新研究報(bào)告顯示，英偉達(dá)當(dāng)前在AI芯片市場(chǎng)中占據(jù)著約95%的主導(dǎo)地位。

?Nova
薦AI日?qǐng)?bào)：OpenAI重磅上線Sora；智譜AI免費(fèi)多模態(tài)模型GLM-4V-Flash；騰訊云打造AI代碼助手

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI正式上線Sora，ChatGPTPro用戶可無限生成、最長20秒OpenAI在"ship-mas"系列活動(dòng)中發(fā)布了SoraTurbo視頻生成AI，支持生成20秒1080p視頻，用戶可通過文本、圖片或視頻進(jìn)行創(chuàng)作，具有多種風(fēng)格和剪輯功能。See3D已開源，支持多種3D創(chuàng)作應(yīng)用。
薦大模型混戰(zhàn)這一年：進(jìn)化之賽、效率之爭(zhēng)、落地之戰(zhàn)

烈火烹油的兩年過去，飛速發(fā)展的大模型行業(yè)怎么樣了?與兩年前“百模大戰(zhàn)”為技術(shù)爭(zhēng)奪的景象不同，玩家們有兩個(gè)速度之爭(zhēng):一是技術(shù)迭代和產(chǎn)品更新的速度，二是商業(yè)化賺錢和應(yīng)用落地的速度。技術(shù)和產(chǎn)品的迭代很直觀，直接推動(dòng)大模型行業(yè)的百舸爭(zhēng)流。誰是這1%，誰能創(chuàng)造“新”世界，要等市場(chǎng)給出答案。

?大模型行業(yè) ?技術(shù)迭代 ?商業(yè)化應(yīng)用
薦你還說這是AI？我們體驗(yàn)了一波生成亞洲人最好看的文生圖大模型

打開社交媒體平臺(tái)，很多人正在熱烈討論一個(gè)叫做「AI模特」的玩法。點(diǎn)開幾個(gè)Demo，確實(shí)驚艷。在即將到來的2025年，你對(duì)國產(chǎn)AI以及可靈AI有怎樣的期許呢?歡迎在評(píng)論區(qū)討論。

?可靈
薦大模型拿單江湖

11月29日，智譜AgentOpenDay會(huì)后，現(xiàn)場(chǎng)有記者問了CEO張鵬一個(gè)問題:“ToB進(jìn)展如何?”“還行吧”，至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當(dāng)中，其同臺(tái)競(jìng)爭(zhēng)對(duì)手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

?智譜Agent ?大模型 ?AI公司

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

智象多模態(tài)生成大模型3.0發(fā)布離幻覺更遠(yuǎn)與離落地更近

薦谷歌“狙擊”O(jiān)penAI，發(fā)布新一代大模型，主打Agent+多模態(tài)

中國電信發(fā)布全自研視頻生成大模型完成全模態(tài)體系構(gòu)建

成都匯陽投資關(guān)于Sora 正式上線，多模態(tài)模型的里程碑

薦視頻生成大模型賽道，只是看上去擁擠

薦AI日?qǐng)?bào)：阿里通義開源多模態(tài)推理模型QVQ-72B；OpenAI考慮自研人形機(jī)器人；QQ音樂上線首個(gè)AI大模型音效

薦亞馬遜祭出地表最強(qiáng)全家桶，多模態(tài)Nova卻敗給Claude 3.5！

薦AI日?qǐng)?bào)：OpenAI重磅上線Sora；智譜AI免費(fèi)多模態(tài)模型GLM-4V-Flash；騰訊云打造AI代碼助手

薦大模型混戰(zhàn)這一年：進(jìn)化之賽、效率之爭(zhēng)、落地之戰(zhàn)

薦你還說這是AI？我們體驗(yàn)了一波生成亞洲人最好看的文生圖大模型

薦大模型拿單江湖

熱文

雷軍辟謠只招聘35歲以下員工：僅針對(duì)未來之星項(xiàng)目

雷軍曬健身房照片：此前設(shè)定100次健身打卡目標(biāo)

阿里巴巴AI“生意管家”: 400萬商家的秘密武器

蘋果市值一夜蒸發(fā)7248億此前官網(wǎng)已開啟降價(jià)活動(dòng)

董明珠曾喊話雷軍給股民分多少錢！格力：擬分紅超55億

蘋果官網(wǎng)突然降價(jià) 客服回應(yīng)能否退差價(jià)

俞敏洪稱東方甄選是火藥桶：未來一定會(huì)更加美好

張朝陽說量子力學(xué)不是玄學(xué)：是一門嚴(yán)謹(jǐn)?shù)奈锢韺W(xué)科

盧偉冰加入小米6周年：未來風(fēng)景無限美好

法拉第未來股價(jià)一夜暴漲超50% 第二品牌FX原型車即將亮相

曝雷軍挖了個(gè)95后天才少女“AI小蘿莉”：開出千萬年薪惡補(bǔ)大模

京東科技宣布落實(shí)20薪：計(jì)劃到2025年實(shí)現(xiàn)

AI 的暗面：永遠(yuǎn)不要對(duì)人工智能聊天機(jī)器人說的 10 件事

雷軍辟謠只招聘35歲以下員工：僅針對(duì)未來之星項(xiàng)目

雷軍感謝網(wǎng)友祝他年入百萬：愿大家夢(mèng)想成真今晚8點(diǎn)跨年直播

免費(fèi)寫真人人都能用！騰訊元寶AI跨年美照上線：大片一鍵生成

雷軍曬健身房照片：此前設(shè)定100次健身打卡目標(biāo)

AI教父辛頓發(fā)聲：30年內(nèi)AI致人類滅亡幾率達(dá)10%-20%

出圈就好！盤點(diǎn)2024年國內(nèi)AI大模型產(chǎn)品的那些破圈姿勢(shì)

阿里巴巴AI“生意管家”: 400萬商家的秘密武器

站長商機(jī)

智象多模態(tài)生成大模型3.0發(fā)布 離幻覺更遠(yuǎn)與離落地更近

熱文

站長商機(jī)

智象多模態(tài)生成大模型3.0發(fā)布離幻覺更遠(yuǎn)與離落地更近