革命性視頻合成工具MAGVIT-v2 將視覺內(nèi)容轉(zhuǎn)化為大模型的標記

2023-10-12 11:53 · 稿源：站長之家

站長之家（ChinaZ.com）10月12日消息:最近，卡內(nèi)基梅隆大學(xué)、Google研究以及喬治亞理工學(xué)院聯(lián)合推出了一項名為MAGVIT-v2的視頻標記工具，它成功地將圖像和視頻輸入轉(zhuǎn)化為大型語言模型（LLM）可識別的標記。

項目地址:https://magvit.cs.cmu.edu/

MAGVIT-v2的獨特算法讓開發(fā)者可以實現(xiàn)令人驚嘆的應(yīng)用。從全景視頻到智能去除、圖像轉(zhuǎn)動動畫，再到自動翻轉(zhuǎn)等等。MAGVIT不僅為創(chuàng)作者提供無限靈感，還為視頻編輯帶來前所未有的便捷性。

通過MAGVIT-v2的應(yīng)用，LLM在視覺生成任務(wù)中的表現(xiàn)已明顯超越了傳統(tǒng)的擴散模型。視頻標記化是將視覺內(nèi)容（如圖像或視頻）轉(zhuǎn)化為大型語言模型能夠理解和處理的標記的過程。MAGVIT-v2的問世，毫無疑問為大型語言模型在視覺任務(wù)方面提供了嶄新的機遇。

在視覺生成任務(wù)方面，這一新型標記工具已經(jīng)展現(xiàn)出極大的潛力，可以明顯改善模型的表現(xiàn)?？偟膩砜矗琈AGVIT-v2的發(fā)布，預(yù)示著視覺生成領(lǐng)域的一次重大突破。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

視頻合成

視覺中國與生數(shù)科技共拓視覺產(chǎn)業(yè)大模型應(yīng)用

視覺中國宣布與北京生數(shù)科技有限公司建立戰(zhàn)略合作關(guān)系，雙方將基于各自的技術(shù)優(yōu)勢和行業(yè)資源，共同探索并建立“視覺產(chǎn)業(yè)大模型平臺及應(yīng)用”。此次合作旨在深化人工智能技術(shù)在視覺內(nèi)容產(chǎn)業(yè)的應(yīng)用，推動產(chǎn)業(yè)智能化升級，為全球視覺內(nèi)容創(chuàng)作者和使用者提供更高效、智能的服務(wù)。通過雙方的深度合作與共同努力，將開拓更多前沿的AI應(yīng)用領(lǐng)域，共同打造互利共贏的產(chǎn)業(yè)生態(tài)，引領(lǐng)視覺內(nèi)容產(chǎn)業(yè)邁向智能化新時代。

?視覺中國 ?生數(shù)科技 ?人工智能
薦一手實測豆包新發(fā)布的視覺理解大模型，他們真的卷起飛了。

人在字節(jié)火山發(fā)布會現(xiàn)場。眼睜睜看著他們發(fā)了一大堆的模型升級，眼花繚亂，有一種要一股腦把字節(jié)系的AI底牌往桌上亮的感覺。這可能才是，最酷的事吧。

?豆包
薦AI日報：階躍星辰內(nèi)測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開啟內(nèi)測可在躍問視頻申請階躍星辰的Step-Video模型正式開啟內(nèi)測，用戶可以通過躍問視頻官網(wǎng)申請資格。用戶可在最新版本的WPSOffice中輕松找到?

?人工智能 ?視頻生成 ?技術(shù)趨勢
薦視頻生成大模型賽道，只是看上去擁擠

2024年最后一個月，國產(chǎn)大模型落地應(yīng)用突然加速。尤其視頻生成模型，就像密集射出子彈后的槍管，熱得發(fā)燙。AI一天，人間一年。

?國產(chǎn)大模型 ?視頻生成模型 ?AI導(dǎo)演
胖東來發(fā)聲將追責(zé)篡改于東來視頻者：使用AI合成聲音涉嫌侵權(quán)

11月24日下午，胖東來商貿(mào)集團對外發(fā)布聲明，揭露了近期在第三方網(wǎng)絡(luò)平臺上出現(xiàn)的一系列侵權(quán)行為。該聲明指出，有多個賬號未經(jīng)授權(quán)，非法使用AI技術(shù)生成于東來先生的聲音，并對該集團擁有著作權(quán)的視頻內(nèi)容進行剪輯和篡改，加入AI生成的聲音和誤導(dǎo)性文案后對外發(fā)布，這種行為對公眾造成了誤導(dǎo)和混淆。胖東來商貿(mào)集團強調(diào)，這些行為不僅侵犯了于東來先生的人格權(quán)和

?胖東來 ?商貿(mào)集團 ?侵權(quán)行為
薦GPT-4o再暴露「弱智」缺陷，大模型無一幸免，港中文等發(fā)布「視覺聽覺」基準AV-Odyssey：26個任務(wù)直指死角問題

多模態(tài)大模型在聽覺上，居然也出現(xiàn)了「9.11>9.8」的現(xiàn)象，音量大小這種簡單問題都識別不了!港中文、斯坦福等大學(xué)聯(lián)合發(fā)布的AV-Odyssey基準測試，包含26個視聽任務(wù)，覆蓋了7種聲音屬性，跨越了10個不同領(lǐng)域，確保測試的深度和廣度。在人工智能領(lǐng)域，我們一直以為頂尖的多模態(tài)大模型已經(jīng)無所不能，GPT-4o在ASR任務(wù)上已經(jīng)達到了97%的正確率，更是凸顯了強大的音頻理解能力?

?多模態(tài)大模型 ?音頻理解 ?AV-Odyssey基準測試
薦大模型拿單江湖

11月29日，智譜AgentOpenDay會后，現(xiàn)場有記者問了CEO張鵬一個問題:“ToB進展如何?”“還行吧”，至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當(dāng)中，其同臺競爭對手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

?智譜Agent ?大模型 ?AI公司
蘋果Mac有望迎革命性升級！搭載自研5G基帶首度支持移動網(wǎng)絡(luò)

蘋果預(yù)計將放棄高通的5G基帶，用以取代iPhone與iPad中的高通基帶。還有消息指出，作為替代計劃的一部分，蘋果現(xiàn)在也研究首次為Mac帶來移動網(wǎng)絡(luò)的想法。VisionPro的移動網(wǎng)絡(luò)版本也在考慮當(dāng)中，報道指出，有一天，移動網(wǎng)絡(luò)技術(shù)也可能用于輕型擴增實境眼鏡當(dāng)中，盡管這樣的設(shè)備還需要數(shù)年時間。

?蘋果 ?5G基帶 ?自研芯片
脈脈2024MAX年度職得去公司首推大模型榜單商湯、智譜、趣丸上榜

職場社交和社區(qū)平臺脈脈公布了2024MAX年度職得去公司評選獲獎名單。字節(jié)跳動、騰訊、京東、星巴克中國等企業(yè)榮獲年度職得去雇主。求職者也可以發(fā)現(xiàn)更多值得去的好公司，把握職場發(fā)展新機遇。

?脈脈 ?職場社交 ?年度職得去雇主
薦月流水超「原神」，出海合成的天花板還在往上抬

SensorTower公布了2024年11月中國手游海外收入Top30，其中最值得注意的是檸檬微趣旗下Merge-2手游「GossipHarbor」排名首次超過「原神」，上升至?xí)充N榜Top4，刷新歷史最高排名。「GossipHarbor」的當(dāng)月流水也超過了MoonActive旗下的「TravelTown」，成為全球月流水最高的合成類游戲。本文編譯自FindingGenreSuccess:theCaseofGossipHarbor。

?手游 ?海外收入 ?Gossip

熱文

3 天
7天

站長商機

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

革命性視頻合成工具MAGVIT-v2 將視覺內(nèi)容轉(zhuǎn)化為大模型的標記

視覺中國與生數(shù)科技共拓視覺產(chǎn)業(yè)大模型應(yīng)用

薦一手實測豆包新發(fā)布的視覺理解大模型，他們真的卷起飛了。

薦AI日報：階躍星辰內(nèi)測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

薦視頻生成大模型賽道，只是看上去擁擠

胖東來發(fā)聲將追責(zé)篡改于東來視頻者：使用AI合成聲音涉嫌侵權(quán)

薦GPT-4o再暴露「弱智」缺陷，大模型無一幸免，港中文等發(fā)布「視覺聽覺」基準AV-Odyssey：26個任務(wù)直指死角問題

薦大模型拿單江湖

蘋果Mac有望迎革命性升級！搭載自研5G基帶首度支持移動網(wǎng)絡(luò)

脈脈2024MAX年度職得去公司首推大模型榜單商湯、智譜、趣丸上榜

薦月流水超「原神」，出海合成的天花板還在往上抬

熱文

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

京東發(fā)布年終獎通知部分員工年前可收到年終獎

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車續(xù)航之王

李斌回應(yīng)螢火蟲外觀設(shè)計：看過實車的人都喜歡這個設(shè)計

央視曝光未成年人繞開防沉迷只需4元：通過租用游戲賬號規(guī)避

消息稱OpenAI新模型GPT-5研發(fā)未達到預(yù)期：成本高昂效果欠佳

沒網(wǎng)也能聯(lián)絡(luò)！小米15系列星辰無網(wǎng)通12月底升級6km級通話范圍

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

FF再獲3000萬美元新一輪融資加速第二品牌FX戰(zhàn)略推進

美團：冬至期間將針對餃子等應(yīng)時食品訂單提供“超時保護”

英偉達AI芯片最大買家揭曉！微軟力壓同行霸榜

微信朋友圈崩了上熱搜騰訊客服：請嘗試這幾種方法

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

極越員工萬字怒懟ceo：公關(guān)總監(jiān)徐繼業(yè)怒罵員工蒼蠅

小紅書封號上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

馬斯克將推出X Mail電子郵箱服務(wù)

京東發(fā)布年終獎通知部分員工年前可收到年終獎

極越員工善后方案已出爐：員工獲“N+1”賠償由百度吉利出資

螞蟻集團否認借殼上市：目前沒有上市計劃

未成年人成部分博主流量密碼抖音治理涉“網(wǎng)紅兒童”違規(guī)內(nèi)容

站長商機