Meta推AI視頻模型Fairy，輕松替換視頻人物、改變風(fēng)格

2024-01-08 10:23 · 稿源：站長之家

劃重點(diǎn):
?? Meta 的 Fairy 是一個快速的視頻到視頻綜合模型，展示了 AI 如何為視頻編輯帶來更多創(chuàng)作自由。
?? Fairy 使用交叉幀關(guān)注機(jī)制，確保時間上的一致性和高保真度合成。
?? Fairy 比之前的模型快44倍，但在處理動態(tài)環(huán)境效果方面仍存在一些問題。

站長之家（ChinaZ.com）1月8日消息:Meta 的 GenAI 團(tuán)隊(duì)推出了名為 Fairy 的視頻到視頻綜合模型，該模型比現(xiàn)有模型更快，時間上更一致。研究團(tuán)隊(duì)展示了 Fairy 在幾個應(yīng)用中的表現(xiàn)，包括角色 / 物體替換，風(fēng)格化和長形式視頻生成。

比如，只需簡單的文本提示，如 “仿梵高風(fēng)格”，就足以編輯源視頻。例如，文本命令 “變成雪人” 將視頻中的宇航員變成了雪人。

Fairy 的視覺連貫性是一個特別具有挑戰(zhàn)性的問題，因?yàn)榛谙嗤崾居袩o數(shù)種方法可以修改給定的圖像。Fairy 使用交叉幀關(guān)注機(jī)制，這是一種隱式傳播擴(kuò)散特征的機(jī)制，確保了優(yōu)越的時間連貫性和高保真度的合成。

該模型可以在僅14秒內(nèi)生成大小為512x384像素、120幀（30fps 下的4秒）的視頻，比以前的模型至少快44倍。與 Meta 的 Emu 視頻模型一樣，F(xiàn)airy 是基于用于圖像處理的擴(kuò)散模型，經(jīng)過了視頻編輯的增強(qiáng)。

Fairy 在處理源視頻的所有幀時不進(jìn)行時間降采樣或幀插值，并保持了512的水平輸出視頻的縱橫比。在使用六個 A100GPU 進(jìn)行測試時，F(xiàn)airy 能夠在71.89秒內(nèi)渲染一個27秒的視頻，并保持高度的視覺一致性。

Fairy 的性能在一個包含1000個生成樣本的廣泛用戶研究中進(jìn)行了測試。無論是人類判斷還是定量指標(biāo)都證實(shí)，F(xiàn)airy 的表現(xiàn)優(yōu)于 Rerender、TokenFlow 和 Gen-1這三個模型。

然而，該模型目前在處理如雨、火災(zāi)或閃電等動態(tài)環(huán)境效果方面存在問題，這些效果要么無法很好地融入整個場景，要么會產(chǎn)生視覺錯誤。

盡管存在這些問題，研究團(tuán)隊(duì)認(rèn)為他們的工作在 AI 視頻編輯領(lǐng)域代表了一次重大進(jìn)展，具有對時間一致性和高質(zhì)量視頻合成的變革性方法。

Fairy項(xiàng)目體驗(yàn)網(wǎng)址：https://top.aibase.com/tool/fairy

（舉報）

相關(guān)推薦

關(guān)鍵詞：

薦搶鮮實(shí)測騰訊最新AI視頻模型！超寫實(shí)質(zhì)感，還會自動切鏡頭

一只戴著紅色圍巾的企鵝闖進(jìn)了火熱的AI視頻戰(zhàn)場。騰訊混元發(fā)布了AI視頻生成大模型。未來混元視頻還將上線圖生視頻模型、視頻配音模型、驅(qū)動2D照片數(shù)字人等新能力，讓未來AI內(nèi)容創(chuàng)作更加高效。

?AI視頻
薦AI日報：ChatGPT AI搜索免費(fèi)開放；谷歌AI視頻模型Veo2優(yōu)于Sora；Midjourney重磅上新個性化模型與情緒板

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI宣布ChatGPT搜索升級支持地圖、高級語音等功能OpenAI在最新的直播中宣布了ChatGPT平臺的重大技術(shù)更新，推出了實(shí)時搜索和高級語音交互模式，極大提升了用戶體驗(yàn)。WPS還提供多樣化的PPT模板，滿足不同用戶需求。

?人工智能 ?ChatGPT ?實(shí)時搜索
薦AI日報：階躍星辰內(nèi)測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開啟內(nèi)測可在躍問視頻申請階躍星辰的Step-Video模型正式開啟內(nèi)測，用戶可以通過躍問視頻官網(wǎng)申請資格。用戶可在最新版本的WPSOffice中輕松找到?

?人工智能 ?視頻生成 ?技術(shù)趨勢
迄今最大視頻開源模型！騰訊混元文生視頻上線：一句話生成視頻

今日，騰訊混元大模型宣布文生視頻功能上線，一句話就能生成視頻。此次開源的視頻生成大模型，參數(shù)量130億，是當(dāng)前最大的視頻開源模型。通過先進(jìn)的圖像視頻混合VAE，讓模型在細(xì)節(jié)表現(xiàn)有明顯提升，特別是小人臉、高速鏡頭等場景。

?騰訊 ?混元大模型 ?視頻生成
Sora之后，視頻生成模型的中國牌局

Sora，自2月16日OpenAI發(fā)布后一直被吐槽是“技術(shù)期貨”，終于在12月10日，正式版Sora露面了，可以生成最高1080p分辨率、最長20秒的視頻。OpenAICEO奧特曼稱，Sora正式版是視頻生成領(lǐng)域的GPT-1時刻。大模型的牌局，國內(nèi)企業(yè)正在找到自己的節(jié)奏感。

?視頻生成 ?OpenAI ?AI技術(shù)
OpenAI正式推出AI視頻生成模型Sora：ChatGPT訂閱用戶免費(fèi)用

在首次公布10個月之后，OpenAI宣布正式向用戶開放人工智能視頻生成模型版本Sora，該系統(tǒng)可以根據(jù)文本提示生成逼真的視頻。OpenAI還推出了Sora的新版本SoraTurbo，稱較2月預(yù)覽的版本速度顯著加快，可以生成最長達(dá)20秒的視頻，并且可以提供這些視頻的多種變體。OpenAI表示，正在針對不同類型的用戶制定量身定制的價格方案，計劃于明年年初推出。

?人工智能 ?視頻生成 ?OpenAI
薦視頻生成大模型賽道，只是看上去擁擠

2024年最后一個月，國產(chǎn)大模型落地應(yīng)用突然加速。尤其視頻生成模型，就像密集射出子彈后的槍管，熱得發(fā)燙。AI一天，人間一年。

?國產(chǎn)大模型 ?視頻生成模型 ?AI導(dǎo)演
薦AI日報：OpenAI全量上線視頻聊天功能；Anthropic最快模型Claude 3.5 Haiku全面開放；巨人網(wǎng)絡(luò)推游戲大模型千影 QianYing

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI推出屏幕共享與視頻聊天功能，ChatGPT整了個“圣誕老人模式”O(jiān)penAI最近在其高級語音模式中新增了視頻聊天和屏幕共享功能，允許用戶在移動應(yīng)用中與ChatGPT進(jìn)行實(shí)時互動。該模型仍在技術(shù)打磨中，同時啟動了“千影共創(chuàng)計劃”，旨在促進(jìn)“游戲AI”領(lǐng)域的發(fā)展。

?OpenAI ?ChatGPT ?視頻聊天
薦體操運(yùn)動，是所有AI視頻最殘酷的圖靈測試。

昨天Sora全網(wǎng)上線，大家也都測試了很多了。產(chǎn)品完成度很高，但是模型質(zhì)量，真的有點(diǎn)不及預(yù)期。但終點(diǎn)一定值得期待。

?AI視頻
Kimi內(nèi)測AI視頻生成功能：每天可免費(fèi)生成100秒視頻

據(jù)報道，Kimi目前正內(nèi)測AI視頻生成功能Kimi創(chuàng)作空間”，可通過12種預(yù)設(shè)風(fēng)格模板和自定義創(chuàng)作功能，為用戶制作個性化音樂視頻。Kimi創(chuàng)作空間”目前正處于灰度測試階段，預(yù)示著它距離正式亮相已為期不遠(yuǎn)。無論是專業(yè)學(xué)術(shù)論文的翻譯與理解是法律問題的輔助分析，亦或是發(fā)票的批量整理以及API開發(fā)文檔的快速解讀，Kimi都展現(xiàn)出了出色的表現(xiàn)，贏得了廣大用戶的一致好評。

?AI視頻生成 ?Kimi創(chuàng)作空間 ?個性化音樂視頻

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

Meta推AI視頻模型Fairy，輕松替換視頻人物、改變風(fēng)格

薦搶鮮實(shí)測騰訊最新AI視頻模型！超寫實(shí)質(zhì)感，還會自動切鏡頭

薦AI日報：ChatGPT AI搜索免費(fèi)開放；谷歌AI視頻模型Veo2優(yōu)于Sora；Midjourney重磅上新個性化模型與情緒板

薦AI日報：階躍星辰內(nèi)測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

迄今最大視頻開源模型！騰訊混元文生視頻上線：一句話生成視頻

Sora之后，視頻生成模型的中國牌局

OpenAI正式推出AI視頻生成模型Sora：ChatGPT訂閱用戶免費(fèi)用

薦視頻生成大模型賽道，只是看上去擁擠

薦AI日報：OpenAI全量上線視頻聊天功能；Anthropic最快模型Claude 3.5 Haiku全面開放；巨人網(wǎng)絡(luò)推游戲大模型千影 QianYing

薦體操運(yùn)動，是所有AI視頻最殘酷的圖靈測試。

Kimi內(nèi)測AI視頻生成功能：每天可免費(fèi)生成100秒視頻

熱文

吳柳芳賬號再次被禁粉絲從600萬被清理至4萬抖音：低俗內(nèi)容吸

劉強(qiáng)東提前發(fā)年終獎絕大多數(shù)員工可獲5到8個月年終獎

肯德基中國漲價官方回應(yīng)：運(yùn)營成本變化導(dǎo)致

美團(tuán)回應(yīng)騎手穿點(diǎn)男模字樣工服：博流量惡意炒作

騰訊張軍辟謠微信送禮會議紀(jì)要：只想做點(diǎn)腳踏實(shí)地的事

騰訊QQ 2024年度報告發(fā)布：以脫口秀形式呈現(xiàn)

騰訊回應(yīng)微信春節(jié)前開放送禮物功能：逐步灰度中

余承東：華為明年將推出大家想不到的產(chǎn)品

周鴻祎稱被車門夾傷的手成頑固傷：近3個月沒攀巖

原創(chuàng)手繪頭像定制，打造獨(dú)一無二的個人、情侶、閨蜜頭像

吳柳芳賬號再次被禁粉絲從600萬被清理至4萬抖音：低俗內(nèi)容吸

劉強(qiáng)東提前發(fā)年終獎絕大多數(shù)員工可獲5到8個月年終獎

京東發(fā)布年終獎通知部分員工年前可收到年終獎

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

肯德基中國漲價官方回應(yīng)：運(yùn)營成本變化導(dǎo)致

小米SU7最新版本OTA推送：正式接入VLM視覺語言大模型

李斌回應(yīng)螢火蟲外觀設(shè)計：看過實(shí)車的人都喜歡這個設(shè)計

消息稱OpenAI新模型GPT-5研發(fā)未達(dá)到預(yù)期：成本高昂效果欠佳

央視曝光未成年人繞開防沉迷只需4元：通過租用游戲賬號規(guī)避

微信可以線上送實(shí)體禮物了：微信小店“藍(lán)包”功能正灰度測試逐

站長商機(jī)

Meta推AI視頻模型Fairy，輕松替換視頻人物、改變風(fēng)格

熱文

站長商機(jī)

Meta推AI視頻模型Fairy，輕松替換視頻人物、改變風(fēng)格