站長之家(ChinaZ.com)12月25日 消息:Fairy是由Meta GenAI開發(fā)的一個視頻編輯工具,它可以通過自然語言指令對視頻進行編輯,包括風(fēng)格轉(zhuǎn)換和物體或角色變換等。該工具的速度非???,能夠在14秒內(nèi)生成120幀的512×384視頻。
項目地址:https://top.aibase.com/tool/fairy
論文地址:https://arxiv.org/pdf/2312.13834.pdf
Fairy的主要功能特點包括風(fēng)格轉(zhuǎn)換和物體或角色變換。通過Fairy,用戶可以將視頻中的圖像風(fēng)格轉(zhuǎn)換為不同的藝術(shù)風(fēng)格,例如梵高或畢加索風(fēng)格,同時保持視頻的原始內(nèi)容和結(jié)構(gòu)。此外,F(xiàn)airy還可以將視頻中的特定物體或角色轉(zhuǎn)換成其他形式,例如將人物轉(zhuǎn)換成木雕或金屬騎士雕塑。
除此之外,F(xiàn)airy還能夠處理相對較長的視頻,而不會遇到內(nèi)存問題。在進行風(fēng)格轉(zhuǎn)換或物體變換時,F(xiàn)airy能夠保留視頻中的重要細節(jié),確保編輯后的視頻仍然保持高質(zhì)量和真實感。同時,F(xiàn)airy特別注重在編輯過程中保持視頻的時間連貫性,確保從一幀到下一幀的過渡自然和流暢。
技術(shù)細節(jié)方面,F(xiàn)airy采用了一種基于錨點的跨幀注意力機制,能夠在視頻幀之間隱式地傳播擴散特征,從而確保時間上的連貫性和高保真度的視頻合成。
此外,F(xiàn)airy還使用了基于擴散模型的方法來生成或編輯視頻幀,以及特殊的數(shù)據(jù)增強策略,使模型能夠更好地處理視頻中的自然運動和變換。同時,F(xiàn)airy的設(shè)計支持并行計算,使其能夠在多個GPU上同時處理視頻,從而顯著提高處理速度。
(舉報)