南洋理工發(fā)布提高AI視頻生成內容一致性方法FreeInit

2023-12-14 09:43 · 稿源：站長之家

要點:
FreeInit方法提升視頻擴散模型生成的時空一致性。
通過發(fā)現(xiàn)噪聲初始化在視頻擴散模型中存在的隱含訓練-推理差距，提出了FreeInit，無需額外訓練，不引入可學習參數。
FreeInit通過迭代優(yōu)化推理初始噪聲的時空低頻組件，彌補訓練和推理之間的初始化差距，顯著提高生成結果的時空一致性。

站長之家（ChinaZ.com）12月14日消息:南洋理工大學發(fā)布了一項名為FreeInit的方法，該方法可以大幅提高人工智能視頻生成的內容一致性。演示顯示這一方法非常流暢，并且可以與現(xiàn)有的SD生態(tài)結合。此外，他們還發(fā)表了與Animatediff結合的方法，只需等待一些專業(yè)人士制作插件，就可以使用這一方法。視頻中展示了使用了FreeInit和未使用FreeInit的Animaetdiff的對比。

項目地址:https://tianxingwu.github.io/pages/FreeInit/

根據他們的介紹，他們深入研究了視頻擴散模型的噪聲初始化，并發(fā)現(xiàn)了一個隱含的訓練-推斷差距，導致了推斷質量的下降。他們的關鍵發(fā)現(xiàn)包括推斷時初始潛變量的信噪比（SNR）的時空頻率分布與訓練時本質上不同，以及去噪過程受到初始噪聲的低頻分量的顯著影響。

在受到這些觀察的啟發(fā)下，他們提出了一種簡潔而有效的推斷采樣策略FreeInit，該策略能夠顯著改善擴散模型生成的視頻的時間一致性。通過在推斷過程中迭代地優(yōu)化初始潛變量的時空低頻分量，F(xiàn)reeInit能夠彌補訓練和推斷之間的初始化差距，從而有效改善生成結果的主體外觀和時間一致性。

FreeInit以迭代方式改進推斷初始噪聲，通過DDIM采樣、DDPM前向和噪聲重新初始化，初始噪聲的低頻成分逐漸得到改進，從而持續(xù)增強時間一致性和主體外觀。

這一方法的發(fā)布為人工智能視頻生成領域帶來了新的突破，將有望提高視頻生成的質量和時間一致性。隨著這一技術的不斷發(fā)展和完善，相信將會為視頻內容創(chuàng)作和人工智能應用帶來更多的可能性。

（舉報）

相關推薦

關鍵詞：

AI視頻

Kimi內測AI視頻生成功能：每天可免費生成100秒視頻

據報道，Kimi目前正內測AI視頻生成功能Kimi創(chuàng)作空間”，可通過12種預設風格模板和自定義創(chuàng)作功能，為用戶制作個性化音樂視頻。Kimi創(chuàng)作空間”目前正處于灰度測試階段，預示著它距離正式亮相已為期不遠。無論是專業(yè)學術論文的翻譯與理解是法律問題的輔助分析，亦或是發(fā)票的批量整理以及API開發(fā)文檔的快速解讀，Kimi都展現(xiàn)出了出色的表現(xiàn)，贏得了廣大用戶的一致好評。

?AI視頻生成 ?Kimi創(chuàng)作空間 ?個性化音樂視頻
力壓Sora！谷歌第二代AI視頻生成模型Veo 2發(fā)布：分辨率可達4K

據報道，谷歌發(fā)布了最新的AI視頻生成模型Veo2。Veo2模型能夠生成最高4K分辨率、時長達到2分鐘的視頻片段，相較于OpenAI的Sora模型，分辨率提升了4倍，視頻時長增加了6倍。除了Veo2之外，Google這波還推出了改進版的AI繪圖Imagen3模型，生圖細節(jié)更好、光照更豐富、干擾更少。

?谷歌 ?AI視頻生成 ?Veo
OpenAI正式推出AI視頻生成模型Sora：ChatGPT訂閱用戶免費用

在首次公布10個月之后，OpenAI宣布正式向用戶開放人工智能視頻生成模型版本Sora，該系統(tǒng)可以根據文本提示生成逼真的視頻。OpenAI還推出了Sora的新版本SoraTurbo，稱較2月預覽的版本速度顯著加快，可以生成最長達20秒的視頻，并且可以提供這些視頻的多種變體。OpenAI表示，正在針對不同類型的用戶制定量身定制的價格方案，計劃于明年年初推出。

?人工智能 ?視頻生成 ?OpenAI
Sora之后，視頻生成模型的中國牌局

Sora，自2月16日OpenAI發(fā)布后一直被吐槽是“技術期貨”，終于在12月10日，正式版Sora露面了，可以生成最高1080p分辨率、最長20秒的視頻。OpenAICEO奧特曼稱，Sora正式版是視頻生成領域的GPT-1時刻。大模型的牌局，國內企業(yè)正在找到自己的節(jié)奏感。

?視頻生成 ?OpenAI ?AI技術
視頻生成大模型賽道，只是看上去擁擠

2024年最后一個月，國產大模型落地應用突然加速。尤其視頻生成模型，就像密集射出子彈后的槍管，熱得發(fā)燙。AI一天，人間一年。

?國產大模型 ?視頻生成模型 ?AI導演
薦AI日報：階躍星辰內測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開啟內測可在躍問視頻申請階躍星辰的Step-Video模型正式開啟內測，用戶可以通過躍問視頻官網申請資格。用戶可在最新版本的WPSOffice中輕松找到?

?人工智能 ?視頻生成 ?技術趨勢
薦AI日報：智譜AI發(fā)布AutoGLM升級版；Kimi灰測AI視頻生成功能；SD3.5L新增三大ControlNet功能；ChatGPT誕生兩周年

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、震撼來襲!StabilityAI的SD3.5L新增三大ControlNet功能生圖能力再升級StabilityAI發(fā)布了新版StableDiffusion3.5Large，新增三種ControlNet功能，分別是Blur、Canny和Depth，顯著提升了圖像生成能力。?

?Stability ?AI ?Stable
中國電信發(fā)布全自研視頻生成大模型完成全模態(tài)體系構建

12月3日，在中國電信“2024數字科技生態(tài)大會”期間，首屆“TeleAI開發(fā)者大會”在廣州舉辦。TeleAI發(fā)布視頻生成大模型、視覺大模型產用一體化平臺、具身智能、智傳網等一系列創(chuàng)新技術、產品及科研成果，并發(fā)布開發(fā)者產業(yè)聯(lián)盟計劃。展出了星辰軟件工廠、星辰慧記、星辰智能體產品、中國電信家庭小管家、星辰大模型一體機等一系列智能產品，讓現(xiàn)場觀眾真實感受未來以來，AI就在每個人的身邊。

?TeleAI大模型 ?數字科技生態(tài)大會 ?人工智能發(fā)展
薦AI日報：OpenAI全面開放Canvas功能；豆包電腦版視頻生成功能內測；全球首個AI程序員Devin開放使用

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、OpenAI發(fā)布Canvas工具提高ChatGPT寫作和編碼效率OpenAI于12月11日推出Canvas功能，旨在提升ChatGPT用戶在寫作和編碼項目中的效率。這一漏洞不僅影響Claude波及其他AI聊天機器人，提醒我們在AI安全問題亟需關注。

?人工智能 ?ChatGPT ?OpenAI
英偉達生成式AI超級電腦發(fā)布：AI性能提高1.7倍僅249美元

據報道，英偉達推出一款名為JetsonOrinNanoSuper”的生成式人工智能超級電腦。與前代產品相比，JetsonOrinNanoSuper在性能上實現(xiàn)了70%的提升，每秒可執(zhí)行驚人的67兆次INT8運算，同時，其內存帶寬也大幅提升50%，達到了102GB/s的高速水平。JetsonOrinNanoSuper不僅限于聊天機器人的開發(fā)，更在視覺AI代理、AI機器人部署等多個領域展現(xiàn)出廣泛的應用前景。

?英偉達 ?Jetson ?Orin

熱文

3 天
7天

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

南洋理工發(fā)布提高AI視頻生成內容一致性方法FreeInit

Kimi內測AI視頻生成功能：每天可免費生成100秒視頻

力壓Sora！谷歌第二代AI視頻生成模型Veo 2發(fā)布：分辨率可達4K

OpenAI正式推出AI視頻生成模型Sora：ChatGPT訂閱用戶免費用

Sora之后，視頻生成模型的中國牌局

視頻生成大模型賽道，只是看上去擁擠

薦AI日報：階躍星辰內測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

薦AI日報：智譜AI發(fā)布AutoGLM升級版；Kimi灰測AI視頻生成功能；SD3.5L新增三大ControlNet功能；ChatGPT誕生兩周年

中國電信發(fā)布全自研視頻生成大模型完成全模態(tài)體系構建

薦AI日報：OpenAI全面開放Canvas功能；豆包電腦版視頻生成功能內測；全球首個AI程序員Devin開放使用

英偉達生成式AI超級電腦發(fā)布：AI性能提高1.7倍僅249美元

熱文

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車續(xù)航之王

沒網也能聯(lián)絡！小米15系列星辰無網通12月底升級6km級通話范圍

消息稱OpenAI新模型GPT-5研發(fā)未達到預期：成本高昂效果欠佳

李斌回應螢火蟲外觀設計：看過實車的人都喜歡這個設計

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

美團：冬至期間將針對餃子等應時食品訂單提供“超時保護”

央視曝光未成年人繞開防沉迷只需4元：通過租用游戲賬號規(guī)避

QQ音樂年度聽歌報告發(fā)布：誰是你最喜歡的歌手？

FF再獲3000萬美元新一輪融資加速第二品牌FX戰(zhàn)略推進

英偉達AI芯片最大買家揭曉！微軟力壓同行霸榜

微信朋友圈崩了上熱搜騰訊客服：請嘗試這幾種方法

極越員工萬字怒懟ceo：公關總監(jiān)徐繼業(yè)怒罵員工蒼蠅

小紅書封號上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內容

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

馬斯克將推出X Mail電子郵箱服務

極越員工善后方案已出爐：員工獲“N+1”賠償由百度吉利出資

螞蟻集團否認借殼上市：目前沒有上市計劃

小紅書被吐槽無理由封號客服回應：未說明處罰時間就是永封

未成年人成部分博主流量密碼抖音治理涉“網紅兒童”違規(guī)內容

站長商機