AI視頻生成框架AnimateDiff 高速運(yùn)動(dòng)視頻依然保持穩(wěn)定

2023-10-07 10:06 · 稿源：站長之家

要點(diǎn):
1. AnimateDiff是一個(gè)開源框架，可以將定制化文本到圖像模型應(yīng)用于動(dòng)畫生成，保持原有模型的圖像質(zhì)量的基礎(chǔ)上生成動(dòng)畫片段，豐富了靜態(tài)圖像的表達(dá)能力。
2. 框架在文生圖模型中插入動(dòng)作建模模塊，通過訓(xùn)練和參數(shù)更新，使模型能夠生成個(gè)性化的動(dòng)畫圖像，而無需對(duì)每個(gè)模型進(jìn)行特定優(yōu)化。
3. AnimateDiff開源項(xiàng)目在GitHub上備受關(guān)注，連續(xù)數(shù)天在Trending Research榜單排名第一，作者還提供了一個(gè)簡單易用的在線應(yīng)用，供用戶體驗(yàn)?zāi)Ｐ偷哪芰Α?/p>

站長之家（ChinaZ.com）10月7日消息:眾所周知，訓(xùn)練文生圖模型的成本非常高昂。為了減輕微調(diào)模型的費(fèi)用，出現(xiàn)了一些相應(yīng)的模型定制化方法，如DreamBooth和LoRA，這使得用戶可以在使用少量數(shù)據(jù)和消費(fèi)級(jí)顯卡的情況下提高模型的個(gè)性化和特定風(fēng)格下的圖像生成質(zhì)量，而這是建立在開源權(quán)重的基礎(chǔ)上的。

這一趨勢推動(dòng)了HuggingFace、CivitAI等開源模型社區(qū)的發(fā)展。眾多的藝術(shù)家和愛好者為這些社區(qū)貢獻(xiàn)了許多高質(zhì)量的微調(diào)模型。在不知不覺中，宛如平靜的海洋一下子涌起了洶涌的浪潮，海灘上留下了無數(shù)色彩斑斕的鵝卵石，這些都是愛好者們精心調(diào)制的AI畫作。

然而，與動(dòng)畫相比，靜態(tài)圖像的表現(xiàn)能力是有限的。最新的開源框架AnimateDiff能夠?qū)⑷魏味ㄖ苹纳鷪D模型擴(kuò)展到動(dòng)畫生成領(lǐng)域，而且在保持原有定制化模型畫面質(zhì)量的基礎(chǔ)上，還能生成相應(yīng)的動(dòng)畫片段。這使得色彩斑斕的鵝卵石增添了一些動(dòng)態(tài)的光澤。

AnimateDiff 是一款強(qiáng)大的工具，它允許您輕松地將文本轉(zhuǎn)化為動(dòng)畫圖像，而無需特定的調(diào)整。它為用戶提供了無限的創(chuàng)意和探索空間，讓您可以將文本描述轉(zhuǎn)化為令人驚嘆的動(dòng)畫場景。

它的優(yōu)勢在于將真人電影視頻轉(zhuǎn)換成的動(dòng)畫，在激烈的動(dòng)作下，視頻依然可以異常的穩(wěn)定。該項(xiàng)目提出了一個(gè)有效的框架，可以一次性為大多數(shù)現(xiàn)有的個(gè)性化文本到圖像模型提供動(dòng)畫效果，節(jié)省了模型特定調(diào)整的工作。

項(xiàng)目地址:https://github.com/guoyww/animatediff/

核心功能:

MotionLoRA 模型支持: 最新發(fā)布的 MotionLoRA 模型以及其模型庫，為您提供了對(duì)相機(jī)運(yùn)動(dòng)的控制能力。您可以輕松地實(shí)現(xiàn)縮放、平移、傾斜和旋轉(zhuǎn)等相機(jī)動(dòng)作，從而打造生動(dòng)的動(dòng)畫場景。

強(qiáng)大的 Motion 模塊: 這個(gè)工具提供了多個(gè) Motion 模塊，包括 mm_sd_v14.ckpt、mm_sd_v15.ckpt 和 mm_sd_v15_v2.ckpt，它們支持高分辨率和批處理訓(xùn)練，提供卓越的圖像質(zhì)量。

簡便的環(huán)境設(shè)置: 安裝和配置 AnimateDiff 非常簡單，只需幾個(gè)命令即可輕松啟動(dòng)。您可以在單個(gè) RTX3090GPU 上進(jìn)行推理，而且僅需大約12GB的顯存。

模型庫: AnimateDiff 提供了豐富的模型庫，包括 Motion 模塊和 MotionLoRA 模塊，以及各種可用于不同場景的模型參數(shù)。您可以根據(jù)自己的需求選擇合適的模型進(jìn)行推理。

Gradio 演示: 為了讓用戶更容易使用 AnimateDiff，該團(tuán)隊(duì)還開發(fā)了 Gradio 演示。只需運(yùn)行幾個(gè)命令，就可以在本地主機(jī)上啟動(dòng)演示，通過用戶友好的界面進(jìn)行互動(dòng)。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

AnimateDiff

Kimi內(nèi)測AI視頻生成功能：每天可免費(fèi)生成100秒視頻

據(jù)報(bào)道，Kimi目前正內(nèi)測AI視頻生成功能Kimi創(chuàng)作空間”，可通過12種預(yù)設(shè)風(fēng)格模板和自定義創(chuàng)作功能，為用戶制作個(gè)性化音樂視頻。Kimi創(chuàng)作空間”目前正處于灰度測試階段，預(yù)示著它距離正式亮相已為期不遠(yuǎn)。無論是專業(yè)學(xué)術(shù)論文的翻譯與理解是法律問題的輔助分析，亦或是發(fā)票的批量整理以及API開發(fā)文檔的快速解讀，Kimi都展現(xiàn)出了出色的表現(xiàn)，贏得了廣大用戶的一致好評(píng)。

?AI視頻生成 ?Kimi創(chuàng)作空間 ?個(gè)性化音樂視頻
Sora之后，視頻生成模型的中國牌局

Sora，自2月16日OpenAI發(fā)布后一直被吐槽是“技術(shù)期貨”，終于在12月10日，正式版Sora露面了，可以生成最高1080p分辨率、最長20秒的視頻。OpenAICEO奧特曼稱，Sora正式版是視頻生成領(lǐng)域的GPT-1時(shí)刻。大模型的牌局，國內(nèi)企業(yè)正在找到自己的節(jié)奏感。

?視頻生成 ?OpenAI ?AI技術(shù)
OpenAI正式推出AI視頻生成模型Sora：ChatGPT訂閱用戶免費(fèi)用

在首次公布10個(gè)月之后，OpenAI宣布正式向用戶開放人工智能視頻生成模型版本Sora，該系統(tǒng)可以根據(jù)文本提示生成逼真的視頻。OpenAI還推出了Sora的新版本SoraTurbo，稱較2月預(yù)覽的版本速度顯著加快，可以生成最長達(dá)20秒的視頻，并且可以提供這些視頻的多種變體。OpenAI表示，正在針對(duì)不同類型的用戶制定量身定制的價(jià)格方案，計(jì)劃于明年年初推出。

?人工智能 ?視頻生成 ?OpenAI
薦視頻生成大模型賽道，只是看上去擁擠

2024年最后一個(gè)月，國產(chǎn)大模型落地應(yīng)用突然加速。尤其視頻生成模型，就像密集射出子彈后的槍管，熱得發(fā)燙。AI一天，人間一年。

?國產(chǎn)大模型 ?視頻生成模型 ?AI導(dǎo)演
力壓Sora！谷歌第二代AI視頻生成模型Veo 2發(fā)布：分辨率可達(dá)4K

據(jù)報(bào)道，谷歌發(fā)布了最新的AI視頻生成模型Veo2。Veo2模型能夠生成最高4K分辨率、時(shí)長達(dá)到2分鐘的視頻片段，相較于OpenAI的Sora模型，分辨率提升了4倍，視頻時(shí)長增加了6倍。除了Veo2之外，Google這波還推出了改進(jìn)版的AI繪圖Imagen3模型，生圖細(xì)節(jié)更好、光照更豐富、干擾更少。

?谷歌 ?AI視頻生成 ?Veo
薦AI日?qǐng)?bào)：階躍星辰內(nèi)測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開啟內(nèi)測可在躍問視頻申請(qǐng)階躍星辰的Step-Video模型正式開啟內(nèi)測，用戶可以通過躍問視頻官網(wǎng)申請(qǐng)資格。用戶可在最新版本的WPSOffice中輕松找到?

?人工智能 ?視頻生成 ?技術(shù)趨勢
中國電信發(fā)布全自研視頻生成大模型完成全模態(tài)體系構(gòu)建

12月3日，在中國電信“2024數(shù)字科技生態(tài)大會(huì)”期間，首屆“TeleAI開發(fā)者大會(huì)”在廣州舉辦。TeleAI發(fā)布視頻生成大模型、視覺大模型產(chǎn)用一體化平臺(tái)、具身智能、智傳網(wǎng)等一系列創(chuàng)新技術(shù)、產(chǎn)品及科研成果，并發(fā)布開發(fā)者產(chǎn)業(yè)聯(lián)盟計(jì)劃。展出了星辰軟件工廠、星辰慧記、星辰智能體產(chǎn)品、中國電信家庭小管家、星辰大模型一體機(jī)等一系列智能產(chǎn)品，讓現(xiàn)場觀眾真實(shí)感受未來以來，AI就在每個(gè)人的身邊。

?TeleAI大模型 ?數(shù)字科技生態(tài)大會(huì) ?人工智能發(fā)展
薦AI日?qǐng)?bào)：智譜AI發(fā)布AutoGLM升級(jí)版；Kimi灰測AI視頻生成功能；SD3.5L新增三大ControlNet功能；ChatGPT誕生兩周年

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、震撼來襲!StabilityAI的SD3.5L新增三大ControlNet功能生圖能力再升級(jí)StabilityAI發(fā)布了新版StableDiffusion3.5Large，新增三種ControlNet功能，分別是Blur、Canny和Depth，顯著提升了圖像生成能力。?

?Stability ?AI ?Stable
薦AI日?qǐng)?bào)：OpenAI全面開放Canvas功能；豆包電腦版視頻生成功能內(nèi)測；全球首個(gè)AI程序員Devin開放使用

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI發(fā)布Canvas工具提高ChatGPT寫作和編碼效率OpenAI于12月11日推出Canvas功能，旨在提升ChatGPT用戶在寫作和編碼項(xiàng)目中的效率。這一漏洞不僅影響Claude波及其他AI聊天機(jī)器人，提醒我們在AI安全問題亟需關(guān)注。

?人工智能 ?ChatGPT ?OpenAI
薦體操運(yùn)動(dòng)，是所有AI視頻最殘酷的圖靈測試。

昨天Sora全網(wǎng)上線，大家也都測試了很多了。產(chǎn)品完成度很高，但是模型質(zhì)量，真的有點(diǎn)不及預(yù)期。但終點(diǎn)一定值得期待。

?AI視頻

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

AI視頻生成框架AnimateDiff 高速運(yùn)動(dòng)視頻依然保持穩(wěn)定

Kimi內(nèi)測AI視頻生成功能：每天可免費(fèi)生成100秒視頻

Sora之后，視頻生成模型的中國牌局

OpenAI正式推出AI視頻生成模型Sora：ChatGPT訂閱用戶免費(fèi)用

薦視頻生成大模型賽道，只是看上去擁擠

力壓Sora！谷歌第二代AI視頻生成模型Veo 2發(fā)布：分辨率可達(dá)4K

薦AI日?qǐng)?bào)：階躍星辰內(nèi)測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

中國電信發(fā)布全自研視頻生成大模型完成全模態(tài)體系構(gòu)建

薦AI日?qǐng)?bào)：智譜AI發(fā)布AutoGLM升級(jí)版；Kimi灰測AI視頻生成功能；SD3.5L新增三大ControlNet功能；ChatGPT誕生兩周年

薦AI日?qǐng)?bào)：OpenAI全面開放Canvas功能；豆包電腦版視頻生成功能內(nèi)測；全球首個(gè)AI程序員Devin開放使用

薦體操運(yùn)動(dòng)，是所有AI視頻最殘酷的圖靈測試。

熱文

京東發(fā)布年終獎(jiǎng)通知部分員工年前可收到年終獎(jiǎng)

消息稱OpenAI新模型GPT-5研發(fā)未達(dá)到預(yù)期：成本高昂效果欠佳

央視曝光未成年人繞開防沉迷只需4元：通過租用游戲賬號(hào)規(guī)避

李斌回應(yīng)螢火蟲外觀設(shè)計(jì)：看過實(shí)車的人都喜歡這個(gè)設(shè)計(jì)

沒網(wǎng)也能聯(lián)絡(luò)！小米15系列星辰無網(wǎng)通12月底升級(jí)6km級(jí)通話范圍

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

FF再獲3000萬美元新一輪融資加速第二品牌FX戰(zhàn)略推進(jìn)

QQ音樂年度聽歌報(bào)告發(fā)布：誰是你最喜歡的歌手？

微信可以線上送實(shí)體禮物了：微信小店“藍(lán)包”功能正灰度測試逐

抖音上線“驗(yàn)證助手” 可幫助用戶識(shí)別電話等是否屬于抖音官方

微信朋友圈崩了上熱搜騰訊客服：請(qǐng)嘗試這幾種方法

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

小紅書封號(hào)上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

京東發(fā)布年終獎(jiǎng)通知部分員工年前可收到年終獎(jiǎng)

未成年人成部分博主流量密碼抖音治理涉“網(wǎng)紅兒童”違規(guī)內(nèi)容

極越員工善后方案已出爐：員工獲“N+1”賠償由百度吉利出資

螞蟻集團(tuán)否認(rèn)借殼上市：目前沒有上市計(jì)劃

小紅書被吐槽無理由封號(hào) 客服回應(yīng)：未說明處罰時(shí)間就是永封

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車?yán)m(xù)航之王

極越公關(guān)負(fù)責(zé)人被開除本人回應(yīng)：此前未接到任何通知

站長商機(jī)