3DHM框架：一圖片可模仿任意視頻動(dòng)作 360度無(wú)死角

2024-01-29 13:57 · 稿源：站長(zhǎng)之家

劃重點(diǎn):
- 無(wú)需標(biāo)注數(shù)據(jù)，3DHM框架即可讓照片動(dòng)起來(lái)，模仿目標(biāo)視頻動(dòng)作，衣服動(dòng)起來(lái)也真實(shí)!
- 研究人員提出了一個(gè)兩階段的、基于擴(kuò)散模型的框架3DHM，通過(guò)從單個(gè)圖像完成紋理圖來(lái)合成3D人體運(yùn)動(dòng)，然后渲染3D人體以模仿視頻中actor的動(dòng)作。
- 該方法在生成長(zhǎng)時(shí)間運(yùn)動(dòng)和各種高難度的姿勢(shì)上更有彈性，對(duì)視頻圖像渲染更加逼真。

站長(zhǎng)之家（ChinaZ.com）1月29日消息:加州大學(xué)伯克利分校的研究人員最近發(fā)布了一個(gè)名為3DHM的框架，能夠讓一張圖片動(dòng)起來(lái)，模仿任意視頻動(dòng)作，即使是視頻中的衣服也能夠運(yùn)動(dòng)得非常真實(shí)。

這一框架無(wú)需標(biāo)注數(shù)據(jù)，通過(guò)從單個(gè)圖像完成紋理圖來(lái)合成3D人體運(yùn)動(dòng)，然后渲染3D人體以模仿視頻中actor的動(dòng)作。通過(guò)這種方法，研究人員能夠在生成長(zhǎng)時(shí)間運(yùn)動(dòng)和各種高難度的姿勢(shì)上更有彈性，對(duì)視頻圖像渲染更加逼真。

為了解決這個(gè)問(wèn)題，研究人員使用填充擴(kuò)散模型，在給定的單張圖像中想象出不可見(jiàn)部分，然后在紋理圖空間上訓(xùn)練該模型，在姿勢(shì)和視點(diǎn)不變的條件下提升采樣效率。

他們還開(kāi)發(fā)了一個(gè)基于擴(kuò)散模型的渲染pipeline，由3D人體姿勢(shì)控制，從而可以生成目標(biāo)人物在不同姿勢(shì)下的逼真渲染，包括衣服、頭發(fā)和看不見(jiàn)區(qū)域下的合理填充。實(shí)驗(yàn)結(jié)果表明，相比以前的方法，該方法在生成長(zhǎng)時(shí)間運(yùn)動(dòng)和各種高難度的姿勢(shì)上更有彈性。

在具體實(shí)現(xiàn)上，研究人員首先利用一種常用的方法來(lái)推斷像素到表面的對(duì)應(yīng)關(guān)系，從而建立一個(gè)不完整的UV紋理圖，用于從單張RGB圖像中提取三維網(wǎng)格紋理。同時(shí)計(jì)算可見(jiàn)性掩碼，以顯示哪些像素在3D中可見(jiàn)，哪些不可見(jiàn)。接著，通過(guò)生成偽完整紋理貼圖來(lái)渲染人物。

在第二階段，他們通過(guò)收集大量的配對(duì)數(shù)據(jù)訓(xùn)練第二階段擴(kuò)散模型，以獲得一個(gè)模仿actor動(dòng)作的人的逼真渲染效果。

這種方法使得他們能夠在生成具有生動(dòng)紋理的真人圖像上取得良好的效果。

論文網(wǎng)址：https://arxiv.org/abs/2401.10889

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

告別玩手機(jī)暈車！榮耀300系列全球首發(fā)360度全場(chǎng)景暈動(dòng)舒緩顯示

榮耀300系列延續(xù)了祖?zhèn)鳌钡淖o(hù)眼屏幕，不僅僅對(duì)視覺(jué)友好，甚至還加入了防暈車功能。榮耀300系列全球首發(fā)360度全場(chǎng)景暈動(dòng)舒緩顯示，能覆蓋全交通場(chǎng)景，有效緩解暈車。支持榮耀獨(dú)家AI離焦護(hù)眼、AI干眼友好和AI助眠顯示等技術(shù)。

?榮耀300系列 ?護(hù)眼屏幕 ?暈車功能
一切皆可搜！360發(fā)布“納米搜索”：開(kāi)啟搜索3.0時(shí)代

360今晚正式發(fā)布多模態(tài)內(nèi)容創(chuàng)作引擎納米搜索”，知名脫口秀演員李雪琴和徐志勝成為納米搜索聲音大使。納米搜索號(hào)稱5歲孩子和80歲老奶奶都能用，可一站式完成搜、學(xué)、寫、創(chuàng)”，一切皆可生成視頻，人人都可成為內(nèi)容創(chuàng)作者。新產(chǎn)品之所以命名為納米搜索”，一方面為了打造全新的搜索品牌納米”這個(gè)詞代表科技的發(fā)展高度，十分有辨識(shí)度；另一方面納米”是極小的度量單位，納米搜索希望可以從微觀出發(fā)，幫用戶解決問(wèn)題，通過(guò)搜、學(xué)、寫、創(chuàng)”四大功能實(shí)現(xiàn)對(duì)搜索的重塑，推動(dòng)搜索進(jìn)入3.0時(shí)代。

?納米搜索 ?多模態(tài)內(nèi)容創(chuàng)作 ?李雪琴
豆包說(shuō)要「普惠」，于是大模型處理圖片按「厘」計(jì)價(jià)了

OpenAI宣告連續(xù)12輪轟炸，讓2024年底的大模型領(lǐng)域熱鬧起來(lái)了。但堅(jiān)持每個(gè)凌晨看直播的話會(huì)發(fā)現(xiàn)，越到后面的發(fā)布越平淡，內(nèi)心的波動(dòng)也越少了。豆包大模型還有哪些驚喜?值得每一個(gè)人期待。

?大模型 ?OpenAI ?豆包視覺(jué)理解
周鴻祎：95%以上的中國(guó)電腦安裝了360

今年7月，微軟藍(lán)屏事件被記錄為史上最嚴(yán)重的IT系統(tǒng)崩潰。此次事件由殺毒軟件更新觸發(fā)，導(dǎo)致全球超過(guò)20個(gè)國(guó)家的逾千萬(wàn)Windows設(shè)備陷入癱瘓，影響了包括航空、銀行、電信、媒體、健康醫(yī)療和零售在內(nèi)的多個(gè)行業(yè)，給各大公司帶來(lái)了巨大的損失。無(wú)論是面對(duì)各種Windows系統(tǒng)、復(fù)雜的應(yīng)用軟件沖擊是與各類黑客軟件、流氓軟件病毒的實(shí)際攻防中，360都能保持穩(wěn)定運(yùn)行。

?微軟藍(lán)屏事件 ?IT系統(tǒng)崩潰 ?殺毒軟件更新
周鴻祎公司突然賣房：360全資子公司1.33億元出售房屋車位

上市公司三六零近日發(fā)布公告，宣布其全資子公司天津奇瀚科技有限公司已同意以人民幣1.33億元的價(jià)格出售位于天津市濱海高新區(qū)的房產(chǎn)和車位。具體資產(chǎn)包括天津市濱海高新區(qū)華苑產(chǎn)業(yè)區(qū)海泰大道20號(hào)研發(fā)樓A棟13-21層房屋及90個(gè)地下車位，買方為天津?yàn)I海高新區(qū)企業(yè)創(chuàng)新服務(wù)有限公司。這次交易將對(duì)公司的財(cái)務(wù)狀況和經(jīng)營(yíng)成果產(chǎn)生積極影響，具體的財(cái)務(wù)數(shù)據(jù)將以公司經(jīng)審計(jì)的財(cái)務(wù)報(bào)告為準(zhǔn)。

?三六零公司 ?天津奇瀚 ?房產(chǎn)出售
微信原生鴻蒙版發(fā)布1.0.2.35版本更新：完善聊天圖片發(fā)送/查看、群聊折疊

全新的微信原生鴻蒙版已上架華為應(yīng)用市場(chǎng)應(yīng)用嘗鮮專區(qū)，版本號(hào)為1.0.2.35。測(cè)試說(shuō)明顯示，該版本完善了聊天圖片發(fā)送/查看等能力，支持群聊折疊等功能。騰訊公司公關(guān)總監(jiān)張軍回復(fù)表示，非常感謝博主發(fā)現(xiàn)重大bug，他們已經(jīng)修復(fù)。

?微信鴻蒙版 ?華為應(yīng)用市場(chǎng) ?聊天功能優(yōu)化
開(kāi)啟搜索引擎3.0時(shí)代！360“納米搜索”發(fā)布首日訪問(wèn)量超100萬(wàn)

昨晚，360集團(tuán)正式推出全新多模態(tài)內(nèi)容創(chuàng)作引擎納米搜索”，今天下午已上升至iOSAppStore效率榜30位。納米搜索正式上線首日訪問(wèn)量已超過(guò)100萬(wàn)。在家庭場(chǎng)景里，家長(zhǎng)可將需要給孩子講解的習(xí)題拍照，由納米搜索為孩子講解；老年人在看到電視購(gòu)物推薦的產(chǎn)品后，可通過(guò)納米搜索的拍照搜索功能對(duì)該產(chǎn)品的實(shí)際功效和價(jià)值進(jìn)行核實(shí)，避免上當(dāng)受騙。

?360集團(tuán) ?納米搜索 ?多模態(tài)內(nèi)容
2024年最佳免費(fèi)AI圖片轉(zhuǎn)提示工具

在當(dāng)今快節(jié)奏的創(chuàng)意世界中，圖像到提示工具已變得不可或缺。它們可以自動(dòng)生成圖像提示，為您節(jié)省時(shí)間和精力。這些知識(shí)可以幫助您了解如何使用這些工具并增強(qiáng)您的創(chuàng)意輸出。

?圖像生成 ?創(chuàng)意工具 ?內(nèi)容制作
薦華人團(tuán)隊(duì)，玩轉(zhuǎn)流量、逆勢(shì)增長(zhǎng) | AI圖片出海洞察第4期

這個(gè)月嘗試加入更多維度數(shù)據(jù)來(lái)補(bǔ)充觀察視角，下個(gè)月會(huì)發(fā)力完善App榜單。白鯨出海聯(lián)合非凡產(chǎn)研發(fā)布第4期全球AI圖片web榜單，并逐步添加圖片App數(shù)據(jù)。web榜單的門檻是月訪問(wèn)量200w、App榜單的標(biāo)準(zhǔn)是MAU200w，很多web做得比較好的產(chǎn)品都開(kāi)始發(fā)力App端，例如出海的Fotor、SeaArt等等，前者在移動(dòng)端也已經(jīng)做到了百萬(wàn)左右的MAU，下個(gè)月我們會(huì)進(jìn)一步完善數(shù)據(jù)。

?AI ?圖片 ?榜單發(fā)布
薦AI日?qǐng)?bào)：階躍星辰內(nèi)測(cè)視頻大模型Step-Video；即夢(mèng)AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開(kāi)啟內(nèi)測(cè)可在躍問(wèn)視頻申請(qǐng)階躍星辰的Step-Video模型正式開(kāi)啟內(nèi)測(cè)，用戶可以通過(guò)躍問(wèn)視頻官網(wǎng)申請(qǐng)資格。用戶可在最新版本的WPSOffice中輕松找到?

?人工智能 ?視頻生成 ?技術(shù)趨勢(shì)

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

3DHM框架：一圖片可模仿任意視頻動(dòng)作 360度無(wú)死角

告別玩手機(jī)暈車！榮耀300系列全球首發(fā)360度全場(chǎng)景暈動(dòng)舒緩顯示

一切皆可搜！360發(fā)布“納米搜索”：開(kāi)啟搜索3.0時(shí)代

豆包說(shuō)要「普惠」，于是大模型處理圖片按「厘」計(jì)價(jià)了

周鴻祎：95%以上的中國(guó)電腦安裝了360

周鴻祎公司突然賣房：360全資子公司1.33億元出售房屋車位

微信原生鴻蒙版發(fā)布1.0.2.35版本更新：完善聊天圖片發(fā)送/查看、群聊折疊

開(kāi)啟搜索引擎3.0時(shí)代！360“納米搜索”發(fā)布首日訪問(wèn)量超100萬(wàn)

2024年最佳免費(fèi)AI圖片轉(zhuǎn)提示工具

薦華人團(tuán)隊(duì)，玩轉(zhuǎn)流量、逆勢(shì)增長(zhǎng) | AI圖片出海洞察第4期

薦AI日?qǐng)?bào)：階躍星辰內(nèi)測(cè)視頻大模型Step-Video；即夢(mèng)AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

熱文

余承東：華為明年將推出大家想不到的產(chǎn)品

董明珠回應(yīng)格力電器賣得貴：為消費(fèi)者帶來(lái)更長(zhǎng)遠(yuǎn)的價(jià)值

抖音完成100部老港片4K高清修復(fù)：已上線抖音、西瓜視頻

抖音副總裁回應(yīng)吳柳芳再次被禁：分歧很大將根據(jù)法律執(zhí)行好

周鴻祎稱被車門夾傷的手成頑固傷：近3個(gè)月沒(méi)攀巖

周鴻祎：2025年這7大風(fēng)口最賺錢單身經(jīng)濟(jì)排第一

昇騰AI平臺(tái)訓(xùn)練推理！中國(guó)聯(lián)通元景文生圖大模型開(kāi)源：真正懂中

2024財(cái)富縮水最多的5位億萬(wàn)富豪：拼多多創(chuàng)始人黃崢上榜今年夏

董明珠稱網(wǎng)暴編的太離譜：破壞網(wǎng)絡(luò)環(huán)境清者自清

吳柳芳賬號(hào)再次被禁粉絲從600萬(wàn)被清理至4萬(wàn) 抖音：低俗內(nèi)容吸

余承東：華為明年將推出大家想不到的產(chǎn)品

劉強(qiáng)東提前發(fā)年終獎(jiǎng) 絕大多數(shù)員工可獲5到8個(gè)月年終獎(jiǎng)

京東發(fā)布年終獎(jiǎng)通知部分員工年前可收到年終獎(jiǎng)

肯德基中國(guó)漲價(jià) 官方回應(yīng)：運(yùn)營(yíng)成本變化導(dǎo)致

美團(tuán)回應(yīng)騎手穿點(diǎn)男模字樣工服：博流量惡意炒作

騰訊張軍辟謠微信送禮會(huì)議紀(jì)要：只想做點(diǎn)腳踏實(shí)地的事

董明珠回應(yīng)格力電器賣得貴：為消費(fèi)者帶來(lái)更長(zhǎng)遠(yuǎn)的價(jià)值

小米SU7最新版本OTA推送：正式接入VLM視覺(jué)語(yǔ)言大模型

李斌回應(yīng)螢火蟲(chóng)外觀設(shè)計(jì)：看過(guò)實(shí)車的人都喜歡這個(gè)設(shè)計(jì)

站長(zhǎng)商機(jī)