Adobe研究人員研發(fā)新AI模型LRM：實(shí)現(xiàn)從2D樣本瞬時(shí)生成3D圖像

2023-11-14 10:35 · 稿源：站長(zhǎng)之家

**劃重點(diǎn):**
1. ?? Adobe Research和澳大利亞國(guó)立大學(xué)（ANU）聯(lián)合宣布，他們研發(fā)出首個(gè)能夠從單一2D圖像生成3D圖像的人工智能模型。
2. ?? 新算法基于大規(guī)模圖像樣本訓(xùn)練，能夠在幾秒鐘內(nèi)生成高質(zhì)量的3D圖像，該算法采用了名為LRM（Large Reconstruction Model）的高度可擴(kuò)展神經(jīng)網(wǎng)絡(luò)，包含一百萬(wàn)數(shù)據(jù)集和五億參數(shù)。
3. ?? LRM的成功在于其能夠利用數(shù)百萬(wàn)圖像參數(shù)的數(shù)據(jù)庫(kù)，并預(yù)測(cè)神經(jīng)輻射場(chǎng)（NeRF），從而僅基于2D圖像生成逼真的3D圖像，即使這些圖像是低分辨率的。

站長(zhǎng)之家（ChinaZ.com）11月14日消息:由Adobe Research和澳大利亞國(guó)立大學(xué)（ANU）聯(lián)合研發(fā)的人工智能模型宣布了一項(xiàng)突破性的成果，能夠從單一的2D圖像中生成3D圖像。

研究人員表示，他們的新算法在大規(guī)模圖像樣本上進(jìn)行訓(xùn)練，可以在幾秒鐘內(nèi)生成這樣的3D圖像。該算法采用了名為L(zhǎng)RM（Large Reconstruction Model）的高度可擴(kuò)展神經(jīng)網(wǎng)絡(luò)，包含一百萬(wàn)數(shù)據(jù)集和五億參數(shù)，涵蓋圖像、3D形狀和視頻等多種數(shù)據(jù)。

該項(xiàng)目的領(lǐng)導(dǎo)作者、澳大利亞國(guó)立大學(xué)工程、計(jì)算和控制學(xué)院的畢業(yè)生、Adobe實(shí)習(xí)生Yicong Hong表示:“這種高容量模型和大規(guī)模訓(xùn)練數(shù)據(jù)的結(jié)合使得我們的模型具有很強(qiáng)的泛化能力，能夠從各種測(cè)試輸入中產(chǎn)生高質(zhì)量的3D重建。”

據(jù)Hong介紹，早期的3D成像軟件只在特定主題類別中表現(xiàn)良好，后來(lái)的圖像生成進(jìn)展是通過(guò)程序如DALL-E和Stable Diffusion實(shí)現(xiàn)的，它們利用了2D擴(kuò)散模型的卓越泛化能力以實(shí)現(xiàn)多視圖。然而，這些程序的結(jié)果僅限于預(yù)訓(xùn)練的2D生成模型。

其他系統(tǒng)利用每形狀優(yōu)化來(lái)取得令人印象深刻的結(jié)果，但根據(jù)Hong的說(shuō)法，它們“通常緩慢且不切實(shí)際”。他指出，利用大規(guī)模數(shù)據(jù)的巨大變壓器網(wǎng)絡(luò)內(nèi)的自然語(yǔ)言模型的發(fā)展激發(fā)了他的團(tuán)隊(duì)提出一個(gè)問(wèn)題:“是否可能學(xué)習(xí)從單一圖像重建對(duì)象的通用3D先驗(yàn)?”他們的答案是“是”。

“LRM可以從現(xiàn)實(shí)世界中捕獲的各種圖像以及由生成模型創(chuàng)建的圖像中重建高保真度的3D形狀?！?Hong說(shuō)道，“LRM也是下游應(yīng)用的高度實(shí)用解決方案，因?yàn)樗梢栽趦H五秒鐘內(nèi)生成一個(gè)3D形狀，無(wú)需后期優(yōu)化。”

該程序的成功在于其能夠利用數(shù)百萬(wàn)圖像參數(shù)的數(shù)據(jù)庫(kù)，并預(yù)測(cè)神經(jīng)輻射場(chǎng)（NeRF）。這意味著它能夠僅基于2D圖像生成逼真的3D圖像，即使這些圖像是低分辨率的。與之前的3D軟件相比，該模型的突破性在于其快速、高效地生成高質(zhì)量的3D圖像，為增強(qiáng)現(xiàn)實(shí)、虛擬現(xiàn)實(shí)系統(tǒng)、游戲、影視動(dòng)畫和工業(yè)設(shè)計(jì)等領(lǐng)域帶來(lái)了轉(zhuǎn)變。

總的來(lái)說(shuō)，LRM（Large Reconstruction Model）是一種用于從單張圖像生成高保真度3D物體模型的模型。LRM通過(guò)采用大規(guī)模數(shù)據(jù)和高容量模型的組合，實(shí)現(xiàn)了從單張圖像到3D模型的快速而準(zhǔn)確的重建。以下是LRM的主要功能特色:

1. 快速生成:LRM能夠在短短5秒內(nèi)，從單張輸入圖像中生成高保真度的3D物體模型。
2. 大規(guī)模訓(xùn)練:與許多先前的方法不同，LRM采用了高度可擴(kuò)展的基于transformer的架構(gòu)，具有5億個(gè)可學(xué)習(xí)參數(shù)，用于直接預(yù)測(cè)神經(jīng)輻射場(chǎng)（NeRF）。
3. 數(shù)據(jù)多樣性:模型以端到端的方式在包含大約100萬(wàn)個(gè)對(duì)象的大規(guī)模多視圖數(shù)據(jù)上進(jìn)行訓(xùn)練，包括Objaverse的合成渲染和MVImgNet的實(shí)際捕捉數(shù)據(jù)。
4.高通用性: 由于高容量模型和大規(guī)模訓(xùn)練數(shù)據(jù)的結(jié)合，LRM具有很強(qiáng)的通用性，能夠從各種測(cè)試輸入中生成高質(zhì)量的3D重建，包括真實(shí)世界中的野外捕捉和生成模型的圖像。

5. Transformer-Based架構(gòu):LRM采用了完全可微分的transformer-based編碼器-解碼器框架，通過(guò)預(yù)訓(xùn)練的視覺(jué)模型（DINO）對(duì)輸入圖像進(jìn)行編碼，使用大型transformer解碼器通過(guò)交叉注意力將圖像特征投影到3D三平面表示，然后通過(guò)多層感知器預(yù)測(cè)體積渲染的點(diǎn)顏色和密度。

項(xiàng)目頁(yè)面:https://yiconghong.me/LRM/

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

薦一句話一張圖秒變3D動(dòng)畫，4K級(jí)超清畫質(zhì)！英偉達(dá)祭出新作，游戲生成世界成真

【新智元導(dǎo)讀】英偉達(dá)團(tuán)隊(duì)再次于自己的老本行大發(fā)光彩。近日發(fā)布的Edify3D支持用戶從文本提示或者圖像來(lái)直接生成4K級(jí)別的3D實(shí)體與場(chǎng)景，這再次為游戲與影視設(shè)計(jì)行業(yè)注入了新的AI活力。其研究團(tuán)隊(duì)致力于推進(jìn)和發(fā)展3D資產(chǎn)自動(dòng)化生成的新工具，使3D內(nèi)容創(chuàng)作更加易于。

?Edify3D
薦AI日?qǐng)?bào)：iPhone國(guó)行版或接入文心4.0模型；ChatGPT周活躍用戶數(shù)突破3億；Genie 2一鍵生成無(wú)限3D世界

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、GoogleDeepMind發(fā)布Genie2，一鍵生成無(wú)限虛擬世界GoogleDeepMind近期推出的Genie2模型，通過(guò)自然語(yǔ)言指令實(shí)時(shí)生成多樣化且邏輯連貫的虛擬世界，展現(xiàn)出強(qiáng)大的AI訓(xùn)練和交互潛力。音樂(lè)創(chuàng)?

?人工智能 ?虛擬世界 ?Google
薦AI日?qǐng)?bào)：階躍星辰內(nèi)測(cè)視頻大模型Step-Video；即夢(mèng)AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開(kāi)啟內(nèi)測(cè)可在躍問(wèn)視頻申請(qǐng)階躍星辰的Step-Video模型正式開(kāi)啟內(nèi)測(cè)，用戶可以通過(guò)躍問(wèn)視頻官網(wǎng)申請(qǐng)資格。用戶可在最新版本的WPSOffice中輕松找到?

?人工智能 ?視頻生成 ?技術(shù)趨勢(shì)
薦AI日?qǐng)?bào)：驚艷！Sora遭惡意泄露；昆侖萬(wàn)維Skywork o1啟動(dòng)邀測(cè)；阿里開(kāi)源圖像生成模型Qwen2vl-Flux

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、來(lái)自藝術(shù)家的復(fù)仇!OpenAI視頻模型Sora慘遭短暫泄露OpenAI的文本轉(zhuǎn)視頻模型Sora在測(cè)試階段遭到藝術(shù)家的抗議和泄露，這些藝術(shù)家對(duì)公司利用他們的創(chuàng)造力表示不滿。這位專員可能與“加密貨幣專員”職位合并，形成新的監(jiān)管框架，特斯拉CEO馬斯克等人將對(duì)人選產(chǎn)生重要影響。

?AI日?qǐng)?bào) ?OpenAI ?視頻模型
全球首個(gè)AI圣彼得大教堂上線，40萬(wàn)照片毫米級(jí)3D還原文藝復(fù)興巔峰！

不用排隊(duì)、不用簽證，現(xiàn)在只需打開(kāi)屏幕，就能探索圣彼得大教堂的一切——從壯美的圓頂?shù)锦r有人見(jiàn)的教皇墓地，全方位感受這座文藝復(fù)興與巴洛克建筑巔峰之作的震撼。梵蒂岡聯(lián)手Iconem和微軟，僅用不到一個(gè)月的時(shí)間，就打造了這座教堂的數(shù)字雙胞胎，并推出沉浸式展覽和互動(dòng)網(wǎng)站——LaBasilicadiSanPietro。一起來(lái)一場(chǎng)身臨其境之旅吧。

?圣彼得大教堂
從沉浸式到3D Mapping，光峰科技助力湄洲島媽祖文化“出圈”

根據(jù)11月17日官方發(fā)布的權(quán)威數(shù)據(jù)，今年湄洲島接待游客數(shù)量已刷新歷史最高紀(jì)錄，高達(dá)247萬(wàn)人次。該島既是風(fēng)景秀麗的海濱旅游勝地，亦是媽祖文化的發(fā)祥之地。光峰科技運(yùn)用其精湛的數(shù)字光影技術(shù)，生動(dòng)地講述了媽祖文化的傳奇故事，助力湄洲島的文化旅游融合邁向了一個(gè)嶄新的高度。

?湄洲島 ?媽祖文化 ?旅游發(fā)展
英偉達(dá)展示AI模型Fugatto：可修改并生成新聲音

據(jù)報(bào)道，英偉達(dá)展示了一種用于生成音樂(lè)和音頻的新型人工智能模型Fugatto，它可以修改聲音并生成新的聲音。Fugatto的獨(dú)特魅力在于其超越傳統(tǒng)的人工智能界限，不僅能夠接收并分析現(xiàn)有音頻素材能對(duì)其進(jìn)行靈活修改。行業(yè)內(nèi)的其他巨頭如OpenAI與Meta，對(duì)于何時(shí)會(huì)推出能夠生成音頻或視頻的先進(jìn)模型，同樣保持著神秘的態(tài)度，尚未透露具體的時(shí)間表。

?人工智能 ?音頻生成 ?英偉達(dá)
AI商品圖免費(fèi)生成工具推薦電商主圖一鍵免費(fèi)生成

還在為沒(méi)有好看的電商主圖發(fā)愁嗎？傳統(tǒng)拍攝的商品圖有著拍攝昂貴、耗時(shí)長(zhǎng)等問(wèn)題，在易可圖AI商品圖的幫助下這些問(wèn)題都將解決，易可圖AI商品圖是一個(gè)免費(fèi)的電商主圖一鍵生成工具，只需一張商品圖片數(shù)秒就能創(chuàng)造出精美的AI商品圖。易可圖AI商品圖的使用步驟1.給自己的產(chǎn)品拍攝一張圖片，背景盡量簡(jiǎn)單些，純色背景最好2.將產(chǎn)品圖上傳至易可圖AI商品圖功能中，在畫布中

?電商主圖 ?AI商品圖 ?商品拍攝
榮耀300 Ultra支持3D超聲波指紋：濕手無(wú)憂解鎖

榮耀預(yù)告，榮耀300Ultra支持3D超聲波指紋解鎖，濕手也能輕松解鎖，同檔罕見(jiàn)。超聲波屏幕指紋是近年來(lái)興起的一項(xiàng)新興技術(shù)，當(dāng)手指按壓屏幕，屏幕下的傳感器向手指按壓區(qū)域發(fā)射超聲波，當(dāng)超聲波接觸到指紋的嵴”和峪”時(shí)，被吸收、穿透、反射的程度有差異，會(huì)產(chǎn)生不同能量的回波并被傳感器接收，從構(gòu)建出3D指紋圖像。榮耀300系列將搭載全新的雅顧光影寫真大師，基于AI光影寫真人像引擎，榮耀為用戶帶來(lái)雅顧生動(dòng)人像、質(zhì)感人像、經(jīng)典人像等多種人像風(fēng)格。

?榮耀300Ultra ?3D超聲波指紋 ?指紋解鎖技術(shù)
薦AI日?qǐng)?bào)：微信公眾號(hào)支持AI配圖；阿里云通義萬(wàn)相全新圖像編輯模型ACE；快手可靈AI推「AI試衣」功能

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、微信公眾號(hào)可以AI配圖了:還支持調(diào)整風(fēng)格和比例微信公眾號(hào)最近推出了“AI配圖”新功能，旨在幫助內(nèi)容創(chuàng)作者更高效地選擇和插入圖片。公司在硅谷融資60億美元，并計(jì)劃繼續(xù)擴(kuò)展資金，以支持發(fā)展。

?AI配圖 ?微信公眾號(hào) ?內(nèi)容創(chuàng)作

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

Adobe研究人員研發(fā)新AI模型LRM：實(shí)現(xiàn)從2D樣本瞬時(shí)生成3D圖像

薦一句話一張圖秒變3D動(dòng)畫，4K級(jí)超清畫質(zhì)！英偉達(dá)祭出新作，游戲生成世界成真

薦AI日?qǐng)?bào)：iPhone國(guó)行版或接入文心4.0模型；ChatGPT周活躍用戶數(shù)突破3億；Genie 2一鍵生成無(wú)限3D世界

薦AI日?qǐng)?bào)：階躍星辰內(nèi)測(cè)視頻大模型Step-Video；即夢(mèng)AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

薦AI日?qǐng)?bào)：驚艷！Sora遭惡意泄露；昆侖萬(wàn)維Skywork o1啟動(dòng)邀測(cè)；阿里開(kāi)源圖像生成模型Qwen2vl-Flux

全球首個(gè)AI圣彼得大教堂上線，40萬(wàn)照片毫米級(jí)3D還原文藝復(fù)興巔峰！

從沉浸式到3D Mapping，光峰科技助力湄洲島媽祖文化“出圈”

英偉達(dá)展示AI模型Fugatto：可修改并生成新聲音

AI商品圖免費(fèi)生成工具推薦電商主圖一鍵免費(fèi)生成

榮耀300 Ultra支持3D超聲波指紋：濕手無(wú)憂解鎖

薦AI日?qǐng)?bào)：微信公眾號(hào)支持AI配圖；阿里云通義萬(wàn)相全新圖像編輯模型ACE；快手可靈AI推「AI試衣」功能

熱文

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車?yán)m(xù)航之王

沒(méi)網(wǎng)也能聯(lián)絡(luò)！小米15系列星辰無(wú)網(wǎng)通12月底升級(jí)6km級(jí)通話范圍

消息稱OpenAI新模型GPT-5研發(fā)未達(dá)到預(yù)期：成本高昂效果欠佳

美團(tuán)：冬至期間將針對(duì)餃子等應(yīng)時(shí)食品訂單提供“超時(shí)保護(hù)”

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛(ài)上我

李斌回應(yīng)螢火蟲外觀設(shè)計(jì)：看過(guò)實(shí)車的人都喜歡這個(gè)設(shè)計(jì)

央視曝光未成年人繞開(kāi)防沉迷只需4元：通過(guò)租用游戲賬號(hào)規(guī)避

QQ音樂(lè)年度聽(tīng)歌報(bào)告發(fā)布：誰(shuí)是你最喜歡的歌手？

英偉達(dá)AI芯片最大買家揭曉！微軟力壓同行霸榜

微信朋友圈崩了上熱搜騰訊客服：請(qǐng)嘗試這幾種方法

極越員工萬(wàn)字怒懟ceo：公關(guān)總監(jiān)徐繼業(yè)怒罵員工蒼蠅

小紅書封號(hào)上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

馬斯克將推出X Mail電子郵箱服務(wù)

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

極越員工善后方案已出爐：?jiǎn)T工獲“N+1”賠償由百度吉利出資

螞蟻集團(tuán)否認(rèn)借殼上市：目前沒(méi)有上市計(jì)劃

小紅書被吐槽無(wú)理由封號(hào) 客服回應(yīng)：未說(shuō)明處罰時(shí)間就是永封

未成年人成部分博主流量密碼抖音治理涉“網(wǎng)紅兒童”違規(guī)內(nèi)容

站長(zhǎng)商機(jī)