幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > LRM最新資訊  > 正文

Adobe研究人員研發(fā)新AI模型LRM:實(shí)現(xiàn)從2D樣本瞬時(shí)生成3D圖像

2023-11-14 10:35 · 稿源:站長(zhǎng)之家

**劃重點(diǎn):**

1. ?? Adobe Research和澳大利亞國(guó)立大學(xué)(ANU)聯(lián)合宣布,他們研發(fā)出首個(gè)能夠從單一2D圖像生成3D圖像的人工智能模型。

2. ?? 新算法基于大規(guī)模圖像樣本訓(xùn)練,能夠在幾秒鐘內(nèi)生成高質(zhì)量的3D圖像,該算法采用了名為LRM(Large Reconstruction Model)的高度可擴(kuò)展神經(jīng)網(wǎng)絡(luò),包含一百萬(wàn)數(shù)據(jù)集和五億參數(shù)。

3. ?? LRM的成功在于其能夠利用數(shù)百萬(wàn)圖像參數(shù)的數(shù)據(jù)庫(kù),并預(yù)測(cè)神經(jīng)輻射場(chǎng)(NeRF),從而僅基于2D圖像生成逼真的3D圖像,即使這些圖像是低分辨率的。

站長(zhǎng)之家(ChinaZ.com)11月14日 消息:由Adobe Research和澳大利亞國(guó)立大學(xué)(ANU)聯(lián)合研發(fā)的人工智能模型宣布了一項(xiàng)突破性的成果,能夠從單一的2D圖像中生成3D圖像。

研究人員表示,他們的新算法在大規(guī)模圖像樣本上進(jìn)行訓(xùn)練,可以在幾秒鐘內(nèi)生成這樣的3D圖像。該算法采用了名為L(zhǎng)RM(Large Reconstruction Model)的高度可擴(kuò)展神經(jīng)網(wǎng)絡(luò),包含一百萬(wàn)數(shù)據(jù)集和五億參數(shù),涵蓋圖像、3D形狀和視頻等多種數(shù)據(jù)。

image.png

該項(xiàng)目的領(lǐng)導(dǎo)作者、澳大利亞國(guó)立大學(xué)工程、計(jì)算和控制學(xué)院的畢業(yè)生、Adobe實(shí)習(xí)生Yicong Hong表示:“這種高容量模型和大規(guī)模訓(xùn)練數(shù)據(jù)的結(jié)合使得我們的模型具有很強(qiáng)的泛化能力,能夠從各種測(cè)試輸入中產(chǎn)生高質(zhì)量的3D重建。”

據(jù)Hong介紹,早期的3D成像軟件只在特定主題類別中表現(xiàn)良好,后來(lái)的圖像生成進(jìn)展是通過(guò)程序如DALL-E和Stable Diffusion實(shí)現(xiàn)的,它們利用了2D擴(kuò)散模型的卓越泛化能力以實(shí)現(xiàn)多視圖。然而,這些程序的結(jié)果僅限于預(yù)訓(xùn)練的2D生成模型。

其他系統(tǒng)利用每形狀優(yōu)化來(lái)取得令人印象深刻的結(jié)果,但根據(jù)Hong的說(shuō)法,它們“通常緩慢且不切實(shí)際”。他指出,利用大規(guī)模數(shù)據(jù)的巨大變壓器網(wǎng)絡(luò)內(nèi)的自然語(yǔ)言模型的發(fā)展激發(fā)了他的團(tuán)隊(duì)提出一個(gè)問(wèn)題:“是否可能學(xué)習(xí)從單一圖像重建對(duì)象的通用3D先驗(yàn)?”他們的答案是“是”。

“LRM可以從現(xiàn)實(shí)世界中捕獲的各種圖像以及由生成模型創(chuàng)建的圖像中重建高保真度的3D形狀?!?Hong說(shuō)道,“LRM也是下游應(yīng)用的高度實(shí)用解決方案,因?yàn)樗梢栽趦H五秒鐘內(nèi)生成一個(gè)3D形狀,無(wú)需后期優(yōu)化。”

該程序的成功在于其能夠利用數(shù)百萬(wàn)圖像參數(shù)的數(shù)據(jù)庫(kù),并預(yù)測(cè)神經(jīng)輻射場(chǎng)(NeRF)。這意味著它能夠僅基于2D圖像生成逼真的3D圖像,即使這些圖像是低分辨率的。與之前的3D軟件相比,該模型的突破性在于其快速、高效地生成高質(zhì)量的3D圖像,為增強(qiáng)現(xiàn)實(shí)、虛擬現(xiàn)實(shí)系統(tǒng)、游戲、影視動(dòng)畫和工業(yè)設(shè)計(jì)等領(lǐng)域帶來(lái)了轉(zhuǎn)變。

image.png

總的來(lái)說(shuō),LRM(Large Reconstruction Model)是一種用于從單張圖像生成高保真度3D物體模型的模型。LRM通過(guò)采用大規(guī)模數(shù)據(jù)和高容量模型的組合,實(shí)現(xiàn)了從單張圖像到3D模型的快速而準(zhǔn)確的重建。以下是LRM的主要功能特色:

1. 快速生成:LRM能夠在短短5秒內(nèi),從單張輸入圖像中生成高保真度的3D物體模型。

2. 大規(guī)模訓(xùn)練:與許多先前的方法不同,LRM采用了高度可擴(kuò)展的基于transformer的架構(gòu),具有5億個(gè)可學(xué)習(xí)參數(shù),用于直接預(yù)測(cè)神經(jīng)輻射場(chǎng)(NeRF)。

3. 數(shù)據(jù)多樣性:模型以端到端的方式在包含大約100萬(wàn)個(gè)對(duì)象的大規(guī)模多視圖數(shù)據(jù)上進(jìn)行訓(xùn)練,包括Objaverse的合成渲染和MVImgNet的實(shí)際捕捉數(shù)據(jù)。

4.高通用性: 由于高容量模型和大規(guī)模訓(xùn)練數(shù)據(jù)的結(jié)合,LRM具有很強(qiáng)的通用性,能夠從各種測(cè)試輸入中生成高質(zhì)量的3D重建,包括真實(shí)世界中的野外捕捉和生成模型的圖像。

5. Transformer-Based架構(gòu):LRM采用了完全可微分的transformer-based編碼器-解碼器框架,通過(guò)預(yù)訓(xùn)練的視覺(jué)模型(DINO)對(duì)輸入圖像進(jìn)行編碼,使用大型transformer解碼器通過(guò)交叉注意力將圖像特征投影到3D三平面表示,然后通過(guò)多層感知器預(yù)測(cè)體積渲染的點(diǎn)顏色和密度。

項(xiàng)目頁(yè)面:https://yiconghong.me/LRM/

舉報(bào)

  • 相關(guān)推薦
  • 一句話一張秒變3D動(dòng)畫,4K級(jí)超清畫質(zhì)!英偉達(dá)祭出新作,游戲生成世界成真

    【新智元導(dǎo)讀】英偉達(dá)團(tuán)隊(duì)再次于自己的老本行大發(fā)光彩。近日發(fā)布的Edify3D支持用戶從文本提示或者圖像來(lái)直接生成4K級(jí)別的3D實(shí)體與場(chǎng)景,這再次為游戲與影視設(shè)計(jì)行業(yè)注入了新的AI活力。其研究團(tuán)隊(duì)致力于推進(jìn)和發(fā)展3D資產(chǎn)自動(dòng)化生成的新工具,使3D內(nèi)容創(chuàng)作更加易于。

  • AI日?qǐng)?bào):iPhone國(guó)行版或接入文心4.0模型;ChatGPT周活躍用戶數(shù)突破3億;Genie 2一鍵生成無(wú)限3D世界

    歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、GoogleDeepMind發(fā)布Genie2,一鍵生成無(wú)限虛擬世界GoogleDeepMind近期推出的Genie2模型,通過(guò)自然語(yǔ)言指令實(shí)時(shí)生成多樣化且邏輯連貫的虛擬世界,展現(xiàn)出強(qiáng)大的AI訓(xùn)練和交互潛力。音樂(lè)創(chuàng)?

  • AI日?qǐng)?bào):階躍星辰內(nèi)測(cè)視頻大模型Step-Video;即夢(mèng)AI2.1模型支持生成文字;騰訊發(fā)布混元視頻生成大模型

    歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開(kāi)啟內(nèi)測(cè)可在躍問(wèn)視頻申請(qǐng)階躍星辰的Step-Video模型正式開(kāi)啟內(nèi)測(cè),用戶可以通過(guò)躍問(wèn)視頻官網(wǎng)申請(qǐng)資格。用戶可在最新版本的WPSOffice中輕松找到?

  • AI日?qǐng)?bào):驚艷!Sora遭惡意泄露;昆侖萬(wàn)維Skywork o1啟動(dòng)邀測(cè);阿里開(kāi)源圖像生成模型Qwen2vl-Flux

    歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、來(lái)自藝術(shù)家的復(fù)仇!OpenAI視頻模型Sora慘遭短暫泄露OpenAI的文本轉(zhuǎn)視頻模型Sora在測(cè)試階段遭到藝術(shù)家的抗議和泄露,這些藝術(shù)家對(duì)公司利用他們的創(chuàng)造力表示不滿。這位專員可能與“加密貨幣專員”職位合并,形成新的監(jiān)管框架,特斯拉CEO馬斯克等人將對(duì)人選產(chǎn)生重要影響。

  • 全球首個(gè)AI圣彼得大教堂上線,40萬(wàn)照片毫米級(jí)3D還原文藝復(fù)興巔峰!

    不用排隊(duì)、不用簽證,現(xiàn)在只需打開(kāi)屏幕,就能探索圣彼得大教堂的一切——從壯美的圓頂?shù)锦r有人見(jiàn)的教皇墓地,全方位感受這座文藝復(fù)興與巴洛克建筑巔峰之作的震撼。梵蒂岡聯(lián)手Iconem和微軟,僅用不到一個(gè)月的時(shí)間,就打造了這座教堂的數(shù)字雙胞胎,并推出沉浸式展覽和互動(dòng)網(wǎng)站——LaBasilicadiSanPietro。一起來(lái)一場(chǎng)身臨其境之旅吧。

  • 從沉浸式到3D Mapping,光峰科技助力湄洲島媽祖文化“出圈”

    根據(jù)11月17日官方發(fā)布的權(quán)威數(shù)據(jù),今年湄洲島接待游客數(shù)量已刷新歷史最高紀(jì)錄,高達(dá)247萬(wàn)人次。該島既是風(fēng)景秀麗的海濱旅游勝地,亦是媽祖文化的發(fā)祥之地。光峰科技運(yùn)用其精湛的數(shù)字光影技術(shù),生動(dòng)地講述了媽祖文化的傳奇故事,助力湄洲島的文化旅游融合邁向了一個(gè)嶄新的高度。

  • 英偉達(dá)展示AI模型Fugatto:可修改并生成新聲音

    據(jù)報(bào)道,英偉達(dá)展示了一種用于生成音樂(lè)和音頻的新型人工智能模型Fugatto,它可以修改聲音并生成新的聲音。Fugatto的獨(dú)特魅力在于其超越傳統(tǒng)的人工智能界限,不僅能夠接收并分析現(xiàn)有音頻素材能對(duì)其進(jìn)行靈活修改。行業(yè)內(nèi)的其他巨頭如OpenAI與Meta,對(duì)于何時(shí)會(huì)推出能夠生成音頻或視頻的先進(jìn)模型,同樣保持著神秘的態(tài)度,尚未透露具體的時(shí)間表。

  • AI商品圖免費(fèi)生成工具推薦 電商主一鍵免費(fèi)生成

    還在為沒(méi)有好看的電商主圖發(fā)愁嗎?傳統(tǒng)拍攝的商品圖有著拍攝昂貴、耗時(shí)長(zhǎng)等問(wèn)題,在易可圖AI商品圖的幫助下這些問(wèn)題都將解決,易可圖AI商品圖是一個(gè)免費(fèi)的電商主圖一鍵生成工具,只需一張商品圖片數(shù)秒就能創(chuàng)造出精美的AI商品圖。易可圖AI商品圖的使用步驟1.給自己的產(chǎn)品拍攝一張圖片,背景盡量簡(jiǎn)單些,純色背景最好2.將產(chǎn)品圖上傳至易可圖AI商品圖功能中,在畫布中

  • 榮耀300 Ultra支持3D超聲波指紋:濕手無(wú)憂解鎖

    榮耀預(yù)告,榮耀300Ultra支持3D超聲波指紋解鎖,濕手也能輕松解鎖,同檔罕見(jiàn)。超聲波屏幕指紋是近年來(lái)興起的一項(xiàng)新興技術(shù),當(dāng)手指按壓屏幕,屏幕下的傳感器向手指按壓區(qū)域發(fā)射超聲波,當(dāng)超聲波接觸到指紋的嵴”和峪”時(shí),被吸收、穿透、反射的程度有差異,會(huì)產(chǎn)生不同能量的回波并被傳感器接收,從構(gòu)建出3D指紋圖像。榮耀300系列將搭載全新的雅顧光影寫真大師,基于AI光影寫真人像引擎,榮耀為用戶帶來(lái)雅顧生動(dòng)人像、質(zhì)感人像、經(jīng)典人像等多種人像風(fēng)格。

  • AI日?qǐng)?bào):微信公眾號(hào)支持AI配圖;阿里云通義萬(wàn)相全新圖像編輯模型ACE;快手可靈AI推「AI試衣」功能

    歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、微信公眾號(hào)可以AI配圖了:還支持調(diào)整風(fēng)格和比例微信公眾號(hào)最近推出了“AI配圖”新功能,旨在幫助內(nèi)容創(chuàng)作者更高效地選擇和插入圖片。公司在硅谷融資60億美元,并計(jì)劃繼續(xù)擴(kuò)展資金,以支持發(fā)展。

熱文

  • 3 天
  • 7天