11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
南京大學(xué)和騰訊的研究人員開發(fā)了一種名為StableDrag的新型基于AI的圖像編輯方法,允許元素輕松移動到新位置,并保持正確的透視,根據(jù)他們的論文。該方法基于近期AI圖像編輯的進(jìn)展,如FreeDrag、DragDiffusion和Drag-GAN,并在基準(zhǔn)測試中取得了顯著更好的結(jié)果。蘋果正在采用不同的操縱方法,MGIE使用文本提示添加、刪除或更改對象無需選擇特定區(qū)域。
去年5月,動動鼠標(biāo)就能讓圖片變「活」得研究DragGAN吸引了AI圈的關(guān)注。我們可以改變并合成自己想要的圖像,比如下圖中讓一頭獅子轉(zhuǎn)頭并張嘴。更多技術(shù)細(xì)節(jié)和實驗結(jié)果請參閱原論文。
StableDrag是一種基于點(diǎn)的圖像編輯框架,專門解決現(xiàn)有拖拽方法存在的不準(zhǔn)確點(diǎn)跟蹤和運(yùn)動監(jiān)督不完整的問題。該工具設(shè)計了一種判別式點(diǎn)跟蹤方法和基于置信度的潛在增強(qiáng)策略,以提高長距離操作的穩(wěn)定性,并確保編輯過程中優(yōu)化的潛在表示質(zhì)量。StableDrag的產(chǎn)品特色判別式點(diǎn)跟蹤方法,精確定位更新點(diǎn)位置基于置信度的潛在增強(qiáng)策略,優(yōu)化潛在表示質(zhì)量實例化兩種模型:Stable
還記得DragGAN嗎?這是一種可以拖動錨點(diǎn)進(jìn)行圖像編輯的技術(shù),但當(dāng)時代碼發(fā)布后,由于生成速度慢,且不能自定義外部圖片,逐漸被人們淡忘。一種新的技術(shù)StableDrag出現(xiàn)了,它是基于Diffusion模型的,也能完成類似的拖動錨點(diǎn)編輯圖片的功能。通過在DragBench上進(jìn)行廣泛的定性實驗和定量評估,證明了這兩種模型能夠?qū)崿F(xiàn)更穩(wěn)定的拖動性能。