11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享。快來騰訊云選購吧!
蘋果開源了一種新的技術(shù),名為多模態(tài)大語言模型引導(dǎo)的編輯,這項技術(shù)能夠幫助用戶通過自然語言指令來修改圖片,使得編輯圖片更加簡單和自然。MGIE采用多模態(tài)大型語言模型進行圖像編輯指令的生成,通過端到端訓(xùn)練,模型不僅捕捉視覺想象力執(zhí)行圖像處理操作。在實現(xiàn)更加直觀和自由的圖像編輯過程中,這一方法有望為未來的計算機視覺和圖像處理研究提供新的思路。