11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵?lái)騰訊云選購(gòu)吧!
無(wú)需文字標(biāo)簽,完全自監(jiān)督的Meta視覺(jué)大模型來(lái)了!小扎親自官宣,發(fā)布即收獲大量關(guān)注度——在語(yǔ)義分割、實(shí)例分割、深度估計(jì)和圖像檢索等任務(wù)中,這個(gè)名叫DINOv2的視覺(jué)大模型均取得了非常不錯(cuò)的效果。甚至有超過(guò)當(dāng)前最好的開(kāi)源視覺(jué)模型OpenCLIP之勢(shì)。官網(wǎng)上給出的圖片效果還是挺不錯(cuò)的,輸入鐵塔照片,可以生成不少含鐵塔的相似藝術(shù)圖片:這里我們也試了試,輸入一張華強(qiáng)買瓜,給出來(lái)的藝術(shù)圖片大多數(shù)與西瓜有關(guān):那么,這樣的自監(jiān)督視覺(jué)大模型可以用在哪里?從Meta給出的視頻來(lái)看,目前有一些比較環(huán)保的用途,例如用于估計(jì)全球各地的樹(shù)木高度:除此之外,如同扎克伯格所說(shuō),DINOv2還能被用于改善醫(yī)學(xué)成像、糧食作物生長(zhǎng)等。