11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享。快來騰訊云選購吧!
無需文字標(biāo)簽,完全自監(jiān)督的Meta視覺大模型來了!小扎親自官宣,發(fā)布即收獲大量關(guān)注度——在語義分割、實(shí)例分割、深度估計(jì)和圖像檢索等任務(wù)中,這個(gè)名叫DINOv2的視覺大模型均取得了非常不錯(cuò)的效果。甚至有超過當(dāng)前最好的開源視覺模型OpenCLIP之勢(shì)。官網(wǎng)上給出的圖片效果還是挺不錯(cuò)的,輸入鐵塔照片,可以生成不少含鐵塔的相似藝術(shù)圖片:這里我們也試了試,輸入一張華強(qiáng)買瓜,給出來的藝術(shù)圖片大多數(shù)與西瓜有關(guān):那么,這樣的自監(jiān)督視覺大模型可以用在哪里?從Meta給出的視頻來看,目前有一些比較環(huán)保的用途,例如用于估計(jì)全球各地的樹木高度:除此之外,如同扎克伯格所說,DINOv2還能被用于改善醫(yī)學(xué)成像、糧食作物生長等。