劃重點(diǎn):
? 谷歌發(fā)布全新時(shí)間感知框架 MUSCATEL,提升圖像識(shí)別準(zhǔn)確率15%
? 概念漂移問(wèn)題長(zhǎng)期困擾機(jī)器學(xué)習(xí)領(lǐng)域,新方法助力模型適應(yīng)易變世界
? MUSCATEL 方法結(jié)合離線學(xué)習(xí)與持續(xù)學(xué)習(xí)優(yōu)勢(shì),優(yōu)化模型在未來(lái)數(shù)據(jù)中的表現(xiàn)
站長(zhǎng)之家(ChinaZ.com)3月1日 消息:谷歌 AI 團(tuán)隊(duì)最近發(fā)布了一項(xiàng)名為 MUSCATEL 的全新時(shí)間感知框架,旨在對(duì)抗概念漂移問(wèn)題,提升圖像識(shí)別準(zhǔn)確率。概念漂移一直是機(jī)器學(xué)習(xí)領(lǐng)域的難題,即數(shù)據(jù)分布隨時(shí)間變化,影響模型持續(xù)有效性。MUSCATEL 方法通過(guò)結(jié)合離線學(xué)習(xí)和持續(xù)學(xué)習(xí)的優(yōu)勢(shì),成功優(yōu)化模型在大型、動(dòng)態(tài)數(shù)據(jù)集中的表現(xiàn)。
傳統(tǒng)對(duì)抗概念漂移的方法主要是在線學(xué)習(xí)和持續(xù)學(xué)習(xí),但這些方法存在著忽略過(guò)去數(shù)據(jù)有價(jià)值信息和假設(shè)數(shù)據(jù)實(shí)例貢獻(xiàn)均勻衰減的問(wèn)題。MUSCATEL 方法則引入了一個(gè)輔助模型,利用實(shí)例的重要性分配分?jǐn)?shù)來(lái)優(yōu)化模型在未來(lái)實(shí)例中的表現(xiàn),解決了這些核心難題。
研究人員在大型真實(shí)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),涵蓋3900萬(wàn)張照片持續(xù)9年,結(jié)果顯示,相較于其他穩(wěn)態(tài)學(xué)習(xí)基線方法,MUSCATEL 方法的準(zhǔn)確率提升了15%。此外,在兩個(gè)非穩(wěn)態(tài)學(xué)習(xí)數(shù)據(jù)集及持續(xù)學(xué)習(xí)環(huán)境中,MUSCATEL 方法也展現(xiàn)出優(yōu)于目前最優(yōu)方法的效果。
通過(guò)照片分類(lèi)任務(wù)的比較,研究人員發(fā)現(xiàn),概念漂移對(duì)有監(jiān)督學(xué)習(xí)構(gòu)成挑戰(zhàn),需要持續(xù)更新模型以適應(yīng)數(shù)據(jù)變化。MUSCATEL 方法成功地結(jié)合了離線訓(xùn)練和持續(xù)訓(xùn)練的優(yōu)勢(shì),為模型未來(lái)的表現(xiàn)提供了堅(jiān)實(shí)基礎(chǔ)。
谷歌發(fā)布的 MUSCATEL 方法為機(jī)器學(xué)習(xí)領(lǐng)域的概念漂移問(wèn)題提供了一種創(chuàng)新的解決方案,為模型在大規(guī)模、動(dòng)態(tài)數(shù)據(jù)集中持續(xù)準(zhǔn)確地進(jìn)行分類(lèi)提供了新的思路和方法。
論文地址:https://arxiv.org/abs/2212.05908
(舉報(bào))