站長之家(ChinaZ.com)6月6日 消息:Mobile-Agent-v2是一個先進(jìn)的AI系統(tǒng),旨在通過自動化操作和視覺感知技術(shù),實(shí)現(xiàn)對移動設(shè)備的全面控制。這一系統(tǒng)能夠模擬真人的各種交互行為,如點(diǎn)擊、滑動和輸入等,從而自動化地完成一系列復(fù)雜的任務(wù)。
以下是Mobile-Agent-v2能夠?qū)崿F(xiàn)的一些關(guān)鍵功能示例:
搜索和購買商品:AI可以在購物應(yīng)用中自動搜索特定商品,將其添加到購物車,并執(zhí)行購買操作。
郵件發(fā)送:在Gmail等郵件應(yīng)用中,AI能夠自動填寫郵件內(nèi)容并發(fā)送。
導(dǎo)航:AI可以在Google Maps等導(dǎo)航應(yīng)用中自動進(jìn)行路線規(guī)劃和導(dǎo)航設(shè)置。
視頻觀看:在YouTube等視頻平臺上,AI能夠自動搜索視頻并執(zhí)行評論等互動操作。
與之前的Mobile-Agent相比,Mobile-Agent-v2引入了創(chuàng)新的多代理協(xié)作架構(gòu)。這種架構(gòu)允許多個AI代理協(xié)同工作,以實(shí)現(xiàn)更加高效的任務(wù)規(guī)劃和執(zhí)行。這種協(xié)作機(jī)制不僅提升了任務(wù)處理的靈活性,還顯著提高了任務(wù)完成的效率。
實(shí)驗(yàn)結(jié)果顯示,Mobile-Agent-v2在任務(wù)完成率方面相較于單代理架構(gòu)的Mobile-Agent有了顯著提升,提高了30%以上。這一進(jìn)步表明,多代理協(xié)作的方法在自動化任務(wù)執(zhí)行方面具有明顯優(yōu)勢,能夠?yàn)橛脩魩砀啾憷?,同時也為AI在移動設(shè)備自動化領(lǐng)域的應(yīng)用開辟了新的可能性。
論文地址:https://arxiv.org/pdf/2406.01014
(舉報(bào))