幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關(guān)鍵詞  > Mobile-Agent-v2最新資訊  > 正文

Mobile-Agent-v2:讓AI學(xué)會自動刷手機(jī)

2024-06-06 11:42 · 稿源:站長之家

站長之家(ChinaZ.com)6月6日 消息:Mobile-Agent-v2是一個先進(jìn)的AI系統(tǒng),旨在通過自動化操作和視覺感知技術(shù),實(shí)現(xiàn)對移動設(shè)備的全面控制。這一系統(tǒng)能夠模擬真人的各種交互行為,如點(diǎn)擊、滑動和輸入等,從而自動化地完成一系列復(fù)雜的任務(wù)。

image.png

以下是Mobile-Agent-v2能夠?qū)崿F(xiàn)的一些關(guān)鍵功能示例:

  • 搜索和購買商品:AI可以在購物應(yīng)用中自動搜索特定商品,將其添加到購物車,并執(zhí)行購買操作。

  • 郵件發(fā)送:在Gmail等郵件應(yīng)用中,AI能夠自動填寫郵件內(nèi)容并發(fā)送。

  • 導(dǎo)航:AI可以在Google Maps等導(dǎo)航應(yīng)用中自動進(jìn)行路線規(guī)劃和導(dǎo)航設(shè)置。

  • 視頻觀看:在YouTube等視頻平臺上,AI能夠自動搜索視頻并執(zhí)行評論等互動操作。

與之前的Mobile-Agent相比,Mobile-Agent-v2引入了創(chuàng)新的多代理協(xié)作架構(gòu)。這種架構(gòu)允許多個AI代理協(xié)同工作,以實(shí)現(xiàn)更加高效的任務(wù)規(guī)劃和執(zhí)行。這種協(xié)作機(jī)制不僅提升了任務(wù)處理的靈活性,還顯著提高了任務(wù)完成的效率。

實(shí)驗(yàn)結(jié)果顯示,Mobile-Agent-v2在任務(wù)完成率方面相較于單代理架構(gòu)的Mobile-Agent有了顯著提升,提高了30%以上。這一進(jìn)步表明,多代理協(xié)作的方法在自動化任務(wù)執(zhí)行方面具有明顯優(yōu)勢,能夠?yàn)橛脩魩砀啾憷?,同時也為AI在移動設(shè)備自動化領(lǐng)域的應(yīng)用開辟了新的可能性。

論文地址:https://arxiv.org/pdf/2406.01014

舉報(bào)

  • 相關(guān)推薦
  • AI Agent再迎一巨頭!谷歌重磅發(fā)力AI Agent ,商用大爆發(fā)!

    上周微軟在“Microsoftignite2024”大會上發(fā)布10多個商用AIAgent后,科技巨頭谷歌也宣布全力推廣商用AIAgent,發(fā)布一系列激勵活動和產(chǎn)品。谷歌云將提供從AIAgent的開發(fā)、部署到應(yīng)用一站式商用生態(tài)。微軟、谷歌、百度、SAP、Salesforce等巨頭都在積極推廣,加上OpenAI即將推出的全新AIAgent產(chǎn)品“Operator”,2025年將成為AIAgent商用爆發(fā)年。

  • 清華、面壁提出創(chuàng)新AI Agent交互:能主動思考、預(yù)測需求

    哪怕是ChatGPT等最先進(jìn)的AIAgent都是傳統(tǒng)的被動式Agent,即需要用戶通過明確的指令顯式告訴Agent應(yīng)該做什么,Agent才能繼續(xù)執(zhí)行接下來的任務(wù)。近期清華大學(xué)聯(lián)合面壁智能團(tuán)隊(duì)提出了開創(chuàng)性的新一代主動Agent交互范式,為AI交互帶來了突破性的解決方案。隨著技術(shù)的不斷進(jìn)步,我們可以期待看到更自然的人機(jī)協(xié)作模式,更智能的場景適應(yīng)能力,以及更深度的個性化服務(wù)。

  • 谷歌發(fā)布雙思維AI Agent:像人類一樣思考,重大技術(shù)突破!

    今年10月,OpenAI高級研究科學(xué)家、德?lián)銩I之父NoamBrown,曾在美國舊金山舉辦的TEDAI大會上提出了一個驚人的理論——讓AI模型思考20秒所帶來的性能提升,相當(dāng)于將模型擴(kuò)大100,000倍并訓(xùn)練100,000倍的時間。Noam所指的技術(shù)便是System1/2thinking,也是OpenAI最新模型o1正在使用的技術(shù)。這種分工執(zhí)行使得AIAgent能夠同時處理快速的對話和復(fù)雜的規(guī)劃,極大提高了用戶體驗(yàn)。

  • ChatGPT重磅功能!支持AI Agent玩法,OpenAI加入智能體了

    今天凌晨2點(diǎn),OpenAI開啟了第11天的直播技術(shù)分享,對ChatGPT的應(yīng)用程序進(jìn)行了重磅升級,支持原生應(yīng)用程序自動化協(xié)作功能。從OpenAI在直播中演示的案例來看,基本上與AIAgent功能差不多,尤其是在編程方面非常好。ChatGPT的協(xié)作功能已經(jīng)在Mac應(yīng)用程序中可以使用了,通過OptionSpace就能快速調(diào)用這個功能,并且占用的內(nèi)存非常小,是一個不錯的自動化協(xié)作助手。

  • 史上最貴!首個AI Agent程序員商業(yè)化,比ChatGPT Pro貴2

    今天凌晨1點(diǎn),全球首個AIAgent程序員Devin宣布全面開放使用,實(shí)現(xiàn)商業(yè)化。只是價格不是一般的貴,前幾天OpenAI發(fā)布的ChatGPTPro可以無限使用滿血o1、新版本Sora等功能,一個月才200美元。因?yàn)樗菦]有任何用戶數(shù)量限制的,無論多少人都能無限制的使用Devin。

  • 全球首個AI Agent程序員全面開放!3600元/月

    全球首個AIAgent程序員Devin今日宣布全面開放使用實(shí)現(xiàn)商業(yè)化,從最初的展示到全面使用不到一年時間。不過Devin的月費(fèi)高達(dá)500美元,成為目前市場上最貴的生成式AI產(chǎn)品之一。值得一提的是,對于一個公司言,Devin是沒有任何用戶數(shù)量限制的,無論多少人都能無限制的使用。

  • 谷歌“狙擊”O(jiān)penAI,發(fā)布新一代大模型,主打Agent+多模態(tài)

    繼量子芯片之后,谷歌又來搶“OpenAI雙12直播”的流量了!就在剛剛,谷歌新一代大模型Gemini2.0突然登場,再次由谷歌CEO皮猜親自官宣。新一代模型專為AIAgent打造,谷歌表示目前已經(jīng)將2.0版本提供給了一些開發(fā)者內(nèi)測,正在迅速將其集成在Gemini和搜索等產(chǎn)品線中。從OpenAI跳槽到谷歌的LoganKilpatrick表示,他們在GoogleAIStudio中創(chuàng)建了一個全新體驗(yàn),展示了Gemini2.0視頻理解、原生工具?

  • 輕量化MobileMamba視覺模型來了|浙大/騰訊優(yōu)圖/華中科大聯(lián)合出品

    浙大、騰訊優(yōu)圖、華中科技大學(xué)的團(tuán)隊(duì),提出輕量化MobileMamba!既良好地平衡了效率與效果,推理速度遠(yuǎn)超現(xiàn)有基于Mamba的模型。輕量化模型研究的主陣地都在CNN和Transformer的設(shè)計(jì)。MobileMamba通過在不同F(xiàn)LOPs大小的模型上采用訓(xùn)練和測試策略,顯著提升了性能和效率。

  • Google全新發(fā)布AI視頻Veo2、AI繪圖Imagen3 - 何以凌越。

    OpenAI的垃圾直播沒任何看頭,就發(fā)了個個性化的AI搜索。Google沒有預(yù)告、沒有營銷,默默的在X上發(fā)了兩個大貨。

  • 最強(qiáng)驍龍8 Gen3手機(jī)!一加Ace 5即將登場

    一加13R現(xiàn)身Geekbench跑分網(wǎng)站,該機(jī)型號是CPH2645,對應(yīng)的國行版機(jī)型是一加Ace5。一加Ace5搭載高通驍龍8Gen3處理器,單核成績是2221,多核成績是6615,配備12GB內(nèi)存。一加把驍龍8Gen3調(diào)出了驍龍8至尊版的水平,性能領(lǐng)先同檔位一個代際。

熱文

  • 3 天
  • 7天