11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
盡管蘋果在生成式AI熱潮開始后并未推出任何AI模型,但近期公司正在著手一些AI項目。蘋果研究人員分享了一篇揭示公司正在研發(fā)的新語言模型的論文,內(nèi)部消息稱蘋果正在研發(fā)兩款A(yù)I驅(qū)動的機器人。由于模型對用戶應(yīng)用屏幕的全面理解以及執(zhí)行某些任務(wù)的知識,F(xiàn)erret-UI可以用于強化Siri,讓其為用戶執(zhí)行任務(wù)。
蘋果公司近日發(fā)布了一款名為MLLLLMFerret-UI的新型機器學(xué)習(xí)語言模型,旨在提升對移動應(yīng)用用戶界面的理解。這款模型經(jīng)過特別優(yōu)化,能夠處理移動UI屏幕上的各種任務(wù),并具備指向、定位和推理等能力。Ferret-UI還能夠通過功能推斷來解釋屏幕的整體目的,顯示出在理解和生成自然語言指令方面的高級能力。
Ferret-UI是一個新的MLLLM,專門為提高對移動UI屏幕的理解設(shè)計。具備引用、定位和推理能力,處理UI屏幕上的任務(wù)。點擊前往Ferret-UI官網(wǎng)體驗入口需求人群:適用于移動UI屏幕的理解和操作,提高對UI元素的識別精度。
蘋果公司與康奈爾大學(xué)的研究人員于10月份悄然推出了一款名為「Ferret」的開源多模態(tài)大型語言模型。這一研究成果首次在Github上發(fā)布,但并未引起太多關(guān)注,沒有進(jìn)行任何宣布或慶祝。考慮到蘋果與NvidiaGPU采用的歷史,這被視為對GPU制造商的罕見認(rèn)可。
研究人員在最新的一項研究中介紹了Ferret,這是一款多模式語言模型,旨在實現(xiàn)高級圖像理解和描述。該研究聚焦于視覺-語言學(xué)習(xí)中的關(guān)鍵問題,即如何融合地理信息和語義知識,以便模型能夠同時引用和定位圖像中的元素。這一研究為多模式語言模型領(lǐng)域帶來了突破性進(jìn)展,為圖像理解和描述提供了新的可能性。
FerretAI是一款旨在幫助用戶在進(jìn)入商業(yè)協(xié)議之前獲取網(wǎng)絡(luò)背景信息的AI工具。這個工具自動監(jiān)控各種信息來源,包括報紙檔案、法律記錄和公司所有權(quán)記錄,以審查潛在的客戶、投資者和商業(yè)伙伴。盡管該工具當(dāng)前收集的所有數(shù)據(jù)都是公開可獲得的,但仍會引發(fā)潛在的隱私擔(dān)憂。
蘋果AI/ML團隊與哥倫比亞大學(xué)合作研發(fā)的多模態(tài)大模型“雪貂”已經(jīng)成功突破了谷歌人機驗證碼的難題,能夠輕松識別圖像中的交通信號燈并準(zhǔn)確圈出其位置,其性能直逼GPT-4V。Ferret的關(guān)鍵在于改進(jìn)了大模型在“看說答”任務(wù)中的精確度,這得益于其出色的圖文關(guān)聯(lián)能力。通過這一研究,F(xiàn)erret為解決圖像理解和多模態(tài)任務(wù)提供了新的方向,有望在人機交互、智能搜索等領(lǐng)域取得