蘋(píng)果Vision Pro頭顯AI助手來(lái)了會(huì)調(diào)酒還會(huì)打麻將

2023-06-12 10:17 · 稿源：站長(zhǎng)之家

站長(zhǎng)之家（ChinaZ.com）6月12日消息:上周蘋(píng)果推出的Vision Pro頭戴顯示器引起了很多人的興趣。你能想象一下如果加上人工智能的話，會(huì)是什么樣的體驗(yàn)嗎?

最近，新加坡南洋理工大學(xué)和微軟雷蒙研究所推出了一個(gè)多模態(tài)的人工智能助手——Otter（水獺）。它能夠以視頻作為輸入，完成多模態(tài)的感知、推理和上下文學(xué)習(xí)，并經(jīng)過(guò)專門(mén)的指令遵守訓(xùn)練。

QQ截圖20230612101753.jpg

它不僅能夠教你打麻將、開(kāi)飛機(jī)，還能教你調(diào)酒。它能夠?qū)崟r(shí)識(shí)別現(xiàn)實(shí)場(chǎng)景并回答人類提問(wèn)，簡(jiǎn)直是一個(gè)全能型的選手。

Otter支持8種語(yǔ)言，包括中文。在訓(xùn)練過(guò)程中，團(tuán)隊(duì)使用了適用于增強(qiáng)現(xiàn)實(shí)頭戴顯示器的第一人稱視角視頻，明確表示這是為蘋(píng)果頭戴顯示器準(zhǔn)備的。有網(wǎng)友發(fā)現(xiàn)，在各種測(cè)試項(xiàng)目中，Otter的平均成績(jī)比傳統(tǒng)的MiniGPT-4、OpenFlamingo等傳統(tǒng)模型高出了十幾個(gè)百分點(diǎn)。

Otter使用視覺(jué)識(shí)別模塊來(lái)分析場(chǎng)景信息，并結(jié)合ChatGPT生成答案。其中，關(guān)鍵的視覺(jué)模塊是基于改良版的LLaVA進(jìn)行訓(xùn)練的。Otter的工作流程大概是這樣的:首先要對(duì)視覺(jué)信息進(jìn)行處理，并結(jié)合系統(tǒng)信息生成激勵(lì)。生成好的激勵(lì)會(huì)被傳遞給ChatGPT，得到指令-回應(yīng)數(shù)據(jù)。這些回應(yīng)數(shù)據(jù)再經(jīng)過(guò)一步篩選器的篩選，由ChatGPT將所選擇的語(yǔ)言進(jìn)行翻譯并輸出。此外，團(tuán)隊(duì)還引入了冷啟動(dòng)機(jī)制，用于發(fā)現(xiàn)可用于數(shù)據(jù)庫(kù)中的情景實(shí)例。

在線體驗(yàn):

https://otter.cliangyu.com/

論文地址:

https://arxiv.org/abs/2306.05425

GitHub頁(yè)面:

https://github.com/Luodian/Otter

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

蘋(píng)果Vision Pro計(jì)劃增加對(duì)PlayStation VR2 手部控制器的支持

根據(jù)彭博社馬克·古爾曼的最新報(bào)道，蘋(píng)果正在尋求通過(guò)增加對(duì)PlayStationVR控制器的支持，來(lái)吸引更多的游戲玩家和開(kāi)發(fā)者，以提升其VisionPro混合現(xiàn)實(shí)設(shè)備的市場(chǎng)吸引力。雖然VisionPro目前更多被視為生產(chǎn)力和媒體消費(fèi)工具非游戲設(shè)備，部分原因在于它依賴眼睛和手部控制非獨(dú)立控制器。通過(guò)這種方式，蘋(píng)果不僅能提升游戲控制的精度可能推動(dòng)更多軟件應(yīng)用，如FinalCutPro和AdobePhotoshop等，也能在VisionPro上順利運(yùn)行，為專業(yè)用戶提供更多功能。

?蘋(píng)果 ?Vision ?Pro
蘋(píng)果Vision Pro被傳停產(chǎn)：市場(chǎng)需求疲軟轉(zhuǎn)向研發(fā)新一代產(chǎn)品

有最新消息指出，蘋(píng)果公司的第一代VisionPro頭顯可能已經(jīng)停產(chǎn)。這一決策可能源于該設(shè)備市場(chǎng)需求疲軟以及早前有關(guān)生產(chǎn)削減的報(bào)道。預(yù)計(jì)這款新設(shè)備將在2025年秋季至2026年春季期間發(fā)布。

?蘋(píng)果 ?Vision ?Pro
于東來(lái)直播員工午休打麻將引圍觀：要讓員工每周工作36小時(shí)、月薪8千+

一個(gè)企業(yè)的老板，公開(kāi)直播手下員工打麻將，這是什么體驗(yàn)？昨天于東來(lái)個(gè)人賬號(hào)開(kāi)播，帶網(wǎng)友云逛胖東來(lái)辦公區(qū)域，看員工午休活動(dòng)：吃飯、睡覺(jué)、打牌?！敝坝跂|來(lái)曾發(fā)文表示，胖東來(lái)未來(lái)幾年要追求實(shí)現(xiàn)的目標(biāo)包括：每周工作時(shí)間36小時(shí)以內(nèi)、星期六閉店休息實(shí)現(xiàn)讓員工與家人一起享受周末的美好時(shí)光、每年40至60天的休假、員工最低月到手純收入保持在8000元以上。

?企業(yè)文化 ?職場(chǎng)休閑 ?管理創(chuàng)新
硅谷趨勢(shì)：智庫(kù)型VC Fusion Fund如何布局AI和深科技投資？

生成式AI浪潮席卷全球，然隨著AI落地深入，其開(kāi)發(fā)、部署成本、快速迭代所需精力及商業(yè)回報(bào)速度引人擔(dān)憂。“面對(duì)AI時(shí)代的挑戰(zhàn)，人們正在追求更高效的AI軟件及算法，以及更可持續(xù)的解決方案。FusionFund將繼續(xù)基于獨(dú)特的智庫(kù)型VC打法，在這些領(lǐng)域中尋找機(jī)會(huì)，推動(dòng)AI技術(shù)的不斷進(jìn)化，以及在更多行業(yè)商業(yè)化應(yīng)用。

?生成式AI ?AI基礎(chǔ)設(shè)施 ?硅谷投資
專業(yè)攝影新伴侶：雷克沙Professional Go PSSD，速度與安全并重

在當(dāng)今手機(jī)攝影日益普及的時(shí)代，一款高性能、便攜的存儲(chǔ)設(shè)備成為了眾多攝影愛(ài)好者的必備之選。雷克沙推出的ProfessionalGoPSSD，正是為了滿足這一需求設(shè)計(jì)的。它不僅能夠幫助用戶快速高效地處理大量照片和視頻能為用戶的數(shù)據(jù)安全提供有力保障。

?手機(jī)攝影 ?固態(tài)硬盤(pán) ?存儲(chǔ)設(shè)備
最美白色手機(jī)！紅魔10 Pro白晝武士來(lái)了：業(yè)內(nèi)唯一前后純平

紅魔官方今天宣布，紅魔10Pro系列白晝武士正式開(kāi)啟預(yù)約，將于12月12日上午10點(diǎn)進(jìn)行全款預(yù)售，定價(jià)4999元起。這是目前行業(yè)最完美的白色手機(jī)，業(yè)內(nèi)唯一的前后純平旗艦，不僅采用了直屏直邊，背部也是純平方案，攝像頭沒(méi)有任何凸起。搭載牛魔王電池”，紅魔10Pro電池容量7050mAh，支持120W快充，紅魔10Pro電池容量6500mAh，支持80W快充。

?紅魔10Pro ?白晝武士 ?無(wú)孔顯示
AI國(guó)補(bǔ)雙助力，百吋電視迎來(lái)井噴式發(fā)展，海信E8N Pro成爆款

人工智能AI有多火？自2022年以來(lái)，在生成式人工智能和大語(yǔ)言模型領(lǐng)域取得了重大進(jìn)展，掀起了全球范圍內(nèi)的AI熱潮。無(wú)論是從銷量占比還是技術(shù)實(shí)力來(lái)看，海信電視都展現(xiàn)出了強(qiáng)大的市場(chǎng)競(jìng)爭(zhēng)力。

?人工智能 ?生成式AI ?大語(yǔ)言模型
薦AI日?qǐng)?bào)：OpenAI重磅上線Sora；智譜AI免費(fèi)多模態(tài)模型GLM-4V-Flash；騰訊云打造AI代碼助手

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI正式上線Sora，ChatGPTPro用戶可無(wú)限生成、最長(zhǎng)20秒OpenAI在"ship-mas"系列活動(dòng)中發(fā)布了SoraTurbo視頻生成AI，支持生成20秒1080p視頻，用戶可通過(guò)文本、圖片或視頻進(jìn)行創(chuàng)作，具有多種風(fēng)格和剪輯功能。See3D已開(kāi)源，支持多種3D創(chuàng)作應(yīng)用。
蘋(píng)果史上變化最大的一代！iPhone 17 Pro系列將迎來(lái)6大升級(jí)

明年對(duì)于iPhone來(lái)說(shuō)是極為重要的一年，明年上半年蘋(píng)果將推出iPhoneSE4，下半年推出iPhone17系列。這次iPhone17系列砍掉了Plus機(jī)型，新增了Air，組成了iPhone17、iPhone17Air、iPhone17Pro和iPhone17ProMax全新的產(chǎn)品矩陣。iPhone17系列發(fā)布會(huì)大概率會(huì)在2025年9月舉行，從爆料來(lái)看，iPhone17系列無(wú)論是外觀設(shè)計(jì)、性能還是相機(jī)，都有明顯進(jìn)步，值得期待。

?iPhone ?SE ?4
iPhone 18 Pro將首發(fā)蘋(píng)果第二代5G基帶：替代高通

業(yè)內(nèi)人士MarkGurman爆料，蘋(píng)果首款自研5G基帶芯片將應(yīng)用到iPhoneSE4、iPhone17Air和低端iPad設(shè)備上。蘋(píng)果首款自研5G基帶代號(hào)為Sinope，為了能夠打造出替代高通的5G解決方案，蘋(píng)果公司投入了數(shù)十億美元，在全球各地建立了測(cè)試和工程實(shí)驗(yàn)室斥資約10億美元收購(gòu)了英特爾的一個(gè)部門(mén)。隨著蘋(píng)果自研5G基帶芯片的逐步應(yīng)用，業(yè)界普遍認(rèn)為，這將有助于蘋(píng)果解決長(zhǎng)期以來(lái)被高通卡脖子的問(wèn)題

?蘋(píng)果自研5G基帶 ?iPhone ?SE

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

蘋(píng)果Vision Pro頭顯AI助手來(lái)了會(huì)調(diào)酒還會(huì)打麻將

蘋(píng)果Vision Pro計(jì)劃增加對(duì)PlayStation VR2 手部控制器的支持

蘋(píng)果Vision Pro被傳停產(chǎn)：市場(chǎng)需求疲軟轉(zhuǎn)向研發(fā)新一代產(chǎn)品

于東來(lái)直播員工午休打麻將引圍觀：要讓員工每周工作36小時(shí)、月薪8千+

硅谷趨勢(shì)：智庫(kù)型VC Fusion Fund如何布局AI和深科技投資？

專業(yè)攝影新伴侶：雷克沙Professional Go PSSD，速度與安全并重

最美白色手機(jī)！紅魔10 Pro白晝武士來(lái)了：業(yè)內(nèi)唯一前后純平

AI國(guó)補(bǔ)雙助力，百吋電視迎來(lái)井噴式發(fā)展，海信E8N Pro成爆款

薦AI日?qǐng)?bào)：OpenAI重磅上線Sora；智譜AI免費(fèi)多模態(tài)模型GLM-4V-Flash；騰訊云打造AI代碼助手

蘋(píng)果史上變化最大的一代！iPhone 17 Pro系列將迎來(lái)6大升級(jí)

iPhone 18 Pro將首發(fā)蘋(píng)果第二代5G基帶：替代高通

熱文

雷軍辟謠只招聘35歲以下員工：僅針對(duì)未來(lái)之星項(xiàng)目

雷軍曬健身房照片：此前設(shè)定100次健身打卡目標(biāo)

阿里巴巴AI“生意管家”: 400萬(wàn)商家的秘密武器

蘋(píng)果市值一夜蒸發(fā)7248億此前官網(wǎng)已開(kāi)啟降價(jià)活動(dòng)

董明珠曾喊話雷軍給股民分多少錢！格力：擬分紅超55億

蘋(píng)果官網(wǎng)突然降價(jià) 客服回應(yīng)能否退差價(jià)

俞敏洪稱東方甄選是火藥桶：未來(lái)一定會(huì)更加美好

張朝陽(yáng)說(shuō)量子力學(xué)不是玄學(xué)：是一門(mén)嚴(yán)謹(jǐn)?shù)奈锢韺W(xué)科

盧偉冰加入小米6周年：未來(lái) 風(fēng)景無(wú)限美好

法拉第未來(lái)股價(jià)一夜暴漲超50% 第二品牌FX原型車即將亮相

曝雷軍挖了個(gè)95后天才少女“AI小蘿莉”：開(kāi)出千萬(wàn)年薪惡補(bǔ)大模

京東科技宣布落實(shí)20薪：計(jì)劃到2025年實(shí)現(xiàn)

AI 的暗面：永遠(yuǎn)不要對(duì)人工智能聊天機(jī)器人說(shuō)的 10 件事

雷軍辟謠只招聘35歲以下員工：僅針對(duì)未來(lái)之星項(xiàng)目

雷軍感謝網(wǎng)友祝他年入百萬(wàn)：愿大家夢(mèng)想成真今晚8點(diǎn)跨年直播

免費(fèi)寫(xiě)真人人都能用！騰訊元寶AI跨年美照上線：大片一鍵生成

雷軍曬健身房照片：此前設(shè)定100次健身打卡目標(biāo)

AI教父辛頓發(fā)聲：30年內(nèi)AI致人類滅亡幾率達(dá)10%-20%

出圈就好！盤(pán)點(diǎn)2024年國(guó)內(nèi)AI大模型產(chǎn)品的那些破圈姿勢(shì)

阿里巴巴AI“生意管家”: 400萬(wàn)商家的秘密武器

站長(zhǎng)商機(jī)

蘋(píng)果Vision Pro頭顯AI助手來(lái)了 會(huì)調(diào)酒還會(huì)打麻將

熱文

站長(zhǎng)商機(jī)

蘋(píng)果Vision Pro頭顯AI助手來(lái)了會(huì)調(diào)酒還會(huì)打麻將