多模態(tài)AI

近日，蘋果公司推出了300億參數(shù)的多模態(tài)AI大模型MM1.5，該版本是在前代MM1的架構(gòu)基礎(chǔ)上發(fā)展來的。該模型繼續(xù)遵循數(shù)據(jù)驅(qū)動的訓(xùn)練原則，著重探究在不同訓(xùn)練周期中混合各類數(shù)據(jù)對模型性能產(chǎn)生的影響，相關(guān)模型文檔已在HuggingFace上發(fā)布。盡管MM1.5模型在多項(xiàng)基準(zhǔn)測試中表現(xiàn)優(yōu)異，但蘋果團(tuán)隊(duì)仍計(jì)劃通過進(jìn)一步融合文本、圖像和用戶交互數(shù)據(jù)，并設(shè)計(jì)更復(fù)雜的架構(gòu)，來提升模型對移動設(shè)備UI的理解能力，從讓蘋果牌”AI更強(qiáng)大。...

特別聲明：本頁面標(biāo)簽名稱與頁面內(nèi)容，系網(wǎng)站系統(tǒng)為資訊內(nèi)容分類自動生成，僅提供資訊內(nèi)容索引使用，旨在方便用戶索引相關(guān)資訊報道。如標(biāo)簽名稱涉及商標(biāo)信息，請?jiān)L問商標(biāo)品牌官方了解詳情，請勿以本站標(biāo)簽頁面內(nèi)容為參考信息，本站與可能出現(xiàn)的商標(biāo)名稱信息不存在任何關(guān)聯(lián)關(guān)系，對本頁面內(nèi)容所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。任何單位或個人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時，可及時向站長之家提出書面權(quán)利通知或不實(shí)情況說明，并提權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明（點(diǎn)擊查看反饋聯(lián)系地址）。本網(wǎng)站在收到上述反饋文件后，將會依法依規(guī)核實(shí)信息，第一時間溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

與“多模態(tài)AI”的相關(guān)熱搜詞：

相關(guān)“多模態(tài)AI” 的資訊300篇

【騰訊云】11.11云上盛惠！云服務(wù)器首年1.8折起，買1年送3個月！

11.11云上盛惠！海量產(chǎn)品 · 輕松上云！云服務(wù)器首年1.8折起，買1年送3個月！超值優(yōu)惠，性能穩(wěn)定，讓您的云端之旅更加暢享。快來騰訊云選購吧！

Docker容器鏡像
去看看

Docker容器鏡像 60元/15天

爆款產(chǎn)品組合購
去看看

爆款產(chǎn)品組合購低至1元

騰訊云x NVIDIA加速計(jì)劃
去看看

騰訊云x NVIDIA加速計(jì)劃最高獲贈10萬元扶持基金

2核2G云服務(wù)器
去看看

2核2G云服務(wù)器 112元/1年

查看更多相關(guān)信息>>

騰訊云 12-20

廣告
蘋果推出300億參數(shù)多模態(tài)AI大模型MM1.5：擁有圖像識別、自然語言推理能力

近日，蘋果公司推出了300億參數(shù)的多模態(tài)AI大模型MM1.5，該版本是在前代MM1的架構(gòu)基礎(chǔ)上發(fā)展來的。該模型繼續(xù)遵循數(shù)據(jù)驅(qū)動的訓(xùn)練原則，著重探究在不同訓(xùn)練周期中混合各類數(shù)據(jù)對模型性能產(chǎn)生的影響，相關(guān)模型文檔已在HuggingFace上發(fā)布。盡管MM1.5模型在多項(xiàng)基準(zhǔn)測試中表現(xiàn)優(yōu)異，但蘋果團(tuán)隊(duì)仍計(jì)劃通過進(jìn)一步融合文本、圖像和用戶交互數(shù)據(jù)，并設(shè)計(jì)更復(fù)雜的架構(gòu)，來提升模型對移動設(shè)備UI的理解能力，從讓蘋果牌”AI更強(qiáng)大。

蘋果多模態(tài)AI MM1.5
薦具身智能機(jī)器人隱藏冠軍上新：領(lǐng)狗進(jìn)家門，多模態(tài)AI那種

具身智能領(lǐng)域的“癲”，已經(jīng)進(jìn)入nextlevel了!來看這段視頻:人形機(jī)器人在前面跑，一群機(jī)器狗在后面追;然后人追著狗，接著狗追著人……最后那位機(jī)器人還有很重的「偷感」在身上。這樣它就真的很真狗啊!第二點(diǎn)是BabyAlphaA2擁有SuperChat功能。機(jī)器人對人類的價值，從來不只是“科幻”和冷冰冰的硬件已。

機(jī)器人
聲網(wǎng)對話式AI解決方案上新構(gòu)建實(shí)時多模態(tài)AI交互

在生成式人工智能領(lǐng)域，大模型多模態(tài)交互能力的升級正掀起一股新的AI浪潮，在RTC能力的加持下，人與AI的交互不再局限于文字，也可以通過語音通話進(jìn)行生動、流暢的低延時交互，這也成為當(dāng)下國內(nèi)外大模型廠商新的發(fā)力點(diǎn)。今年5月，GPT-4o的發(fā)布開創(chuàng)了AI實(shí)時語音交互的先河。聲網(wǎng)的實(shí)時多模態(tài)對話式AI解決方案目前已經(jīng)上線，如您想進(jìn)一步體驗(yàn)我們的Demo或者接入該方案，可在聲網(wǎng)公眾號找到這篇文章，掃描文章底部的二維碼聯(lián)系我們。

生成式人工智能大模型多模態(tài)交互
薦語言圖像模型大一統(tǒng)！Meta將Transformer和Diffusion融合，多模態(tài)AI王者登場

【新智元導(dǎo)讀】就在剛剛，Meta最新發(fā)布的Transfusion，能夠訓(xùn)練生成文本和圖像的統(tǒng)一模型了!完美融合Transformer和擴(kuò)散領(lǐng)域之后，語言模型和圖像大一統(tǒng)，又近了一步。真正的多模態(tài)AI模型，可能很快就要來了!Transformer和Diffusion，終于有了一次出色的融合。他在卡耐基梅隆大學(xué)語言技術(shù)研究所獲得博士學(xué)位，師從EduardHovy教授，并在上海交通大學(xué)獲得了計(jì)算機(jī)科學(xué)碩士和學(xué)士學(xué)位?

Transformer Diffusion Meta
斯坦福團(tuán)隊(duì)發(fā)布全球首個超小型多模態(tài)AI代理模型Octopus V3，函數(shù)調(diào)用準(zhǔn)確度媲美GPT-4

斯坦福大學(xué)的NEXAAI團(tuán)隊(duì)宣布推出全球首個多模態(tài)AI代理模型OctopusV3，讓AI代理更加智能、快速、能耗及成本降低。今年四月份初，NEXAAI推出了備受矚目的OctopusV2，該模型在函數(shù)調(diào)用性能上超越了GPT-4，減少了95%的推理時所需的文本量，為端側(cè)AI應(yīng)用帶來了新的可能性。NEXAAI的創(chuàng)始團(tuán)隊(duì)表示，他們將繼續(xù)致力于推動端側(cè)AI技術(shù)的發(fā)展，通過開源模型提升其創(chuàng)新技術(shù)的影響力，為用戶創(chuàng)造更智能、高效的未來生活。

NEXA AI Octopus
李未可科技正式推出WAKE-AI多模態(tài)AI大模型

4月18日，2024中國生成式AI大會上李未可科技正式發(fā)布為眼鏡等未來終端定向優(yōu)化等自研WAKE-AI多模態(tài)大模型，具備文本生成、語言理解、圖像識別及視頻生成等多模態(tài)交互能力。該大模型圍繞GPS軌跡視覺語音打造新一代LLM-Based的自然交互，同時多模態(tài)問答技術(shù)的加持，能實(shí)現(xiàn)所見即所問、所問即所得的精準(zhǔn)服務(wù)。李未可科技合伙人&AI負(fù)責(zé)人古鑒表示W(wǎng)AKE-AI將逐步開放平臺能力，便于更多企業(yè)及開發(fā)者調(diào)用WAKE-AI能力，共建AI硬件生態(tài)。
Grok-1.5 Vision Preview官網(wǎng)體驗(yàn)入口 X.AI多模態(tài)AI模型詳細(xì)介紹

Grok-1.5VisionPreview是X.AI公司推出的首個多模態(tài)模型。除了強(qiáng)大的文本處理能力，Grok還能處理各種視覺信息，如文檔、圖表、截圖和照片等。點(diǎn)擊前往Grok-1.5VisionPreview官網(wǎng)體驗(yàn)入口需求人群：輔助決策分析內(nèi)容生成工作效率提升使用場景示例：使用Grok-1.5V分析復(fù)雜的商業(yè)報告，快速提取關(guān)鍵數(shù)據(jù)和見解利用Grok-1.5V自動生成項(xiàng)目計(jì)劃草稿，并優(yōu)化資源分配通過Grok-1.5V理解工廠設(shè)備使用說明，提高維修效率產(chǎn)品特色：多學(xué)科推理文檔理解圖表解讀現(xiàn)實(shí)世界理解圖像處理掌握Grok-1.5VisionPreview，體驗(yàn)多模態(tài)AI的強(qiáng)大功能和無限潛力。

Grok-1.5VisionPreview Grok-1.5V
MiniGPT4-Video官網(wǎng)體驗(yàn)入口視頻理解多模態(tài)AI大模型使用地址

MiniGPT4-Video是什么？MiniGPT4-Video是為視頻理解設(shè)計(jì)的多模態(tài)大模型，能處理時態(tài)視覺數(shù)據(jù)和文本數(shù)據(jù)，配標(biāo)題、宣傳語，適用于視頻問答。用戶可以上傳視頻，讓模型生成標(biāo)題與宣傳語，理解特效處理，或作超美抒情詩。

MiniGPT4-Video
冒泡鴨AI體驗(yàn)入口多模態(tài)AI智能體互動平臺使用指南

冒泡鴨AI 是基于自研多模態(tài)大模型開發(fā)的AI互動平臺，提供擬人、工具、內(nèi)容、游戲、娛樂等多個領(lǐng)域的海量智能體。平臺具有超長的上下文記憶能力和實(shí)時聯(lián)網(wǎng)搜索能力，能夠深度理解用戶意圖，并提供即時、準(zhǔn)確、個性化的回復(fù)和選擇。用戶還可以定制個性化的AI智能體，以滿足個性化的需求和偏好。點(diǎn)擊前往冒泡鴨AI官網(wǎng)體驗(yàn)入口誰適合使用冒泡鴨AI？冒泡鴨AI適用于尋求?

冒泡鴨AI
李未可WAKE-AI大模型：讓多類終端能快速低成本的定制多模態(tài)AI

36kr研究院發(fā)布了《2024年AIGC行業(yè)研究:多模態(tài)大模型與商業(yè)應(yīng)用》，文中基于AIGC產(chǎn)業(yè)生態(tài)現(xiàn)狀和技術(shù)發(fā)展路徑，深入分析AIGC商業(yè)化應(yīng)用的方向與產(chǎn)業(yè)發(fā)展趨勢。其中在36kr研究院梳理的產(chǎn)業(yè)圖譜中，發(fā)現(xiàn)杭州李未可科技與字節(jié)跳動的豆包、騰訊云混元及華為云盤古等大模型等一起出現(xiàn)在閉源模型層，甚至在跨模態(tài)生成應(yīng)用層也占據(jù)一地。李未可科技這類結(jié)合自身業(yè)務(wù)垂類場景，提前布局中間層及終端應(yīng)用層的自研大模型或許能給市場帶來不小的驚喜。

AIGC 商業(yè)化應(yīng)用產(chǎn)業(yè)發(fā)展
阿里推自主多模態(tài)AI代理MobileAgent 可模擬人類操作手機(jī)

MobileAgent是由阿里巴巴開發(fā)的一個自主多模態(tài)AI代理，可以模擬人類操作手機(jī)，是一個純視覺解決方案，不需要任何系統(tǒng)代碼，完全通過分析圖像來理解和操作手機(jī)。項(xiàng)目地址:https://top.aibase.com/tool/mobile-agent特點(diǎn):依賴于純視覺解決方案:MobileAgent通過分析圖像來理解和操作手機(jī)無需任何系統(tǒng)代碼。觀察、思考和行動是MobileAgent采用的提示格式，要求代理輸出三個組成部分。

MobileAgent AI頭條
?Mobile-Agent: 具有視覺感知可以像人類樣操作手機(jī)的自主多模態(tài)AI代理

Mobile-Agent是一款具有視覺感知的自主多模式移動設(shè)備代理，由北京交通大學(xué)聯(lián)合阿里巴巴團(tuán)隊(duì)共同開發(fā)。該代理采用純視覺解決方案，獨(dú)立于XML和系統(tǒng)元數(shù)據(jù)，不需要任何系統(tǒng)代碼，完全通過分析圖像來理解和操作手機(jī)。它能夠自動完成各種任務(wù)，比如可以在淘寶加購物車車，在APP播放音樂，自主使用導(dǎo)航APP，收發(fā)郵件等等。

Mobile-Agent AI代理 AI頭條
Gemini官網(wǎng)體驗(yàn)入口谷歌DeepMind多模態(tài)AI人工智能在線使用地址

Gemini是由谷歌DeepMind推出的新一代人工智能系統(tǒng)。作為全球熱門的多模態(tài)AI系統(tǒng)，Gemini能夠進(jìn)行多模態(tài)推理，支持文本、圖像、視頻、音頻和代碼之間的無縫交互。點(diǎn)擊上方鏈接，體驗(yàn)這個全球熱門的多模態(tài)人工智能系統(tǒng)，探索無限可能性！

Gemini
多模態(tài)AI模型Unified-IO2：可理解和生成圖像、文本、音頻和動作

由艾倫人工智能研究所、伊利諾伊大學(xué)厄巴納-香檳分校和華盛頓大學(xué)的研究人員聯(lián)合開發(fā)的“Unified-IO2”標(biāo)志著人工智能能力的一次巨大飛躍。與之前只能處理雙模態(tài)的前輩不同，Unified-IO2是一款自回歸的多模態(tài)模型，能夠解釋和生成文本、圖像、音頻和視頻等多種數(shù)據(jù)類型。它成功地駕馭了多模態(tài)數(shù)據(jù)整合的復(fù)雜性，為未來人工智能模型樹立了一個先例，預(yù)示著人工智能將更

Unified-IO2 AI頭條多模態(tài)AI模型
Gemini官網(wǎng)體驗(yàn)入口多模態(tài)AI軟件app免費(fèi)下載地址

Gemini是谷歌DeepMind推出的新一代人工智能系統(tǒng)。它能夠進(jìn)行多模態(tài)推理，支持文本、圖像、視頻、音頻和代碼之間的無縫交互。以上就是Gemini的全部介紹了，感興趣的小伙伴可以點(diǎn)擊上方鏈接前往體驗(yàn)！

Gemini
Gemini官網(wǎng)體驗(yàn)入口谷歌多模態(tài)AI軟件app免費(fèi)下載地址

《Gemini》是由DeepMind開發(fā)的一款先進(jìn)的人工智能模型，它從根本上構(gòu)建為多模態(tài)，能夠在文本、圖像、視頻、音頻和代碼之間無縫進(jìn)行推理。這標(biāo)志著AI如何幫助改善我們?nèi)粘Ｉ畹闹卮箫w躍。以上就是《Gemini》的全部介紹了，感興趣的小伙伴可以點(diǎn)擊上方鏈接前往體驗(yàn)！

Gemini
Google Gemini官網(wǎng)體驗(yàn)入口谷歌多模態(tài)AI聊天軟件app免費(fèi)下載地址

《GoogleGemini》是Alphabet于2023年12月6日發(fā)布的下一代AI模型的首個階段。這個AI系統(tǒng)由GoogleDeepMind團(tuán)隊(duì)主導(dǎo)，旨在超越人類專家在多任務(wù)語言理解方面的表現(xiàn)，能夠根據(jù)不同輸入生成代碼、結(jié)合生成文本和圖像，并能跨語言進(jìn)行視覺推理。以上就是《GoogleGemini》的全部介紹了，感興趣的小伙伴可以點(diǎn)擊上方鏈接前往體驗(yàn)！

Gemini
薦被高估的Pika，被低估的多模態(tài)AI

多模態(tài)AI正處于爆發(fā)前夜。從GPT-4V的“驚艷亮相”，到AI視頻生成工具Pika1.0的“火爆出圈”，再到谷歌Gemini的“全面領(lǐng)先”，多模態(tài)AI都是其中的關(guān)鍵詞。在多模態(tài)AI爆發(fā)之前，不要溫和地走進(jìn)這個良夜。

Pika 多模態(tài)AI
Gemini官網(wǎng)體驗(yàn)入口多模態(tài)AI聊天軟件app免費(fèi)下載地址

《Gemini》是由谷歌DeepMind推出的新一代人工智能系統(tǒng)。它具備多模態(tài)推理能力，支持文本、圖像、視頻、音頻和代碼之間的無縫交互。以上就是《Gemini》的全部介紹了，感興趣的小伙伴可以點(diǎn)擊上方鏈接前往體驗(yàn)！

Gemini
Gemini官網(wǎng)體驗(yàn)入口谷歌多模態(tài)AI免費(fèi)軟件app下載地址

《Gemini》是由谷歌DeepMind推出的新一代人工智能系統(tǒng)。這個系統(tǒng)能夠進(jìn)行多模態(tài)推理，支持文本、圖像、視頻、音頻和代碼之間的無縫交互。以上就是《Gemini》的全部介紹了，感興趣的小伙伴可以點(diǎn)擊上方鏈接前往體驗(yàn)！

Gemini
GPT-4V都考不過？基于大學(xué)水平考試的多模態(tài)AI測試基準(zhǔn)MMMUs發(fā)布

一項(xiàng)基于大學(xué)水平考試的多模態(tài)AI測試基準(zhǔn)MMMUs發(fā)布，旨在評估機(jī)器在廣泛多樣的任務(wù)上的專家級多模態(tài)理解和推理能力。這一基準(zhǔn)對當(dāng)前最先進(jìn)的GPT-4V等模型提出挑戰(zhàn)，通過涵蓋藝術(shù)與設(shè)計(jì)、商科、科學(xué)、健康與醫(yī)學(xué)、人文與社會科學(xué)、技術(shù)與工程等六個學(xué)科的30個科目，共有1.15萬個問題，考察了感知、知識和推理等基本技能。這將有助于推動人工智能領(lǐng)域的發(fā)展，引領(lǐng)未來人工智能系統(tǒng)在多學(xué)科、多模態(tài)任務(wù)上取得更為卓越的成就。

AI
?AI創(chuàng)企Reka發(fā)布多模態(tài)AI助手Yasa-1，欲與ChatGPT競爭

由DeepMind、Google、百度和Meta的研究人員共同創(chuàng)立的AI創(chuàng)企Reka，最近宣布了最新產(chǎn)品一款多模態(tài)AI助手Yasa-1。這款助手被設(shè)計(jì)成可以理解和互動文本、圖像、視頻和音頻等多種媒體形式，被認(rèn)為有望成為OpenAI的ChatGPT的競爭對手。Yasa-1的發(fā)布標(biāo)志著多模態(tài)AI助手領(lǐng)域的競爭愈發(fā)激烈，預(yù)示著未來AI助手將在不同媒體類型之間進(jìn)行更多復(fù)雜的交互，為用戶提供更多有趣和實(shí)用的功能。

Yasa-1 多模態(tài)AI助手 ChatGPT
OpenAI多模態(tài)AI系統(tǒng)GPT-Vision即將推出與谷歌Gemini競爭

據(jù)TheInformation報道，知情人士透露，鑒于谷歌上周開始向部分企業(yè)測試其多模態(tài)大模型Gemini，OpenAI希望搶占先機(jī)，推出自己的多模態(tài)AI系統(tǒng)。OpenAI在3月份推出語言模型GPT-4時曾預(yù)覽了多模態(tài)功能，但至今僅向?yàn)槊と颂峁┓?wù)的BeMyEyes公司開放。AI領(lǐng)域兩大巨頭互相競爭有利于行業(yè)技術(shù)進(jìn)步，消費(fèi)者也將從中受益。
Hugging Face推開源多模態(tài)AI模型IDEFICS 支持圖像、文本輸入

HuggingFace推出了一個名為IDEFICS的開源多模態(tài)AI模型，它可以接受圖像和文本作為輸入，并生成連貫的文本輸出。IDEFICS是一個強(qiáng)大的視覺語言模型，擁有高達(dá)800億的參數(shù)量，功能包括根據(jù)圖像生成描述、回答相關(guān)問題以及根據(jù)多個圖像生成敘述等。未來如果能進(jìn)一步提升多模態(tài)理解和生成能力，將可以大幅推動諸如機(jī)器人、自動駕駛等多模態(tài)AI應(yīng)用的發(fā)展。

AI模型 IDEFICS AI頭條
微軟創(chuàng)新項(xiàng)目Project Rumi：多模態(tài)AI項(xiàng)目助力理解人類意圖

ProjectRumi是微軟的一個項(xiàng)目，旨在通過解決大型語言模型理解非語言線索和上下文細(xì)微差別的局限性，增強(qiáng)LLM的能力。該項(xiàng)目將非語言線索融入基于提示的LLM交互中，以提高交流的質(zhì)量。3.未來的研究計(jì)劃包括進(jìn)一步改進(jìn)模型，并添加心率變異性和環(huán)境感知等更多細(xì)節(jié)，以實(shí)現(xiàn)與人工智能的更深層次的交互。
華為云端云協(xié)同多模態(tài)AI應(yīng)用開發(fā)套件HiLens全面升級，助力AI應(yīng)用開發(fā)落地

在華為開發(fā)者大會2020(Cloud)期間，華為云推出了全面升級的業(yè)界首個端云協(xié)同多模態(tài)AI應(yīng)用開發(fā)套件——HiLens ，打通線上線下開發(fā)和部署流程，開發(fā)者只需在云上完成一次多模態(tài)AI應(yīng)用開發(fā)，既可以部署到云側(cè)，也可以部署到端側(cè)和邊緣側(cè)。人工智能的發(fā)展正經(jīng)歷從感知到認(rèn)知，從單模到多模，從云側(cè)到端云協(xié)同的演進(jìn)。此次，全面升級的華為云HiLens推出多模態(tài)開發(fā)環(huán)境HiLens Studio、開發(fā)框架HiLens Framework及技能市場HiLens Skill Ma

華為云華為云端云協(xié)同
年末大促丨多模態(tài)AI開發(fā)利器華為云HiLens Kit直降600元還送豪禮

12 月 12 日起，華為云宣布開啟“華為云12. 12 會員節(jié)”年末回饋活動，超值優(yōu)惠讓利企業(yè)，與百萬用戶共享云上福利。其中，華為云 11 月推出的多模態(tài)AI開發(fā)套件HiLens Kit優(yōu)惠多多。福利一：直降 600 元，領(lǐng)取HiLens Kit專用滿減券新用戶登錄華為云官網(wǎng)后，注冊后即可領(lǐng)取 2 張滿減券，分別HiLens Kit1 臺專用滿 4199 元減 600 元和 5 臺專用滿 20995 元減 3000 元券。福利二：領(lǐng)券下單，再贏華為WATCH GT2 等實(shí)物豪禮即日起至 2020

AI開發(fā)
一鍵反AI、精準(zhǔn)辨真?zhèn)?南京攝星智能發(fā)布多模態(tài)AI智能檢測產(chǎn)品“星眼鑒”

10 月 16 日晚，專注于軍事領(lǐng)域智能化的智慧防務(wù)服務(wù)商——南京攝星智能科技有限公司（以下簡稱“南京攝星智能”），發(fā)布了全國首款分別面向B端和C端的多模態(tài)AI生成信息智能檢測應(yīng)用小程序——星眼鑒。不僅能夠幾秒就高效鑒別出用戶上傳的視頻/圖像是否為AI生成的偽造數(shù)據(jù)，還能自動生成量化的檢測報告，精準(zhǔn)的分析出數(shù)據(jù)的難辨等級和合成率。隨著深度學(xué)習(xí)技術(shù)的發(fā)展，AI技術(shù)被應(yīng)用在大量場景中。其中，應(yīng)用最為廣泛的技術(shù)之一，人

南京攝星智能
Meta推出新一代智能觸覺系統(tǒng)機(jī)械手可實(shí)現(xiàn)多模態(tài)環(huán)境感知

Meta公司日前宣布與傳感器制造商GelSight及韓國機(jī)器人企業(yè)WonikRobotics達(dá)成戰(zhàn)略合作，共同推進(jìn)新一代觸覺傳感技術(shù)的商業(yè)化進(jìn)程。這套面向科研領(lǐng)域的創(chuàng)新設(shè)備將為科學(xué)家提供更精確的物理世界觀測與模擬能力。這次跨界合作標(biāo)志著觸覺傳感技術(shù)在科研領(lǐng)域的重要突破，有望為相關(guān)領(lǐng)域研究帶來新的發(fā)展機(jī)遇。

Meta公司觸覺傳感技術(shù) GelSight
實(shí)時互動情感陪伴，Soul App升級多模態(tài)大模型探索AI社交新可能

10月25日~26日，由聲網(wǎng)和RTE開發(fā)者社區(qū)聯(lián)合主辦的RTE2024實(shí)時互聯(lián)網(wǎng)大會在北京舉行。在AI技術(shù)突破式發(fā)展引發(fā)各行業(yè)革新浪潮的當(dāng)下，此次大會主題聚焦“AI愛”，匯聚行業(yè)代表企業(yè)、技術(shù)大咖、專家學(xué)者等嘉賓，共同深度探討AI為互聯(lián)網(wǎng)生態(tài)帶來的新發(fā)展?！边@也意味著，Soul將實(shí)現(xiàn)真正意義上的AI多模態(tài)交互，集合文字、語音、動作交互的多模態(tài)大模型，讓用戶可以在平臺實(shí)現(xiàn)更接近人類模式的互動體驗(yàn)和更高效、自然、豐富維度的信息傳遞，真正獲得社交體驗(yàn)的顛覆式升級。

實(shí)時互聯(lián)網(wǎng)大會 AI技術(shù)發(fā)展社交領(lǐng)域AI

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘