GITEX GLOBAL2024開展，Soul 多模態(tài)大模型引關(guān)注

2024-10-19 21:59 · 稿源：站長之家用戶

如今的 AI 看起來已經(jīng)無所不能，不僅能夠勝任感知、學習、推理、決策等不同層面的任務(wù)，甚至可以打造虛擬數(shù)字分析，為人類帶來多模態(tài)AI交互體驗。近日，?新型社交平臺Soul App 在GITEX GLOBAL海灣信息技術(shù)博覽會上展出了其比較新自研的多模態(tài)大模型，該模型具備多模態(tài)理解、真實擬人、文字對話、語音通話、多語種等特性，實現(xiàn)打破次元壁的互動，讓現(xiàn)場的觀眾們驚艷不已。

3D數(shù)字孿生，虛擬與現(xiàn)實的創(chuàng)新交互

Soul作為國內(nèi)較早將AI引入社交關(guān)系的互聯(lián)網(wǎng)平臺代表之一，此次攜比較新自研的多模態(tài)大模型參展GITEX GLOBAL2024，向世界展現(xiàn)了中國企業(yè)在社交領(lǐng)域的比較新應(yīng)用實踐和數(shù)字娛樂的創(chuàng)新方案。此次是Soul初次亮相國際大型展會，其自研的多模態(tài)大模型集合文字、語音、動作交互等多模態(tài)方向，實現(xiàn)更接近人類模式的互動體驗和更有效、自然、豐富維度的信息傳遞。

大會上，現(xiàn)場觀眾可以實現(xiàn)高相似度的3D虛擬人的AI建模，通過包含人臉的90余個形狀參數(shù)和6個屬性參數(shù)，于幾秒鐘內(nèi)，快速在3D世界精細化還原真實人臉的特征，打造專屬的虛擬化身。同時，基于實時的人體動作識別、數(shù)字還原以及多模態(tài)對話交互能力，實現(xiàn)3D虛擬人與真人的沉浸式互動。

多模態(tài)端到端大模型，超擬人的情感體驗

事實上，自成立以來Soul便一直聚焦于多模態(tài)大模型方向持續(xù)深耕。

在推出智能推薦引擎“靈犀”、以AI算法助力社交關(guān)系的發(fā)現(xiàn)沉淀環(huán)節(jié)后，2020年，Soul正式啟動對AIGC的技術(shù)研發(fā)工作，系統(tǒng)推進在智能對話、語音技術(shù)、3D虛擬人等AIGC關(guān)鍵技術(shù)能力研發(fā)工作，并推動AI能力在社交場景的快速落地。

目前，Soul已先后上線了自研語言大模型Soul X，以及語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等語音大模型能力。今年6月，Soul還在社交行業(yè)中較早推出了自研端到端全雙工語音通話大模型，具備超低交互延遲、快速自動打斷、超真實聲音表達和情緒感知理解能力等特點，能夠直接理解豐富的聲音世界，支持超擬人化的多風格語言，實現(xiàn)更接近生活日常的交互對話和“類真人”的情感陪伴體驗。

多模態(tài)端到端大模型的推出標志著Soul對人機交互體驗的創(chuàng)新突破，同時，從文字、語音到視覺的模態(tài)升級，也意味著交互方式的顛覆式改變。在未來，Soul將持續(xù)加大對AI技術(shù)的投入，致力于通過AI技術(shù)更好地幫助用戶進行社交破冰，助力人設(shè)搭建和認知決策，提升社交溝通效率。

（推廣）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)，對本頁面內(nèi)容所引致的錯誤、不確或遺漏，概不負任何法律責任，相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。任何單位或個人認為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，可及時向站長之家提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明（點擊查看反饋聯(lián)系地址）。本網(wǎng)站在收到上述法律文件后，將會依法依規(guī)核實信息，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

相關(guān)推薦

關(guān)鍵詞：

薦超GPT-4o，1240億參數(shù)！最強開源多模態(tài)模型 Pixtral Large！

法國著名開源大模型平臺Mistral.ai，開源了超大多模態(tài)模型——PixtralLarge。PixtralLarge有1240億參數(shù)，支持128K上下文，能理解文本、圖表、圖像等，也是Mistral.ai自家聊天助手leChat目前正在使用的視覺模型。LeChat提供了一個從模型到輸出的完全集成平臺，用戶可以在一個平臺上完成所有的多模態(tài)任務(wù)，無需在多個工具之間切換，簡化了工作流程。

?Mistral.ai ?Pixtral ?Large
2024大模型賦能傳統(tǒng)文化傳承發(fā)展研究報告發(fā)布暨專家研討會順利召開

10 月 30 日下午，由騰訊研究院與北京郵電大學交互技術(shù)與體驗系統(tǒng)文化和旅游部重點實驗室聯(lián)合主辦的“大模型賦能傳統(tǒng)文化傳承發(fā)展研究報告發(fā)布暨專家研討會”在北京郵電大學科技大廈第六會議室成功舉行。北京郵電大學副校長蘇森，騰訊集團副總裁、騰訊研究院總顧問楊健，文化和旅游部科技教育司以及騰訊研究院、中國社會科學院、國家圖書館基金會、文化和旅游部?

?大模型 ?傳統(tǒng)文化 ?文化傳承
北大等發(fā)布多模態(tài)版o1！首個慢思考VLM將開源，視覺推理超越閉源模型

北大等出品，首個多模態(tài)版o1開源模型來了——代號LLaVA-o1，基于Llama-3.2-Vision模型打造，超越傳統(tǒng)思維鏈提示，實現(xiàn)自主“慢思考”推理。在多模態(tài)推理基準測試中，LLaVA-o1超越其基礎(chǔ)模型8.9%，并在性能上超越了一眾開閉源模型。團隊宣布LLaVA-o1的代碼、預(yù)訓(xùn)練權(quán)重、數(shù)據(jù)集等即將全部開源。

?多模態(tài)推理 ?LLaVA-o1模型 ?人工智能
薦AI日報：阿里云逆天大模型Qwen2.5-Turbo；ElevenLabs支持打造對話AI智能體；Mistral推最強開源多模態(tài)模型Pixtral Large

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、阿里云發(fā)布逆天大模型Qwen2.5-Turbo一口氣讀完十本小說，推理速度提升4.3倍!阿里云推出的Qwen2.5-Turbo大語言模型在上下文處理能力和推理速度上都取得了革命性的突破，令人期待其?

?人工智能 ?大語言模型 ?阿里云
薦不做Sora背后：百度的多模態(tài)路線是什么？

當ChatGPT掀起國內(nèi)“百模大戰(zhàn)”，百度率先交卷文心一言。Sora再掀視頻生成風潮，卻傳出李彥宏內(nèi)部講話“Sora無論多么火，百度都不去做”。大量的行業(yè)應(yīng)用所產(chǎn)生的數(shù)據(jù)，又能為AGI的發(fā)展提供豐富的養(yǎng)分，形成良性循環(huán)，推動數(shù)據(jù)飛輪的高速運轉(zhuǎn)，從加快我們邁向AGI的步伐。

?百度
薦抽象是短視頻在2024的最大主題

和所有青年文化相似，抽象文化對邏輯和因果敘事的弱化，對無序的追求，和解構(gòu)一切的態(tài)度是當下社會氣氛和大眾精神狀態(tài)在短視頻消費中的具象體現(xiàn)。抽象會摒除語境、背景，只截取作品中的一個碎片進行二次加工和解讀，創(chuàng)作者和參與者之間進行即時的情緒交互，這種內(nèi)容放在更長的時間線上，是沒有任何意義的。」娛樂至死之后，抽象留給參與者的遺產(chǎn)依舊是空虛和麻木。

?抽象
小米 SU7 Ultra 原型車亮相 2024 廣州車展

在2024年廣州車展上，小米公司展出了其最新成就——小米SU7UltraPrototype原型車，該車最近在德國紐博格林北環(huán)賽道完成了圈速挑戰(zhàn)，創(chuàng)下了新紀錄。小米SU7Ultra原型車以其官方認證的6分46秒874的圈速，榮獲紐北全球最速四門車的稱號。這張照片只是為了告訴大家，小米聽到了消費者的呼聲，并將繼續(xù)努力提高生產(chǎn)效率。

?小米SU7Ultra ?車展 ?紐北賽道
極光受邀出席GICC 2024并榮獲金帆獎

由揚帆出海主辦的第五屆全球互聯(lián)網(wǎng)產(chǎn)業(yè)CEO大會在北京成功舉辦。此次大會聚焦全球化互聯(lián)網(wǎng)產(chǎn)業(yè)的發(fā)展，吸引了眾多國內(nèi)外知名企業(yè)、行業(yè)領(lǐng)袖和精英人士前來參加。極光將持續(xù)堅守“以客戶為中心的”的核心理念，攜手全球范圍內(nèi)的合作伙伴，共同揚帆遠航。

?全球互聯(lián)網(wǎng)產(chǎn)業(yè) ?出海營銷 ?AI技術(shù)應(yīng)用
薦2024年，品牌翻紅的“靈丹妙藥”還是它

“短劇增加了20倍的供應(yīng)量，價格翻了一倍觀眾是恒量的，即短劇效果下滑了40倍，從去年8月進去做短劇的所有品牌都是去做韭菜的，無一成功案例，2023年11月之后，韓束基本上不做短劇了?！表n束創(chuàng)始人呂義雄此前發(fā)布的這條朋友圈曾引起電商行業(yè)廣泛討論，卻未曾改變定制短劇炙手可熱的趨勢。2025年，能夠成功出圈的短劇必然要在服化道、主題立意、表演等層面都有明顯的亮點。

?短劇 ?電商行業(yè) ?品牌營銷
精彩回顧：哈評中國年會2024|良幣時代

2024年10月30日，《哈佛商業(yè)評論》中國年會2024在北京嘉里大酒店隆重舉行。本次盛會以“良幣時代”為主旋律，圍繞六大管理樂章展開。不管處于何種周期之下，連接與分享都將為管理創(chuàng)新帶來契機。

?哈佛商業(yè)評論 ?中國年會 ?2024

熱文

3 天
7天

站長商機

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

GITEX GLOBAL2024開展，Soul 多模態(tài)大模型引關(guān)注

薦超GPT-4o，1240億參數(shù)！最強開源多模態(tài)模型 Pixtral Large！

2024大模型賦能傳統(tǒng)文化傳承發(fā)展研究報告發(fā)布暨專家研討會順利召開

北大等發(fā)布多模態(tài)版o1！首個慢思考VLM將開源，視覺推理超越閉源模型

薦AI日報：阿里云逆天大模型Qwen2.5-Turbo；ElevenLabs支持打造對話AI智能體；Mistral推最強開源多模態(tài)模型Pixtral Large

薦不做Sora背后：百度的多模態(tài)路線是什么？

薦抽象是短視頻在2024的最大主題

小米 SU7 Ultra 原型車亮相 2024 廣州車展

極光受邀出席GICC 2024并榮獲金帆獎

薦2024年，品牌翻紅的“靈丹妙藥”還是它

精彩回顧：哈評中國年會2024|良幣時代

熱文

抖音宣布大力扶持精品短劇：單部最高投資金額可到500萬元保底

瓊瑤走了一個時代宣告結(jié)束了：小米王化發(fā)文悼念

馬斯克加碼起訴OpenAI：要求禁止其轉(zhuǎn)變?yōu)闋I利性公司

抖音副總裁否認回應(yīng)鐘睒睒：沒有回應(yīng)任何人不要以訛傳訛

騰訊回應(yīng)微信提現(xiàn)可免手續(xù)費：只有銀行卡轉(zhuǎn)入零錢通可以

盧偉冰：小米15、K80系列市場反饋非常好 Turbo4將本月發(fā)布

腦腐brain rot被評為2024牛津年度詞匯：過度瀏覽網(wǎng)絡(luò)低質(zhì)量內(nèi)容

官方通報27款A(yù)PP侵害用戶權(quán)益涉及亂跳轉(zhuǎn)、違規(guī)收集信息等問題

人人網(wǎng)回應(yīng)停止服務(wù)：正在“換車”升級嚴格保護用戶數(shù)據(jù)

王化回應(yīng)小米相機部大佬離職傳聞：大概率沒正經(jīng)上過班

周鴻祎公司突然賣房：360全資子公司1.33億元出售房屋車位

抖音宣布大力扶持精品短?。簡尾孔罡咄顿Y金額可到500萬元保底

瓊瑤走了一個時代宣告結(jié)束了：小米王化發(fā)文悼念

超過2200萬用戶、年收入30億歐元:全球最大盜版流媒體網(wǎng)絡(luò)被摧毀

馬斯克加碼起訴OpenAI：要求禁止其轉(zhuǎn)變?yōu)闋I利性公司

抖音副總裁否認回應(yīng)鐘睒睒：沒有回應(yīng)任何人不要以訛傳訛

騰訊回應(yīng)微信提現(xiàn)可免手續(xù)費：只有銀行卡轉(zhuǎn)入零錢通可以

盧偉冰：小米15、K80系列市場反饋非常好 Turbo4將本月發(fā)布

腦腐brain rot被評為2024牛津年度詞匯：過度瀏覽網(wǎng)絡(luò)低質(zhì)量內(nèi)容

明年3月上市！小米SUV起售價曝光：可能23.59萬元起

站長商機

GITEX GLOBAL2024開展，Soul 多模態(tài)大模型引關(guān)注

熱文

站長商機

GITEX GLOBAL2024開展，Soul 多模態(tài)大模型引關(guān)注