如今的 AI 看起來已經(jīng)無所不能,不僅能夠勝任感知、學習、推理、決策等不同層面的任務(wù),甚至可以打造虛擬數(shù)字分析,為人類帶來多模態(tài)AI交互體驗。近日,?新型社交平臺Soul App 在GITEX GLOBAL海灣信息技術(shù)博覽會上展出了其比較新自研的多模態(tài)大模型,該模型具備多模態(tài)理解、真實擬人、文字對話、語音通話、多語種等特性,實現(xiàn)打破次元壁的互動,讓現(xiàn)場的觀眾們驚艷不已。
3D數(shù)字孿生,虛擬與現(xiàn)實的創(chuàng)新交互
Soul作為國內(nèi)較早將AI引入社交關(guān)系的互聯(lián)網(wǎng)平臺代表之一,此次攜比較新自研的多模態(tài)大模型參展GITEX GLOBAL2024,向世界展現(xiàn)了中國企業(yè)在社交領(lǐng)域的比較新應(yīng)用實踐和數(shù)字娛樂的創(chuàng)新方案。此次是Soul初次亮相國際大型展會,其自研的多模態(tài)大模型集合文字、語音、動作交互等多模態(tài)方向,實現(xiàn)更接近人類模式的互動體驗和更有效、自然、豐富維度的信息傳遞。
大會上,現(xiàn)場觀眾可以實現(xiàn)高相似度的3D虛擬人的AI建模,通過包含人臉的90余個形狀參數(shù)和6個屬性參數(shù),于幾秒鐘內(nèi),快速在3D世界精細化還原真實人臉的特征 ,打造專屬的虛擬化身。同時,基于實時的人體動作識別、數(shù)字還原以及多模態(tài)對話交互能力,實現(xiàn)3D虛擬人與真人的沉浸式互動。
多模態(tài)端到端大模型,超擬人的情感體驗
事實上,自成立以來Soul便一直聚焦于多模態(tài)大模型方向持續(xù)深耕。
在推出智能推薦引擎“靈犀”、以AI算法助力社交關(guān)系的發(fā)現(xiàn)沉淀環(huán)節(jié)后,2020年,Soul正式啟動對AIGC的技術(shù)研發(fā)工作,系統(tǒng)推進在智能對話、語音技術(shù)、3D虛擬人等AIGC關(guān)鍵技術(shù)能力研發(fā)工作,并推動AI能力在社交場景的快速落地。
目前,Soul已先后上線了自研語言大模型Soul X,以及語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等語音大模型能力。今年6月,Soul還在社交行業(yè)中較早推出了自研端到端全雙工語音通話大模型,具備超低交互延遲、快速自動打斷、超真實聲音表達和情緒感知理解能力等特點,能夠直接理解豐富的聲音世界,支持超擬人化的多風格語言,實現(xiàn)更接近生活日常的交互對話和“類真人”的情感陪伴體驗。
多模態(tài)端到端大模型的推出標志著Soul對人機交互體驗的創(chuàng)新突破,同時,從文字、語音到視覺的模態(tài)升級,也意味著交互方式的顛覆式改變。在未來,Soul將持續(xù)加大對AI技術(shù)的投入,致力于通過AI技術(shù)更好地幫助用戶進行社交破冰,助力人設(shè)搭建和認知決策,提升社交溝通效率。
(推廣)