聲明:本文來自于微信公眾號 新熵,作者:思原,授權(quán)站長之家轉(zhuǎn)載發(fā)布。
2024年,是AI應(yīng)用集中爆發(fā)的一年,智能搜索、文生視頻、日常聊天,這些已經(jīng)融入到了我們的日常生活、工作之中,讓我們享受到了便利。
但對于起調(diào)頗高的AI,也不禁會有質(zhì)疑,AI也不過如此。但如果說,現(xiàn)在的AI能夠判斷煤氣是否泄漏,能夠讓愛因斯坦出現(xiàn)在課堂之上,亦能夠讓李白“親自”朗誦詩詞,這是否會讓你感到詫異?
其實這些看似天馬行空的事情,離我們已經(jīng)越來越近。
在12月29日晚間,中央廣播電視總臺首屆《中國科技創(chuàng)新盛典》(總臺“科晚”)播出,這場“科技春晚”以“新質(zhì)生產(chǎn)力”為核心關(guān)鍵詞,匯聚了新質(zhì)生產(chǎn)力代表性的新興產(chǎn)業(yè)、科技企業(yè)。
其中科大訊飛董事長劉慶峰作為杰出代表出席了此次“科晚”,并且用一系列精彩的現(xiàn)場演示,展示了最新的人工智能技術(shù)應(yīng)用成果,讓更多人看到了人工智能是如何解放生產(chǎn)力,如何為我們的生活創(chuàng)造更多價值。
這次科晚上有這樣一幕,舞臺上突然出現(xiàn)了主持人張騰岳的“分身”,兩個張騰岳同時出現(xiàn)的情形著實讓觀眾為之震驚。
但其實這是由訊飛智作打造的 AI 虛擬數(shù)字人,不但能夠與真人主持人神態(tài)自若地互動對話,更是以其出色的方言朗誦能力驚艷全場,帶來了一場跨越語言與方言的精彩表演。
舞臺上,AI張騰岳用陜西、廣東、河南三地方言分別演繹了《靜夜思》《望月懷遠(yuǎn)》《滿江紅》等經(jīng)典詩詞,字正腔圓、韻味十足,仿佛一位來自當(dāng)?shù)氐奈幕瘋鞒姓?,將詩詞中的情感與意境通過方言的獨特魅力展現(xiàn)得淋漓盡致。
除了讓人驚喜的語言能力外,“AI張騰岳” 在與真人主持人的互動以及自身的形象動作展現(xiàn)方面同樣表現(xiàn)優(yōu)秀。它能夠神態(tài)自若地與主持人進行對話交流,準(zhǔn)確理解對方的話語并迅速做出恰當(dāng)回應(yīng),其流暢自然的程度讓人幾乎難以察覺這是一個虛擬的存在。
在形象上,“AI張騰岳” 可以說是1:1的精準(zhǔn)復(fù)刻,再現(xiàn)了真實主持人張騰岳的聲音、表情和動作,從細(xì)微的面部表情到肢體的一舉一動,都與真人高度相似,具備自然的表情、流暢的動作和真實的聲音表現(xiàn)。
據(jù)了解,AI張騰岳融合了科大訊飛先進的語音合成、語音識別、語義理解、唇形預(yù)測、圖像處理等前沿人工智能技術(shù)。通過深度學(xué)習(xí),精準(zhǔn)還原了表情和動作,再加上先進的語音合成技術(shù),使得“AI張騰岳”擁有逼真的表情、流暢的動作和生動的聲音表現(xiàn)。
“AI張騰岳”的出現(xiàn),也意味著虛擬數(shù)字人已經(jīng)實現(xiàn)了從“形似”到“神似”的跨越。
而這令人眼前一亮的表演,也與科大訊飛深厚的多語種技術(shù)積累有關(guān)。今年,科大訊飛作為第一完成單位的“多語種智能語音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項目獲得年度國家科技進步一等獎。這是深度學(xué)習(xí)引發(fā)全球人工智能浪潮以來,過去十年人工智能領(lǐng)域的首個國家科技進步一等獎,標(biāo)志著中國在多語種AI技術(shù)領(lǐng)域已達到國際領(lǐng)先水平。
多年來,科大訊飛在多語種技術(shù)領(lǐng)域?qū)覄?chuàng)佳績:連續(xù)5屆獲得國際多通道語音分離識別比賽CHIME冠軍;榮獲世界互聯(lián)網(wǎng)大會首屆杰出貢獻獎、創(chuàng)新突破獎;在國際聲學(xué)場景及分類挑戰(zhàn)賽、IEEE國際多媒體博覽大會等多個語音識別競賽中,斬獲多項冠軍。
其實在今年的科大訊飛全球1024開發(fā)者節(jié)上,科大訊飛便率先推出了超擬人數(shù)字人,不僅在口唇、表情、動作上更為靈活自然,在制作模式上,與傳統(tǒng)的數(shù)字人需要依賴預(yù)先錄制的模板動作不同,訊飛數(shù)字人僅需一張照片即可完成形象的定制,并且用戶可以直接在訊飛智作平臺上體驗這一技術(shù),減少了用戶的操作路徑和使用門檻與成本。
隨著大模型賦能數(shù)字人的飛速發(fā)展,虛擬人應(yīng)用也可以在日常生活中很直觀的感受到,從營銷到金融,從文旅到電商,越來越多虛擬人開始承擔(dān)著導(dǎo)游、客服、主播等多元角色,出現(xiàn)在金融、文旅、媒體、政企等常見場景。
目前訊飛多場景虛擬數(shù)字人結(jié)合星火認(rèn)知大模型的最新技術(shù)已經(jīng)賦能多個領(lǐng)域,從國際賽事巴黎奧運會到非遺文化北京中軸線,從行業(yè)活動天津智博會到智慧展廳山東高速,都能看到其身影。而以AI虛擬人交互平臺為代表的平臺化產(chǎn)品,也已在央國企(企業(yè)數(shù)字化)、教育培訓(xùn)、文化旅游、電子商務(wù)、金融服務(wù)等多個行業(yè)領(lǐng)域內(nèi)成功落地,其應(yīng)用的廣度與深度均在持續(xù)拓展之中。
未來隨著企業(yè)、行業(yè)應(yīng)用數(shù)字人的深入,對數(shù)字人的需求模式也在分層,而隨著科大訊飛圍繞數(shù)字人產(chǎn)品的商業(yè)模式和打法策略的更新,相信未來可以幫助更多個人及企業(yè)實現(xiàn)更智能、更創(chuàng)新、更可靠的一站式的數(shù)字人解決方案。
在本次科晚上,除了AI張騰岳的出現(xiàn),劉慶峰還演示了AI在教育領(lǐng)域的能力。
舞臺上,劉慶峰站在智慧黑板前做了一個畫圓的動作,一個完美的圓形立即呈現(xiàn)在黑板上。隨后,他隨手畫下一個能夠360度旋轉(zhuǎn)的立方體,讓抽象的幾何概念變得生動具體。
其實這利用到的便是AI多模態(tài)理解?;诳拼笥嶏w自主研發(fā)的3D剖分與動態(tài)渲染引擎,直觀呈現(xiàn)空間構(gòu)圖,進行圖形分割,動態(tài)展示截面與立方體的空間變化,在不改變老師的書寫習(xí)慣的同時,將抽象知識進行直觀展示,培養(yǎng)學(xué)生數(shù)學(xué)建構(gòu)能力。
需要注意的是,虛擬人也是這塊智慧黑板的“靈魂”所在。
晚會現(xiàn)場,愛因斯坦、李白等虛擬形象出現(xiàn)在了智慧黑板上,主持人與現(xiàn)場觀眾也實現(xiàn)了與歷史名人的“隔空對話”。
從本質(zhì)上來看,虛擬人輔教便是典型的AI數(shù)字人應(yīng)用。虛擬人可以與學(xué)生實時進行情景對話、語音評測,還支持啟發(fā)式讀寫拓展;同時也可以實時回答學(xué)生的奇思妙問,激發(fā)學(xué)生的好奇心與求知欲。課下,虛擬人助教還可以帶領(lǐng)學(xué)生進行課間活動,比如唱紅歌、課桌操、古詩詞朗誦等等,助力實現(xiàn)五育并舉。
在教育領(lǐng)域,科大訊飛已為全國32個省級行政區(qū)的5萬余所學(xué)校提供常態(tài)化應(yīng)用。此次“科晚”展示的星火智慧黑板不僅獲得全球智慧教育創(chuàng)新獎,更成功入選2024世界人工智能大會SAIL獎(Super AI Leader,卓越人工智能引領(lǐng)者)TOP30榜單,并作為“AI+教育”賽道唯一獲獎?wù)呷脒x“人工智能+”議題6項最具代表性項目之一。
搭載聲學(xué)成像儀的巡檢機器狗“小汐”,也出現(xiàn)在了這次科晚舞臺上,并且劉慶峰親自展示了小汐在工業(yè)安全領(lǐng)域的可能性。
在工廠模擬場景中,劉慶峰邀請知名主持人張騰岳進行了一場尋找泄漏點的實驗。面對一堵模擬的煤氣管道和危險品運輸管道墻,盡管張騰岳貼近管道、全神貫注地聆聽,卻仍未能察覺到任何異常聲音。然而,小汐僅用了短短幾秒鐘就精準(zhǔn)鎖定了泄漏位置,展現(xiàn)出其在工廠安全巡檢和設(shè)備故障預(yù)警中的巨大潛力,讓全場觀眾驚嘆不已。
小汐之所以有如此出色的排查能力,得益于訊飛潮汐力的工業(yè)AI聲學(xué)成像儀,再融合高精度麥克風(fēng)和超聲波聲源定位技術(shù)。通過聲像圖與可見光圖像疊加的成像方式,實時展示聲源的分布狀態(tài),迅速辨別出細(xì)微聲音。
這一技術(shù)不僅可以在工業(yè)安全領(lǐng)域?qū)崿F(xiàn)精準(zhǔn)檢測泄漏、進行設(shè)備故障預(yù)警;在環(huán)境監(jiān)測方面還能定位噪音源、檢測危險氣體;在安防監(jiān)控領(lǐng)域可識別異常聲音、輔助應(yīng)急救援;在智能巡檢中能替代人工巡檢、進行數(shù)據(jù)采集與分析。
除了“小汐”,科大訊飛還依托工業(yè)六感技術(shù),打造了AI聲學(xué)成像儀、AI工業(yè)內(nèi)窺鏡等一系列工業(yè)AI傳感儀器。這些產(chǎn)品不僅入選了工信部智能檢測裝備創(chuàng)新產(chǎn)品目錄(第一批)、2024水利部先進實用技術(shù)推廣目錄,還獲得中國電科院科學(xué)技術(shù)一等獎等獎項。
在全球元宇宙和數(shù)字經(jīng)濟加速發(fā)展的背景下,通過人工智能的賦能,科大訊飛憑借國家級技術(shù)背書、全球領(lǐng)先的多語種能力和成熟的產(chǎn)業(yè)生態(tài),在直播、服務(wù)、影視、教育、電力、制造等眾多行業(yè),成功打造了多個數(shù)字化轉(zhuǎn)型標(biāo)桿項目,為行業(yè)轉(zhuǎn)型升級注入了新的活力。
從這次科晚我們也能看到,科大訊飛正以創(chuàng)新為驅(qū)動,不斷拓展人工智能的應(yīng)用邊界。在未來,我們有理由相信,科大訊飛將繼續(xù)引領(lǐng)科技潮流,為我們的生活、工作和社會發(fā)展帶來更多的驚喜與變革,讓人工智能真正成為推動人類進步的強大力量。
(舉報)