站長之家(ChinaZ.com)11月14日 消息:最近,B站UP主“小蟲哥_”發(fā)布了一部原神二創(chuàng)視頻,其中各個角色模仿芙寧娜的臺詞和動作,但保留了原本的聲線,給網(wǎng)友來了億點點震撼。截至發(fā)稿日,該視頻已經(jīng)獲得了超過136萬的播放量。
許多原神玩家被吸引的原因可能在于“陌生的熟悉感”,因為看到熟悉的角色模仿另一個角色的臺詞和動作,引得不少網(wǎng)友在評論區(qū)@同好直呼“不能只有我被創(chuàng)”。
有網(wǎng)友在評論區(qū)發(fā)問關(guān)于動作和建模的問題,還有人問“這大招語音怎么回事啊?”據(jù)UP主“小蟲哥_”介紹,為了模仿原神各個角色的聲線,他使用了VITS語音合成模型。
這一模型的原理是上傳聲音文本,經(jīng)過分析提取出語言特征,然后這些特征傳入聲學(xué)模型,由聲學(xué)模型分析出聲學(xué)特征,最后這些特征被發(fā)送給聲碼器,由聲碼器把相對應(yīng)的聲波發(fā)送出來。簡單來說,聲學(xué)模型保留了原神各個角色獨特的聲線。不考慮技術(shù)背景,通過向VITS模型“提供聲音”,任何人都可以低成本創(chuàng)造專屬自己的“聲庫”。
AI聲音克隆已經(jīng)不再是新鮮話題,一些AI配音工具如HeyGen、AI Dubbing等都可以免費體驗,降低了普通用戶的使用門檻。隨著技術(shù)的升級,如何在內(nèi)容和形式上做出別出心裁的作品,也許是創(chuàng)作者們當(dāng)下更應(yīng)該關(guān)注的問題。
(舉報)