11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
近日,Meta發(fā)布了VoiceboxAI模型,它在音頻模擬方面有著顯著優(yōu)勢。Voicebox只需要一段2秒鐘的音頻樣本,即可準(zhǔn)確辨別出音頻細(xì)節(jié)、音色,并基于文字結(jié)果轉(zhuǎn)換為語音輸出。在找到解決方法前,Meta將不會(huì)向公眾公開VoiceboxAI模型,以避免不必要的危害。
Meta平臺(tái)的人工智能研究部門推出了名為Voicebox的機(jī)器學(xué)習(xí)模型,可以將文本轉(zhuǎn)換為語音。與其他文本轉(zhuǎn)語音模型不同的是,Voicebox能夠執(zhí)行許多未經(jīng)過訓(xùn)練的任務(wù),包括編輯、去除噪音和樣式轉(zhuǎn)換。Meta團(tuán)隊(duì)還在探索技術(shù)來克服這些限制。
ChatGPT和Google的Bard等生成式人工智能使用自然語言處理和機(jī)器學(xué)習(xí)生成特定文本以響應(yīng)提問。Meta的新生成人工智能Voicebox做事有點(diǎn)不同——生成任意音頻。Meta表示,他們意識(shí)到這種人工智能技術(shù)可能帶來的潛在危害,并正在努力找到一種有效的方式來區(qū)分真實(shí)語音和由Voicebox生成的音頻。