站長(zhǎng)之家(ChinaZ.com) 6月19日消息:ChatGPT 和 Google 的Bard 等生成式人工智能使用自然語(yǔ)言處理和機(jī)器學(xué)習(xí)生成特定文本以響應(yīng)提問(wèn)。Meta 的新生成人工智能 Voicebox 做事有點(diǎn)不同——生成任意音頻。
Facebook 的母公司 Meta 在日前宣布了一項(xiàng)名為 Voicebox 的新型生成式人工智能技術(shù)。Voicebox 可以利用一段 2 秒鐘的音頻樣本合成語(yǔ)音。通過(guò)這個(gè)樣本,它可以匹配音頻風(fēng)格,并進(jìn)行文本轉(zhuǎn)語(yǔ)音生成,或重新創(chuàng)建可能被外部噪音打斷的語(yǔ)音部分。Voicebox 還可以利用這個(gè)樣本,將英文文本朗讀成其他語(yǔ)言,比如法語(yǔ)、德語(yǔ)、西班牙語(yǔ)、波蘭語(yǔ)或葡萄牙語(yǔ)。
Meta 表示,Voicebox 可以為虛擬助手或元宇宙中的非玩家角色提供自然真實(shí)的語(yǔ)音。元宇宙是人們?cè)谄渲芯奂ぷ鳌蕵?lè)和交流的數(shù)字世界。它還可以被視力受損的人使用,讓他們聽(tīng)到朋友們的聲音來(lái)朗讀信息。
Voicebox 仍處于研發(fā)階段,尚未向公眾提供。Meta 表示,他們意識(shí)到這種人工智能技術(shù)可能帶來(lái)的潛在危害,并正在努力找到一種有效的方式來(lái)區(qū)分真實(shí)語(yǔ)音和由 Voicebox 生成的音頻。
(舉報(bào))