11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享。快來(lái)騰訊云選購(gòu)吧!
BASE TTS 是亞馬遜開(kāi)發(fā)的一款大規(guī)模文本到語(yǔ)音合成模型。該模型利用了 10 億參數(shù)的自動(dòng)回歸轉(zhuǎn)換器,能夠?qū)⑽谋巨D(zhuǎn)換成語(yǔ)音代碼,并通過(guò)卷積解碼器生成語(yǔ)音波形。通過(guò)使用超過(guò) 10 萬(wàn)小時(shí)的公共語(yǔ)音數(shù)據(jù)進(jìn)行訓(xùn)練,BASE TTS實(shí)現(xiàn)了語(yǔ)音自然度的新?tīng)顟B(tài),同時(shí)還采用了音素解離和壓縮等新穎的語(yǔ)音編碼技術(shù)。隨著模型規(guī)模的增大,BASE TTS展現(xiàn)出了處理復(fù)雜句子的自然語(yǔ)調(diào)能力。點(diǎn)?