OpenVoice V2版本發(fā)布能對(duì)聲音風(fēng)格進(jìn)行精細(xì)控制

2024-04-26 09:41 · 稿源：站長(zhǎng)之家

站長(zhǎng)之家（ChinaZ.com）4月26日消息:MyShell TTS 開(kāi)發(fā)的 OpenVoice 是一項(xiàng)創(chuàng)新的聲音克隆技術(shù)，它能夠通過(guò)僅使用一小段參考發(fā)言者的音頻片段來(lái)復(fù)制其聲音，并生成多種語(yǔ)言的語(yǔ)音。

QQ截圖20240426094050.png

目前，MyShell TTS 已經(jīng)推出了全新的OpenVoice V2版本。這個(gè)版本能夠直接支持英語(yǔ)、西班牙語(yǔ)、法語(yǔ)、中文、日語(yǔ)以及韓語(yǔ)，并且顯著提高了音頻輸出的質(zhì)量。OpenVoice V2擁有復(fù)制任意聲音的能力，能以多種語(yǔ)言進(jìn)行語(yǔ)音輸出，并具備情感和口音的控制功能。它不但可以準(zhǔn)確模仿特定的聲音色彩，還允許對(duì)聲音的風(fēng)格，包括情感、口音、節(jié)奏、停頓及語(yǔ)調(diào)等進(jìn)行細(xì)致調(diào)整。

主要功能:

準(zhǔn)確的音色克隆: OpenVoice 能夠精確地克隆參考音色，并在多種語(yǔ)言和口音中生成語(yǔ)音。
靈活的聲音風(fēng)格控制: 用戶可以對(duì)聲音的情緒、口音、節(jié)奏、停頓和語(yǔ)調(diào)進(jìn)行詳細(xì)調(diào)整，實(shí)現(xiàn)個(gè)性化的聲音輸出。
零樣本跨語(yǔ)言聲音克隆: 即使某些語(yǔ)言未在訓(xùn)練集中出現(xiàn)，OpenVoice 也能實(shí)現(xiàn)聲音復(fù)制。
高效的計(jì)算性能: 相比于市場(chǎng)上現(xiàn)有的商業(yè)API，OpenVoice 在保持高性能的同時(shí)，計(jì)算成本大大降低。

OpenVoice V2新特性:

更好的音頻質(zhì)量: 采用新的訓(xùn)練策略提升音頻質(zhì)量。
原生多語(yǔ)言支持: 原生支持英語(yǔ)、西班牙語(yǔ)、法語(yǔ)、中文、日語(yǔ)和韓語(yǔ)。
集成 MeloTTS: V2版本引入了 MeloTTS 技術(shù)，增強(qiáng)了聲音的自然度和表現(xiàn)力。
免費(fèi)商業(yè)使用: 自2024年4月起，V1和V2版本均以 MIT 許可證發(fā)布，支持商業(yè)和研究用途的免費(fèi)使用。

技術(shù)方法:

聲音樣式和語(yǔ)言的解耦設(shè)計(jì): OpenVoice 的設(shè)計(jì)哲學(xué)是將聲音的不同特性進(jìn)行解耦，使得可以獨(dú)立控制各個(gè)參數(shù)，提高操作的靈活性和推斷速度。

基礎(chǔ)發(fā)音者 TTS 模型與音色轉(zhuǎn)換器: 包括允許對(duì)風(fēng)格參數(shù)進(jìn)行控制的基礎(chǔ)發(fā)音者 TTS 模型，以及采用編碼器-解碼器結(jié)構(gòu)的音色轉(zhuǎn)換器。

訓(xùn)練策略和數(shù)據(jù)處理: 在訓(xùn)練過(guò)程中，使用了大量的多語(yǔ)種、多風(fēng)格的音頻樣本，并采用特定的損失函數(shù)確保在保留風(fēng)格的同時(shí)去除或轉(zhuǎn)換音色。

官網(wǎng)：https://research.myshell.ai/open-voice

項(xiàng)目地址：https://top.aibase.com/tool/openvoice

創(chuàng)建自己的語(yǔ)音機(jī)器人：https://myshell.ai/

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

風(fēng)格越野新品類即將登場(chǎng)，iCAR V23定檔12月16日正式上市

iCAR汽車官宣，A級(jí)新能源風(fēng)格越野SUV——iCARV23將于12月16日正式上市，上市后V23也將同步開(kāi)啟批量交付，新車融合復(fù)古經(jīng)典元素以及新能源時(shí)代的數(shù)碼精致感，提供兩驅(qū)和四驅(qū)兩種動(dòng)力版本，以全新設(shè)計(jì)理念和用戶洞察，開(kāi)啟風(fēng)格越野品類。自廣州車展開(kāi)啟預(yù)售后，iCARV23訂單量8小時(shí)突破31000輛，刷新iCAR品牌訂單紀(jì)錄。iCARV23即將正式上市，試駕車也已陸續(xù)到店，新車還會(huì)帶來(lái)哪?

?iCAR ?V23 ?新能源SUV
特斯拉FSD V13.2版發(fā)布：原生Al4輸入實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)自動(dòng)駕駛

特斯拉公司在自動(dòng)駕駛技術(shù)領(lǐng)域取得了新的進(jìn)展，其最新發(fā)布的FSDV13.2版本在實(shí)測(cè)中展現(xiàn)了卓越的性能。這一版本被眾多資深用戶評(píng)價(jià)為特斯拉歷史上最強(qiáng)大的FSD版本，其“點(diǎn)對(duì)點(diǎn)”自動(dòng)駕駛能力標(biāo)志著特斯拉在自動(dòng)駕駛技術(shù)上的一大飛躍。系統(tǒng)現(xiàn)在能夠動(dòng)態(tài)繞過(guò)道路封閉區(qū)域，并在車隊(duì)檢測(cè)到這些情況時(shí)在受影響的路線中顯示相關(guān)信息。

?特斯拉 ?自動(dòng)駕駛 ?FSD
重磅開(kāi)源！小米自研系統(tǒng)Vela已全面開(kāi)源：OpenVela亮相GitHub、Gitee

小米自研系統(tǒng)Vela已全面開(kāi)源，OpenVela項(xiàng)目已上線GitHub和Gitee，采用的是比較寬松的Apache2.0協(xié)議。早在2023年的小米IoT生態(tài)伙伴大會(huì)上，小米集團(tuán)曾學(xué)忠就曾宣布，小米自研系統(tǒng)將Vela面向全球軟硬件開(kāi)發(fā)者正式開(kāi)源。豐富的開(kāi)發(fā)者工具：openvela提供了一系列完備的開(kāi)發(fā)者工具，包括系統(tǒng)監(jiān)控、性能分析、調(diào)試器、追蹤、崩潰分析和日志分析工具，為開(kāi)發(fā)者提供了強(qiáng)大的支持。

?小米Vela系統(tǒng) ?開(kāi)源操作系統(tǒng) ?AIoT技術(shù)
奇瑞iCar V23上市后遭大量車主退訂：負(fù)責(zé)人緊急調(diào)整權(quán)益

日前，備受期待的奇瑞iCarV23方盒子純電SUV正式上市，限時(shí)起售價(jià)僅9.98萬(wàn)元，看起來(lái)相當(dāng)實(shí)惠。這款車在上市之前被普遍看好，究其原因，就在于設(shè)計(jì)實(shí)在是太可了，完美融合時(shí)尚與經(jīng)典，絕對(duì)是今年顏值最高的車之一，然讓人意外的是，上市當(dāng)晚，大批量小定車主紛紛退單。亡羊補(bǔ)牢為時(shí)未晚，知錯(cuò)能改善莫大焉，希望這次的權(quán)益調(diào)整能夠給V23保留和帶來(lái)更多銷量，這也再次給車企敲響了警鐘：良好的開(kāi)局并不等于良好的結(jié)尾，永遠(yuǎn)站在用戶的角度上思考，才能打造出真正的爆款。

?奇瑞iCar ?V23 ?方盒子SUV
薦突發(fā)！OpenAI發(fā)布Canvas，ChatGPT新增史詩(shī)級(jí)功能

今天凌晨2點(diǎn)，OpenAI開(kāi)啟了第四天技術(shù)直播，發(fā)布了最新功能Canvas。Canvas直接內(nèi)置在ChatGPT中，提供了一個(gè)單獨(dú)的窗口，主要用于編程、寫(xiě)作任務(wù)，會(huì)提供意見(jiàn)、審核和執(zhí)行具體的功能，可以提供更細(xì)致的服務(wù)。倘若用戶需要將代碼轉(zhuǎn)換至不同的編程語(yǔ)言，Canvas同樣提供了一鍵移植的實(shí)用功能。

?Canvas
悅靈犀AI發(fā)布2.5版本，技術(shù)創(chuàng)新與應(yīng)用能力再突破

北京2024年12月10日，以技術(shù)驅(qū)動(dòng)的新一代移動(dòng)互聯(lián)網(wǎng)基礎(chǔ)設(shè)施與平臺(tái)服務(wù)提供商悅享控股有限公司今日宣布，悅靈犀AI更新發(fā)布功能更為強(qiáng)大的2.5版本，本次更新不僅在技術(shù)方面有了進(jìn)一步創(chuàng)新突破在應(yīng)用層面集成了一套創(chuàng)新性AI應(yīng)用工具集，通過(guò)全面優(yōu)化技術(shù)架構(gòu)再次提升了應(yīng)用能力，為內(nèi)容創(chuàng)作者提供智能、高效、便捷的應(yīng)用創(chuàng)作工具解決方案。技術(shù)創(chuàng)新：全流程智能創(chuàng)作工具集悅靈犀AI發(fā)布更新后的2.5版本，推出了一套覆蓋文本生成、文生圖、圖像處理、視頻生成等核心功能為一體的應(yīng)用工具集，重構(gòu)了內(nèi)容創(chuàng)作的生產(chǎn)流程。隨著悅靈犀AI多模態(tài)產(chǎn)品的持續(xù)迭代更新，悅靈犀AI將持續(xù)研發(fā)更多專業(yè)場(chǎng)景工具，擴(kuò)大AI工具的適用領(lǐng)域，為不同行業(yè)提供定制化的解決方案，加快推動(dòng)智能創(chuàng)作技術(shù)的普及和應(yīng)用。

?移動(dòng)互聯(lián)網(wǎng) ?AI應(yīng)用工具 ?技術(shù)創(chuàng)新
高通進(jìn)軍桌面PC處理器市場(chǎng)！驍龍X Elite 2將推臺(tái)式機(jī)版本

高通代號(hào)為ProjectGlymur”的驍龍XElite2項(xiàng)目，已經(jīng)取得了不錯(cuò)的進(jìn)展，并且還將涉足桌面PC處理器市場(chǎng)。驍龍XElite系列芯片已經(jīng)有三個(gè)版本，分別為X1E-78-100、X1E-80-100和X1E-84-100，這些芯片主要用于筆記本電腦。高通CEOCristianoAmon曾在2024年的SnapdragonSummit上確認(rèn)，下一代驍龍X系列將帶來(lái)真正不可思議”的升級(jí)，并表示將為計(jì)算性能帶來(lái)樂(lè)趣和興奮。

?高通 ?驍龍X ?Elite
薦AI日?qǐng)?bào)：王炸！Anthropic開(kāi)源模型上下文協(xié)議MCP；阿里?通義App上線局部風(fēng)格化功能； Kimi 數(shù)學(xué)版上線

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、萬(wàn)物皆可一鍵毛茸茸!阿里通義App上線“局部風(fēng)格化”功能通義App最近推出的“局部風(fēng)格化”功能引發(fā)了社交平臺(tái)的熱潮。這項(xiàng)研究強(qiáng)調(diào)了AI電腦在任務(wù)處理、隱私保護(hù)和自適應(yīng)學(xué)?

?人工智能 ?AI產(chǎn)品 ?圖像編輯
阿里低調(diào)發(fā)布：夸克原生鴻蒙新版本悄然上線

今天，夸克原生鴻蒙新版本悄然上架了應(yīng)用商店。當(dāng)前版本為測(cè)試版本，支持的主要功能為夸克搜索、夸克網(wǎng)盤(pán)、夸克小說(shuō)、夸克熱搜和夸克日?qǐng)?bào)等，官方表示其他相關(guān)功能還在持續(xù)迭代完善中。華為徐直軍曾提到，10萬(wàn)個(gè)應(yīng)用是鴻蒙生態(tài)滿足消費(fèi)者需求的成熟標(biāo)志，這也是鴻蒙生態(tài)未來(lái)半年到一年的關(guān)鍵目標(biāo)。

?鴻蒙應(yīng)用 ?夸克更新 ?阿里華為合作
微信原生鴻蒙版發(fā)布1.0.2.35版本更新：完善聊天圖片發(fā)送/查看、群聊折疊

全新的微信原生鴻蒙版已上架華為應(yīng)用市場(chǎng)應(yīng)用嘗鮮專區(qū)，版本號(hào)為1.0.2.35。測(cè)試說(shuō)明顯示，該版本完善了聊天圖片發(fā)送/查看等能力，支持群聊折疊等功能。騰訊公司公關(guān)總監(jiān)張軍回復(fù)表示，非常感謝博主發(fā)現(xiàn)重大bug，他們已經(jīng)修復(fù)。

?微信鴻蒙版 ?華為應(yīng)用市場(chǎng) ?聊天功能優(yōu)化

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

OpenVoice V2版本發(fā)布能對(duì)聲音風(fēng)格進(jìn)行精細(xì)控制

風(fēng)格越野新品類即將登場(chǎng)，iCAR V23定檔12月16日正式上市

特斯拉FSD V13.2版發(fā)布：原生Al4輸入實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)自動(dòng)駕駛

重磅開(kāi)源！小米自研系統(tǒng)Vela已全面開(kāi)源：OpenVela亮相GitHub、Gitee

奇瑞iCar V23上市后遭大量車主退訂：負(fù)責(zé)人緊急調(diào)整權(quán)益

薦突發(fā)！OpenAI發(fā)布Canvas，ChatGPT新增史詩(shī)級(jí)功能

悅靈犀AI發(fā)布2.5版本，技術(shù)創(chuàng)新與應(yīng)用能力再突破

高通進(jìn)軍桌面PC處理器市場(chǎng)！驍龍X Elite 2將推臺(tái)式機(jī)版本

薦AI日?qǐng)?bào)：王炸！Anthropic開(kāi)源模型上下文協(xié)議MCP；阿里?通義App上線局部風(fēng)格化功能； Kimi 數(shù)學(xué)版上線

阿里低調(diào)發(fā)布：夸克原生鴻蒙新版本悄然上線

微信原生鴻蒙版發(fā)布1.0.2.35版本更新：完善聊天圖片發(fā)送/查看、群聊折疊

熱文

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車?yán)m(xù)航之王

沒(méi)網(wǎng)也能聯(lián)絡(luò)！小米15系列星辰無(wú)網(wǎng)通12月底升級(jí)6km級(jí)通話范圍

消息稱OpenAI新模型GPT-5研發(fā)未達(dá)到預(yù)期：成本高昂效果欠佳

李斌回應(yīng)螢火蟲(chóng)外觀設(shè)計(jì)：看過(guò)實(shí)車的人都喜歡這個(gè)設(shè)計(jì)

央視曝光未成年人繞開(kāi)防沉迷只需4元：通過(guò)租用游戲賬號(hào)規(guī)避

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛(ài)上我

美團(tuán)：冬至期間將針對(duì)餃子等應(yīng)時(shí)食品訂單提供“超時(shí)保護(hù)”

QQ音樂(lè)年度聽(tīng)歌報(bào)告發(fā)布：誰(shuí)是你最喜歡的歌手？

FF再獲3000萬(wàn)美元新一輪融資加速第二品牌FX戰(zhàn)略推進(jìn)

英偉達(dá)AI芯片最大買家揭曉！微軟力壓同行霸榜

微信朋友圈崩了上熱搜騰訊客服：請(qǐng)嘗試這幾種方法

極越員工萬(wàn)字怒懟ceo：公關(guān)總監(jiān)徐繼業(yè)怒罵員工蒼蠅

小紅書(shū)封號(hào)上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

馬斯克將推出X Mail電子郵箱服務(wù)

極越員工善后方案已出爐：?jiǎn)T工獲“N+1”賠償由百度吉利出資

螞蟻集團(tuán)否認(rèn)借殼上市：目前沒(méi)有上市計(jì)劃

未成年人成部分博主流量密碼抖音治理涉“網(wǎng)紅兒童”違規(guī)內(nèi)容

小紅書(shū)被吐槽無(wú)理由封號(hào) 客服回應(yīng)：未說(shuō)明處罰時(shí)間就是永封

站長(zhǎng)商機(jī)

OpenVoice V2版本發(fā)布 能對(duì)聲音風(fēng)格進(jìn)行精細(xì)控制

熱文

站長(zhǎng)商機(jī)

OpenVoice V2版本發(fā)布能對(duì)聲音風(fēng)格進(jìn)行精細(xì)控制