幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > OpenVoice最新資訊  > 正文

OpenVoice V2版本發(fā)布 能對(duì)聲音風(fēng)格進(jìn)行精細(xì)控制

2024-04-26 09:41 · 稿源:站長(zhǎng)之家

站長(zhǎng)之家(ChinaZ.com)4月26日 消息:MyShell TTS 開(kāi)發(fā)的 OpenVoice 是一項(xiàng)創(chuàng)新的聲音克隆技術(shù),它能夠通過(guò)僅使用一小段參考發(fā)言者的音頻片段來(lái)復(fù)制其聲音,并生成多種語(yǔ)言的語(yǔ)音。

QQ截圖20240426094050.png

目前,MyShell TTS 已經(jīng)推出了全新的OpenVoice V2版本。這個(gè)版本能夠直接支持英語(yǔ)、西班牙語(yǔ)、法語(yǔ)、中文、日語(yǔ)以及韓語(yǔ),并且顯著提高了音頻輸出的質(zhì)量。OpenVoice V2擁有復(fù)制任意聲音的能力,能以多種語(yǔ)言進(jìn)行語(yǔ)音輸出,并具備情感和口音的控制功能。它不但可以準(zhǔn)確模仿特定的聲音色彩,還允許對(duì)聲音的風(fēng)格,包括情感、口音、節(jié)奏、停頓及語(yǔ)調(diào)等進(jìn)行細(xì)致調(diào)整。

主要功能:

  • 準(zhǔn)確的音色克隆: OpenVoice 能夠精確地克隆參考音色,并在多種語(yǔ)言和口音中生成語(yǔ)音。

  • 靈活的聲音風(fēng)格控制: 用戶可以對(duì)聲音的情緒、口音、節(jié)奏、停頓和語(yǔ)調(diào)進(jìn)行詳細(xì)調(diào)整,實(shí)現(xiàn)個(gè)性化的聲音輸出。

  • 零樣本跨語(yǔ)言聲音克隆: 即使某些語(yǔ)言未在訓(xùn)練集中出現(xiàn),OpenVoice 也能實(shí)現(xiàn)聲音復(fù)制。

  • 高效的計(jì)算性能: 相比于市場(chǎng)上現(xiàn)有的商業(yè)API,OpenVoice 在保持高性能的同時(shí),計(jì)算成本大大降低。

OpenVoice V2新特性:

  • 更好的音頻質(zhì)量: 采用新的訓(xùn)練策略提升音頻質(zhì)量。

  • 原生多語(yǔ)言支持: 原生支持英語(yǔ)、西班牙語(yǔ)、法語(yǔ)、中文、日語(yǔ)和韓語(yǔ)。

  • 集成 MeloTTS: V2版本引入了 MeloTTS 技術(shù),增強(qiáng)了聲音的自然度和表現(xiàn)力。

  • 免費(fèi)商業(yè)使用: 自2024年4月起,V1和V2版本均以 MIT 許可證發(fā)布,支持商業(yè)和研究用途的免費(fèi)使用。

技術(shù)方法:

聲音樣式和語(yǔ)言的解耦設(shè)計(jì): OpenVoice 的設(shè)計(jì)哲學(xué)是將聲音的不同特性進(jìn)行解耦,使得可以獨(dú)立控制各個(gè)參數(shù),提高操作的靈活性和推斷速度。

基礎(chǔ)發(fā)音者 TTS 模型與音色轉(zhuǎn)換器: 包括允許對(duì)風(fēng)格參數(shù)進(jìn)行控制的基礎(chǔ)發(fā)音者 TTS 模型,以及采用編碼器-解碼器結(jié)構(gòu)的音色轉(zhuǎn)換器。

訓(xùn)練策略和數(shù)據(jù)處理: 在訓(xùn)練過(guò)程中,使用了大量的多語(yǔ)種、多風(fēng)格的音頻樣本,并采用特定的損失函數(shù)確保在保留風(fēng)格的同時(shí)去除或轉(zhuǎn)換音色。

官網(wǎng):https://research.myshell.ai/open-voice

項(xiàng)目地址:https://top.aibase.com/tool/openvoice

創(chuàng)建自己的語(yǔ)音機(jī)器人:https://myshell.ai/

舉報(bào)

  • 相關(guān)推薦
  • 風(fēng)格越野新品類即將登場(chǎng),iCAR V23定檔12月16日正式上市

    iCAR汽車官宣,A級(jí)新能源風(fēng)格越野SUV——iCARV23將于12月16日正式上市,上市后V23也將同步開(kāi)啟批量交付,新車融合復(fù)古經(jīng)典元素以及新能源時(shí)代的數(shù)碼精致感,提供兩驅(qū)和四驅(qū)兩種動(dòng)力版本,以全新設(shè)計(jì)理念和用戶洞察,開(kāi)啟風(fēng)格越野品類。自廣州車展開(kāi)啟預(yù)售后,iCARV23訂單量8小時(shí)突破31000輛,刷新iCAR品牌訂單紀(jì)錄。iCARV23即將正式上市,試駕車也已陸續(xù)到店,新車還會(huì)帶來(lái)哪?

  • 特斯拉FSD V13.2版發(fā)布:原生Al4輸入 實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)自動(dòng)駕駛

    特斯拉公司在自動(dòng)駕駛技術(shù)領(lǐng)域取得了新的進(jìn)展,其最新發(fā)布的FSDV13.2版本在實(shí)測(cè)中展現(xiàn)了卓越的性能。這一版本被眾多資深用戶評(píng)價(jià)為特斯拉歷史上最強(qiáng)大的FSD版本,其“點(diǎn)對(duì)點(diǎn)”自動(dòng)駕駛能力標(biāo)志著特斯拉在自動(dòng)駕駛技術(shù)上的一大飛躍。系統(tǒng)現(xiàn)在能夠動(dòng)態(tài)繞過(guò)道路封閉區(qū)域,并在車隊(duì)檢測(cè)到這些情況時(shí)在受影響的路線中顯示相關(guān)信息。

  • 重磅開(kāi)源!小米自研系統(tǒng)Vela已全面開(kāi)源:OpenVela亮相GitHub、Gitee

    小米自研系統(tǒng)Vela已全面開(kāi)源,OpenVela項(xiàng)目已上線GitHub和Gitee,采用的是比較寬松的Apache2.0協(xié)議。早在2023年的小米IoT生態(tài)伙伴大會(huì)上,小米集團(tuán)曾學(xué)忠就曾宣布,小米自研系統(tǒng)將Vela面向全球軟硬件開(kāi)發(fā)者正式開(kāi)源。豐富的開(kāi)發(fā)者工具:openvela提供了一系列完備的開(kāi)發(fā)者工具,包括系統(tǒng)監(jiān)控、性能分析、調(diào)試器、追蹤、崩潰分析和日志分析工具,為開(kāi)發(fā)者提供了強(qiáng)大的支持。

  • 奇瑞iCar V23上市后遭大量車主退訂:負(fù)責(zé)人緊急調(diào)整權(quán)益

    日前,備受期待的奇瑞iCarV23方盒子純電SUV正式上市,限時(shí)起售價(jià)僅9.98萬(wàn)元,看起來(lái)相當(dāng)實(shí)惠。這款車在上市之前被普遍看好,究其原因,就在于設(shè)計(jì)實(shí)在是太可了,完美融合時(shí)尚與經(jīng)典,絕對(duì)是今年顏值最高的車之一,然讓人意外的是,上市當(dāng)晚,大批量小定車主紛紛退單。亡羊補(bǔ)牢為時(shí)未晚,知錯(cuò)能改善莫大焉,希望這次的權(quán)益調(diào)整能夠給V23保留和帶來(lái)更多銷量,這也再次給車企敲響了警鐘:良好的開(kāi)局并不等于良好的結(jié)尾,永遠(yuǎn)站在用戶的角度上思考,才能打造出真正的爆款。

  • 突發(fā)!OpenAI發(fā)布Canvas,ChatGPT新增史詩(shī)級(jí)功能

    今天凌晨2點(diǎn),OpenAI開(kāi)啟了第四天技術(shù)直播,發(fā)布了最新功能Canvas。Canvas直接內(nèi)置在ChatGPT中,提供了一個(gè)單獨(dú)的窗口,主要用于編程、寫(xiě)作任務(wù),會(huì)提供意見(jiàn)、審核和執(zhí)行具體的功能,可以提供更細(xì)致的服務(wù)。倘若用戶需要將代碼轉(zhuǎn)換至不同的編程語(yǔ)言,Canvas同樣提供了一鍵移植的實(shí)用功能。

  • 悅靈犀AI發(fā)布2.5版本,技術(shù)創(chuàng)新與應(yīng)用能力再突破

    北京2024年12月10日,以技術(shù)驅(qū)動(dòng)的新一代移動(dòng)互聯(lián)網(wǎng)基礎(chǔ)設(shè)施與平臺(tái)服務(wù)提供商悅享控股有限公司今日宣布,悅靈犀AI更新發(fā)布功能更為強(qiáng)大的2.5版本,本次更新不僅在技術(shù)方面有了進(jìn)一步創(chuàng)新突破在應(yīng)用層面集成了一套創(chuàng)新性AI應(yīng)用工具集,通過(guò)全面優(yōu)化技術(shù)架構(gòu)再次提升了應(yīng)用能力,為內(nèi)容創(chuàng)作者提供智能、高效、便捷的應(yīng)用創(chuàng)作工具解決方案。技術(shù)創(chuàng)新:全流程智能創(chuàng)作工具集悅靈犀AI發(fā)布更新后的2.5版本,推出了一套覆蓋文本生成、文生圖、圖像處理、視頻生成等核心功能為一體的應(yīng)用工具集,重構(gòu)了內(nèi)容創(chuàng)作的生產(chǎn)流程。隨著悅靈犀AI多模態(tài)產(chǎn)品的持續(xù)迭代更新,悅靈犀AI將持續(xù)研發(fā)更多專業(yè)場(chǎng)景工具,擴(kuò)大AI工具的適用領(lǐng)域,為不同行業(yè)提供定制化的解決方案,加快推動(dòng)智能創(chuàng)作技術(shù)的普及和應(yīng)用。

  • 高通進(jìn)軍桌面PC處理器市場(chǎng)!驍龍X Elite 2將推臺(tái)式機(jī)版本

    高通代號(hào)為ProjectGlymur”的驍龍XElite2項(xiàng)目,已經(jīng)取得了不錯(cuò)的進(jìn)展,并且還將涉足桌面PC處理器市場(chǎng)。驍龍XElite系列芯片已經(jīng)有三個(gè)版本,分別為X1E-78-100、X1E-80-100和X1E-84-100,這些芯片主要用于筆記本電腦。高通CEOCristianoAmon曾在2024年的SnapdragonSummit上確認(rèn),下一代驍龍X系列將帶來(lái)真正不可思議”的升級(jí),并表示將為計(jì)算性能帶來(lái)樂(lè)趣和興奮。

  • AI日?qǐng)?bào):王炸!Anthropic開(kāi)源模型上下文協(xié)議MCP;阿里?通義App上線局部風(fēng)格化功能; Kimi 數(shù)學(xué)上線

    歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、萬(wàn)物皆可一鍵毛茸茸!阿里通義App上線“局部風(fēng)格化”功能通義App最近推出的“局部風(fēng)格化”功能引發(fā)了社交平臺(tái)的熱潮。這項(xiàng)研究強(qiáng)調(diào)了AI電腦在任務(wù)處理、隱私保護(hù)和自適應(yīng)學(xué)?

  • 阿里低調(diào)發(fā)布:夸克原生鴻蒙新版本悄然上線

    今天,夸克原生鴻蒙新版本悄然上架了應(yīng)用商店。當(dāng)前版本為測(cè)試版本,支持的主要功能為夸克搜索、夸克網(wǎng)盤(pán)、夸克小說(shuō)、夸克熱搜和夸克日?qǐng)?bào)等,官方表示其他相關(guān)功能還在持續(xù)迭代完善中。華為徐直軍曾提到,10萬(wàn)個(gè)應(yīng)用是鴻蒙生態(tài)滿足消費(fèi)者需求的成熟標(biāo)志,這也是鴻蒙生態(tài)未來(lái)半年到一年的關(guān)鍵目標(biāo)。

  • 微信原生鴻蒙發(fā)布1.0.2.35版本更新:完善聊天圖片發(fā)送/查看、群聊折疊

    全新的微信原生鴻蒙版已上架華為應(yīng)用市場(chǎng)應(yīng)用嘗鮮專區(qū),版本號(hào)為1.0.2.35。測(cè)試說(shuō)明顯示,該版本完善了聊天圖片發(fā)送/查看等能力,支持群聊折疊等功能。騰訊公司公關(guān)總監(jiān)張軍回復(fù)表示,非常感謝博主發(fā)現(xiàn)重大bug,他們已經(jīng)修復(fù)。

熱文

  • 3 天
  • 7天