幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > 微軟最新資訊  > 正文

微軟發(fā)布聲音克隆技術(shù)Personal Voice 提供1分鐘樣本即可生成AI語(yǔ)音

2023-11-17 11:01 · 稿源:站長(zhǎng)之家

站長(zhǎng)之家(ChinaZ.com)11月17日 消息:微軟近日發(fā)布了一項(xiàng)名為Personal Voice的新技術(shù),該技術(shù)可以克隆用戶的聲音,并且能夠復(fù)制出與原聲音完全一致的人工智能語(yǔ)音。用戶只需提供1分鐘的語(yǔ)音樣本,Personal Voice就能在幾秒鐘內(nèi)生成相應(yīng)的AI語(yǔ)音。

這項(xiàng)技術(shù)支持多達(dá)100種不同語(yǔ)言的語(yǔ)音輸出,包括中文、西班牙語(yǔ)、德語(yǔ)等。Personal Voice利用設(shè)備端的機(jī)器學(xué)習(xí)技術(shù),確保用戶的個(gè)人信息安全,并與LiveSpeech進(jìn)行無(wú)縫集成,讓用戶在與他人交流時(shí)可以使用Personal Voice的AI語(yǔ)音。

image.png

除了為語(yǔ)音助手、游戲、語(yǔ)言配音等應(yīng)用提供個(gè)性化聲音,Personal Voice還在娛樂(lè)、媒體領(lǐng)域有著廣泛的應(yīng)用。通過(guò)將用戶的本聲配音應(yīng)用于故事、有聲書(shū)、播客、視頻等內(nèi)容,可以使這些內(nèi)容更加貼近用戶,提升沉浸感。

微軟還和海爾合作,將個(gè)性化聲音引入其智能音箱和更智能的家電產(chǎn)品中,為品牌帶來(lái)了創(chuàng)新的用戶體驗(yàn)。微軟的Personal Voice功能為用戶提供了在短時(shí)間內(nèi)實(shí)時(shí)復(fù)制自己聲音的機(jī)會(huì),使智能音箱更具家庭氛圍,豐富了用戶的生活。

該功能將在西歐、美國(guó)東部和東南亞地區(qū)率先上線,并于12月1日上線公共預(yù)覽版。

微軟強(qiáng)調(diào)了Personal Voice的責(zé)任使用。用戶必須明確同意并錄制聲明,以確保對(duì)個(gè)人和社會(huì)權(quán)益的保護(hù)。微軟承諾以有限的注冊(cè)方式提供Personal Voice,僅限于特定用途。符合資格的客戶可以將Personal Voice API集成到支持個(gè)性化聲音的應(yīng)用中,包括智能設(shè)備的語(yǔ)音助手和游戲中角色聲音的定制。

此外,微軟還在Personal Voice生成的聲音中添加水印,以便用戶可以識(shí)別是否使用了Azure AI Speech,并確定使用的是哪個(gè)聲音。這為合規(guī)性和透明性提供了一層保障。

舉報(bào)

  • 相關(guān)推薦
  • 大家在看
  • CogVideoX1.5-5B-SAT:開(kāi)源視頻生成模型,支持10秒視頻和更高分辨率。

    CogVideoX1.5-5B-SAT是由清華大學(xué)知識(shí)工程與數(shù)據(jù)挖掘團(tuán)隊(duì)開(kāi)發(fā)的開(kāi)源視頻生成模型,是CogVideoX模型的升級(jí)版。該模型支持生成10秒視頻,并支持更高分辨率的視頻生成。模型包含Transformer、VAE和Text Encoder等模塊,能夠根據(jù)文本描述生成視頻內(nèi)容。CogVideoX1.5-5B-SAT模型以其強(qiáng)大的視頻生成能力和高分辨率支持,為視頻內(nèi)容創(chuàng)作者提供了一個(gè)強(qiáng)大的工具,尤其在教育、娛樂(lè)和商業(yè)領(lǐng)域有著廣泛的應(yīng)用前景。

  • Ask The Post AI:華盛頓郵報(bào)的AI問(wèn)答產(chǎn)品

    Ask The Post AI是華盛頓郵報(bào)推出的一款基于人工智能的產(chǎn)品,它允許讀者就自2016年以來(lái)發(fā)布的所有報(bào)道提出問(wèn)題。該產(chǎn)品利用生成式AI技術(shù)和對(duì)話格式,依托華盛頓郵報(bào)長(zhǎng)期以來(lái)基于事實(shí)、深入報(bào)道的新聞傳統(tǒng),以新的方式取悅并通知讀者。Ask The Post AI通過(guò)機(jī)器學(xué)習(xí)團(tuán)隊(duì)對(duì)Climate Answers工具的數(shù)據(jù)進(jìn)行提煉,優(yōu)化了如何檢索和匹配自2016年以來(lái)新聞室發(fā)布的所有報(bào)道中與用戶查詢相關(guān)的相關(guān)文章。

  • Mistral Moderation API:AI內(nèi)容審核服務(wù),保護(hù)下游部署安全。

    Mistral Moderation API是Mistral AI推出的內(nèi)容審核服務(wù),旨在幫助用戶檢測(cè)和過(guò)濾不受歡迎的文本內(nèi)容。該API是Le Chat中使用的審核服務(wù)的同一技術(shù),現(xiàn)在對(duì)外開(kāi)放,以便用戶可以根據(jù)特定的應(yīng)用和安全標(biāo)準(zhǔn)定制和使用這一工具。該模型是一個(gè)基于LLM(大型語(yǔ)言模型)的分類器,能夠?qū)⑽谋据斎敕诸惖?個(gè)預(yù)定義的類別中。Mistral AI的這一API支持原生多語(yǔ)言,特別針對(duì)阿拉伯語(yǔ)、中文、英語(yǔ)、法語(yǔ)、德語(yǔ)、意大利語(yǔ)、日語(yǔ)、韓語(yǔ)、葡萄牙語(yǔ)、俄語(yǔ)和西班牙語(yǔ)進(jìn)行了訓(xùn)練。該API的主要優(yōu)點(diǎn)包括提高審核的可擴(kuò)展性和魯棒性,以及通過(guò)技術(shù)文檔提供的詳細(xì)政策定義和啟動(dòng)指南,幫助用戶有效實(shí)施系統(tǒng)級(jí)的安全防護(hù)。

  • Medio AI:AI編輯工具,助力企業(yè)視頻營(yíng)銷本地化。

    Medio AI是一個(gè)為企業(yè)提供AI編輯工具的平臺(tái),專注于視頻翻譯和視頻配音,幫助企業(yè)無(wú)畏全球擴(kuò)張,實(shí)現(xiàn)視頻營(yíng)銷的本地化。產(chǎn)品背景信息顯示,Medio AI旨在幫助企業(yè)探索更多海外市場(chǎng),通過(guò)AI技術(shù)提升視頻編輯效率,增強(qiáng)產(chǎn)品在國(guó)際市場(chǎng)上的競(jìng)爭(zhēng)力。產(chǎn)品的主要優(yōu)點(diǎn)包括無(wú)需下載、在線使用、一鍵去除視頻水印、產(chǎn)品翻譯、視頻配音等。價(jià)格方面,Medio AI提供免費(fèi)試用,并根據(jù)不同的功能需求提供不同的付費(fèi)版本。

  • PodExtra AI:釋放播客的力量,用AI提升播客收聽(tīng)體驗(yàn)

    PodExtra AI是一款先進(jìn)的AI工具,專為播客收聽(tīng)和知識(shí)獲取設(shè)計(jì)。它通過(guò)生成播客內(nèi)容的摘要、思維導(dǎo)圖、大綱、亮點(diǎn)和要點(diǎn),幫助用戶快速把握播客的核心內(nèi)容。產(chǎn)品背景信息顯示,播客愛(ài)好者平均每周消費(fèi)超過(guò)8集,全球有超過(guò)400萬(wàn)的節(jié)目可供選擇。PodExtra AI通過(guò)AI技術(shù),使得用戶能夠快速瀏覽內(nèi)容,節(jié)省時(shí)間,提高效率。產(chǎn)品定位于幫助用戶從海量播客內(nèi)容中快速獲取有價(jià)值的信息,特別適合時(shí)間緊張但希望從播客中獲取知識(shí)的人群。

  • 語(yǔ)鯨:,智能語(yǔ)言處理平臺(tái)

    語(yǔ)鯨是一個(gè)專注于語(yǔ)言處理的平臺(tái),它利用先進(jìn)的自然語(yǔ)言處理技術(shù),為用戶提供文本分析、翻譯、校對(duì)等服務(wù)。產(chǎn)品背景信息顯示,語(yǔ)鯨旨在幫助用戶提高寫(xiě)作效率和質(zhì)量,特別是在多語(yǔ)言環(huán)境中。語(yǔ)鯨的價(jià)格定位尚未明確,但考慮到其提供的服務(wù),可能會(huì)有免費(fèi)試用和付費(fèi)版本。

  • CR-Mentor:AI驅(qū)動(dòng)的代碼審查導(dǎo)師,提升代碼質(zhì)量和審查效率。

    CR-Mentor AI CodeReview Mentor是一個(gè)基于人工智能的代碼審查工具,它通過(guò)積累的最佳實(shí)踐知識(shí)庫(kù)和大型語(yǔ)言模型(LLM)分析,為主流編程語(yǔ)言提供智能代碼審查。該產(chǎn)品支持自定義的代碼審查標(biāo)準(zhǔn),能夠?yàn)閱蝹€(gè)文件代碼變更提供專業(yè)評(píng)分和改進(jìn)建議,并通過(guò)LLM生成全面的審查報(bào)告,包括代碼走查、變更描述和時(shí)序圖。它與GitHub工作流程深度集成,實(shí)現(xiàn)自動(dòng)化代碼審查,支持多語(yǔ)言反饋,幫助整個(gè)團(tuán)隊(duì)提升代碼質(zhì)量和審查效率。

  • Srcbook:開(kāi)源、自托管、AI驅(qū)動(dòng)的應(yīng)用構(gòu)建器。

    Srcbook是一個(gè)開(kāi)源、自托管的AI驅(qū)動(dòng)應(yīng)用構(gòu)建器,它允許用戶快速構(gòu)建和部署各種應(yīng)用程序。產(chǎn)品背景信息顯示,Srcbook旨在提供一個(gè)平臺(tái),讓開(kāi)發(fā)者和非技術(shù)用戶都能夠輕松地構(gòu)建應(yīng)用程序,從而提高生產(chǎn)力和創(chuàng)新能力。它支持多種應(yīng)用場(chǎng)景,如項(xiàng)目管理工具、音樂(lè)發(fā)現(xiàn)頁(yè)面、技術(shù)文檔網(wǎng)站等。Srcbook的主要優(yōu)點(diǎn)包括開(kāi)源性、靈活性和易用性,用戶可以根據(jù)自己的需求定制和擴(kuò)展功能。

  • ReCapture:用戶視頻的生成性視頻攝像機(jī)控制

    ReCapture是一種從單一用戶提供的視頻生成新視頻和新穎攝像機(jī)軌跡的方法。該技術(shù)允許我們從完全不同的角度重新生成源視頻,并帶有電影級(jí)別的攝像機(jī)運(yùn)動(dòng)。ReCapture通過(guò)使用多視圖擴(kuò)散模型或基于深度的點(diǎn)云渲染生成帶有新攝像機(jī)軌跡的嘈雜錨視頻,然后通過(guò)我們提出的掩蔽視頻微調(diào)技術(shù)將錨視頻重新生成為干凈且時(shí)間上一致的重新角度視頻。這種技術(shù)的重要性在于它能夠利用視頻模型的強(qiáng)大先驗(yàn),將近似的視頻重新生成為時(shí)間上一致且美觀的視頻。

  • AI Tattoo Generator.net:快速創(chuàng)建個(gè)性化紋身設(shè)計(jì)

    AI Tattoo Generator是一個(gè)利用人工智能技術(shù)幫助用戶快速創(chuàng)建個(gè)性化紋身設(shè)計(jì)的在線平臺(tái)。該平臺(tái)使用先進(jìn)的機(jī)器學(xué)習(xí)算法,根據(jù)用戶輸入生成具有各種風(fēng)格的現(xiàn)實(shí)感紋身概念圖,確保用戶的想法以視覺(jué)上引人入勝的方式呈現(xiàn)。它不僅能夠提供即時(shí)的設(shè)計(jì)結(jié)果,還能讓用戶根據(jù)自己的偏好進(jìn)一步定制和細(xì)化設(shè)計(jì),滿足個(gè)性化需求。

  • Unfaked:AI生成的逼真圖片庫(kù)

    Unfaked是一個(gè)提供由人工智能生成的逼真圖片的網(wǎng)站,這些圖片幾乎可以以假亂真。用戶可以免費(fèi)下載并自由使用這些圖片。每周都會(huì)更新更多的圖片。這個(gè)平臺(tái)的重要性在于它為設(shè)計(jì)師、內(nèi)容創(chuàng)作者和營(yíng)銷人員提供了一個(gè)免費(fèi)的資源庫(kù),他們可以在這里找到高質(zhì)量的圖片資源,而無(wú)需擔(dān)心版權(quán)問(wèn)題。

  • ComfyUI-GIMM-VFI:基于GIMM-VFI的ComfyUI幀插值工具

    ComfyUI-GIMM-VFI是一個(gè)基于GIMM-VFI算法的幀插值工具,使用戶能夠在圖像和視頻處理中實(shí)現(xiàn)高質(zhì)量的幀插值效果。該技術(shù)通過(guò)在連續(xù)幀之間插入新的幀來(lái)提高視頻的幀率,從而使得動(dòng)作看起來(lái)更加流暢。這對(duì)于視頻游戲、電影后期制作和其他需要高幀率視頻的應(yīng)用場(chǎng)景尤為重要。產(chǎn)品背景信息顯示,它是基于Python開(kāi)發(fā)的,并且依賴于CuPy庫(kù),特別適用于需要進(jìn)行高性能計(jì)算的場(chǎng)景。

  • 5ire:簡(jiǎn)單易用,釋放AI的強(qiáng)大力量

    5ire是一個(gè)以簡(jiǎn)潔和用戶友好為核心的AI產(chǎn)品,旨在讓即使是初學(xué)者也能輕松利用大型語(yǔ)言模型。它支持多種文檔格式的解析和向量化,具備本地知識(shí)庫(kù)、使用分析、提示庫(kù)、書(shū)簽和快速關(guān)鍵詞搜索等功能。作為一個(gè)開(kāi)源項(xiàng)目,5ire提供免費(fèi)下載,并且提供了按需付費(fèi)的大型語(yǔ)言模型API服務(wù)。

  • AI Hear:一款在您電腦本地運(yùn)行的私有軟件,提供多語(yǔ)種實(shí)時(shí)翻譯。

    AI Hear是一款在電腦本地運(yùn)行的私有軟件,它通過(guò)一鍵開(kāi)啟多語(yǔ)種實(shí)時(shí)翻譯功能,幫助用戶管理音頻、譯文和時(shí)間軸。產(chǎn)品不收集數(shù)據(jù),保護(hù)用戶隱私。它適用于多種場(chǎng)景,如線上會(huì)議、網(wǎng)課播客、游戲直播等,并且完全本地運(yùn)行,相比市面上的實(shí)時(shí)翻譯產(chǎn)品更具性價(jià)比。

  • SD Image:使用最新的Stable Diffusion 3.5模型生成高質(zhì)量圖像。

    SD Image的Stable Diffusion 3.5 Image Generator是一個(gè)在線圖像生成器,它利用最新的Stable Diffusion 3.5模型,包括Medium, Large, Large Turbo,來(lái)生成高質(zhì)量的圖像。這項(xiàng)技術(shù)的重要性在于它能夠通過(guò)文本提示(prompt)快速生成圖像,為設(shè)計(jì)師、藝術(shù)家和創(chuàng)意工作者提供靈感和便利。產(chǎn)品背景信息顯示,SD Image是一個(gè)在線平臺(tái),用戶可以通過(guò)它找到靈感、生成圖像、探索不同的prompt和模型。目前,該產(chǎn)品提供免費(fèi)試用,適合需要快速生成圖像的用戶。

  • AI Homeworkify:下一代AI作業(yè)助手,免費(fèi)獲取作業(yè)答案

    AI Homeworkify是一個(gè)基于人工智能的在線問(wèn)答平臺(tái),旨在幫助學(xué)生通過(guò)提供詳細(xì)的答案和解題步驟來(lái)學(xué)習(xí)和理解各種學(xué)術(shù)問(wèn)題。該平臺(tái)不涉及版權(quán)侵犯,注重教育平等,提供免費(fèi)、即時(shí)的作業(yè)幫助,支持多種學(xué)科和語(yǔ)言。AI Homeworkify的主要優(yōu)點(diǎn)包括完全免費(fèi)、無(wú)需注冊(cè)、即時(shí)答案、全天候服務(wù)、多設(shè)備兼容、隱私保護(hù)和逐步解決方案。產(chǎn)品背景信息顯示,AI Homeworkify致力于通過(guò)技術(shù)手段減少教育不平等,為全球?qū)W生提供免費(fèi)的優(yōu)質(zhì)學(xué)習(xí)輔助服務(wù)。

  • AI Voice Lab:在線將文字轉(zhuǎn)換為逼真的語(yǔ)音

    AI Voice Lab免費(fèi) AI 文字轉(zhuǎn)語(yǔ)音神器是一個(gè)利用最新的類GPT AI語(yǔ)音模型技術(shù),提供超級(jí)逼真的配音結(jié)果,支持20+種語(yǔ)言和100+種聲音,每天提供免費(fèi)使用次數(shù),適用于視頻、音頻制作等多種場(chǎng)景,提高內(nèi)容吸引力。

  • LookAI:零基礎(chǔ)小白的Cursor AI編程學(xué)習(xí)平臺(tái)

    LookAI是一個(gè)專為零基礎(chǔ)小白設(shè)計(jì)的AI編程學(xué)習(xí)平臺(tái),提供Cursor AI編程教程和實(shí)戰(zhàn)項(xiàng)目,幫助用戶認(rèn)識(shí)、學(xué)會(huì)使用Cursor,落地創(chuàng)意和想法。該平臺(tái)以視頻教程、實(shí)戰(zhàn)項(xiàng)目和AI資源集合為特色,旨在賦能每一個(gè)普通人,讓他們?cè)贏I時(shí)代中能夠更好地發(fā)揮自己的創(chuàng)造力。LookAI平臺(tái)免費(fèi)提供資源,適合所有對(duì)AI編程感興趣的初學(xué)者。

  • DataChain:現(xiàn)代Python數(shù)據(jù)框庫(kù),專為人工智能設(shè)計(jì)。

    DataChain是一個(gè)現(xiàn)代的Python數(shù)據(jù)框庫(kù),專為人工智能設(shè)計(jì)。它旨在將非結(jié)構(gòu)化數(shù)據(jù)組織成數(shù)據(jù)集,并在本地機(jī)器上大規(guī)模處理數(shù)據(jù)。DataChain不抽象或隱藏AI模型和API調(diào)用,而是幫助將它們集成到后現(xiàn)代數(shù)據(jù)堆棧中。該產(chǎn)品以其高效性、易用性和強(qiáng)大的數(shù)據(jù)處理能力為主要優(yōu)點(diǎn),支持多種數(shù)據(jù)存儲(chǔ)和處理方式,包括圖像、視頻、文本等多種數(shù)據(jù)類型,并且能夠與PyTorch和TensorFlow等深度學(xué)習(xí)框架無(wú)縫對(duì)接。DataChain是開(kāi)源的,遵循Apache-2.0許可協(xié)議,免費(fèi)供用戶使用。

  • PromptQL:AI驅(qū)動(dòng)的數(shù)據(jù)訪問(wèn)工具,提升私有數(shù)據(jù)的智能檢索效率。

    PromptQL是一個(gè)專為AI設(shè)計(jì)的代理數(shù)據(jù)訪問(wèn)工具,它通過(guò)代理查詢規(guī)劃,像人類一樣檢索數(shù)據(jù),首先收集相關(guān)信息,然后應(yīng)用合適的大型語(yǔ)言模型(LLM)進(jìn)行分類和后續(xù)處理,以提高私有數(shù)據(jù)的檢索效率和準(zhǔn)確性。這一技術(shù)的出現(xiàn),解決了傳統(tǒng)搜索算法在封閉領(lǐng)域中對(duì)數(shù)據(jù)檢索的局限性,特別是在用戶提出非標(biāo)準(zhǔn)化查詢時(shí),PromptQL能夠更好地理解和響應(yīng)。產(chǎn)品背景信息顯示,PromptQL旨在通過(guò)與用戶的緊密合作,免費(fèi)構(gòu)建首個(gè)代理,以評(píng)估和提升現(xiàn)有AI代理/助手的性能。

今日大家都在搜的詞:

熱文

  • 3 天
  • 7天