幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關(guān)鍵詞  > 微軟最新資訊  > 正文

微軟發(fā)布可逼真復(fù)制人臉和聲音的 AI 工具,引發(fā)對加劇深度偽造的擔(dān)憂

2023-11-20 17:09 · 稿源:站長之家

站長之家(ChinaZ.com) 11 月 20 日消息:在上周的開發(fā)者大會(huì)上,微軟宣布了其在人工智能競賽中的最新貢獻(xiàn):一款可以生成新頭像和聲音,或復(fù)制用戶現(xiàn)有外觀和語音的軟件,這引發(fā)了人們對它可能加劇深度偽造創(chuàng)造的擔(dān)憂。深度偽造是指使用 AI 制作的未曾發(fā)生事件的視頻。

微軟

在 2023 年的 Microsoft Ignite 大會(huì)上宣布的 Azure AI Speech,經(jīng)過人類圖像訓(xùn)練,允許用戶輸入腳本,然后可以由用人工智能創(chuàng)建的逼真頭像「朗讀」該腳本。用戶可以選擇預(yù)加載的微軟頭像,或上傳他們想要復(fù)制其聲音和相貌的人的錄像。微軟在上周三發(fā)布的博客文章中表示,該工具可用于構(gòu)建「對話代理、虛擬助手、聊天機(jī)器人等」

文章中寫道:「客戶可以為他們的頭像選擇預(yù)建的或自定義的神經(jīng)聲音。如果用于自定義神經(jīng)聲音和自定義文本到語音頭像的是同一個(gè)人的聲音和相貌,頭像將與那個(gè)人非常相似?!?/p>

微軟表示,新的文本到語音軟件發(fā)布時(shí)配備了多種限制和保護(hù)措施,以防止濫用?!缸鳛槲④泴ω?fù)責(zé)任 AI 的承諾的一部分,文本到語音頭像的設(shè)計(jì)意圖是保護(hù)個(gè)人和社會(huì)的權(quán)利,促進(jìn)透明的人機(jī)互動(dòng),并抵制有害深度偽造和誤導(dǎo)性內(nèi)容的泛濫,」公司說。

「客戶可以上傳自己的 Avatar talent 的視頻錄像,該功能用于訓(xùn)練自定義頭像說話的合成視頻,」博客文章中寫道?!?Avatar talent」是為 AI 的比喻性攝像機(jī)擺姿勢的人。

該公告迅速引起批評,稱微軟發(fā)布了一個(gè)「深度偽造制造器」,這將更容易讓一個(gè)人的相貌被復(fù)制并使其說出和做出該人未曾說過或做過的事情。微軟自己的總裁在 5 月表示,深度偽造是他對人工智能崛起的「最大擔(dān)憂」。

在一份聲明中,微軟公司對這些批評進(jìn)行了反駁,稱定制頭像現(xiàn)在是一個(gè)「限制訪問」的工具,客戶必須申請并獲得微軟的批準(zhǔn)。用戶還將被要求披露在創(chuàng)建合成聲音或頭像時(shí)使用了 AI。

微軟的負(fù)責(zé)任 AI 工程部門的 Sarah Bird 在一份聲明中說:「有了這些保障措施,我們有助于限制潛在風(fēng)險(xiǎn),并使客戶能夠以透明和安全的方式將先進(jìn)的語音和語音能力融入他們的 AI 應(yīng)用?!?/p>

文本到語音頭像制造工具是主要科技公司近年來搶占人工智能熱潮的最新工具之一。在微軟支持的公司 OpenAI 推出的 ChatGPT 大受歡迎后,像 Meta 和 Google 這樣的公司也推出了自己的人工智能工具。

隨著 AI 的興起,人們越來越擔(dān)心這項(xiàng)技術(shù)的能力,OpenAI 首席執(zhí)行官 Sam Altman 警告國會(huì),它可能被用于選舉干預(yù),必須實(shí)施保護(hù)措施。

專家表示,深度偽造在選舉干預(yù)方面具有特別的危險(xiǎn)性。微軟本月早些時(shí)候推出了一款工具,允許政客和競選活動(dòng)認(rèn)證和水印他們的視頻,以驗(yàn)證其合法性并防止深度偽造的傳播。Meta 本周宣布了一項(xiàng)政策,要求披露在政治廣告中使用 AI 的情況,并禁止競選活動(dòng)使用 Meta 自己的生成 AI 工具進(jìn)行廣告。

舉報(bào)

  • 相關(guān)推薦
  • 大家在看
  • URL Parser Online:在線URL解析器,將URL轉(zhuǎn)換為適合大型語言模型的輸入格式。

    URL Parser Online是一個(gè)在線工具,它能夠?qū)?fù)雜的URL轉(zhuǎn)換為適合大型語言模型(LLMs)使用的輸入格式。這項(xiàng)技術(shù)的重要性在于它能夠幫助開發(fā)者和研究人員更有效地處理和解析URL數(shù)據(jù),尤其是在進(jìn)行網(wǎng)頁內(nèi)容分析和數(shù)據(jù)抽取時(shí)。產(chǎn)品背景信息顯示,隨著互聯(lián)網(wǎng)數(shù)據(jù)量的爆炸式增長,對URL的解析和處理需求日益增加。URL Parser Online以其簡潔的用戶界面和高效的解析能力,為用戶提供了一個(gè)便捷的解決方案。該產(chǎn)品目前提供免費(fèi)服務(wù),定位于開發(fā)者和數(shù)據(jù)分析師。

  • AI Summarizer:全能AI摘要生成器,快速生成文本、PDF、視頻摘要。

    AI Summarizer是一個(gè)強(qiáng)大的AI摘要生成器,支持文本、PDF、視頻等多種格式的摘要生成。它通過先進(jìn)的算法提取關(guān)鍵信息,幫助用戶快速理解內(nèi)容要點(diǎn),提升工作和學(xué)習(xí)效率。產(chǎn)品支持超過50種語言,保障用戶隱私,不存儲(chǔ)任何上傳文件,并提供免費(fèi)的Chrome擴(kuò)展插件,方便用戶隨時(shí)隨地使用。

  • Transcribro:Android平臺(tái)上的私有、設(shè)備端語音識(shí)別鍵盤和文字服務(wù)

    Transcribro是一款運(yùn)行在Android平臺(tái)上的私有、設(shè)備端語音識(shí)別鍵盤和文字服務(wù)應(yīng)用,它使用whisper.cpp來運(yùn)行OpenAI Whisper系列模型,并結(jié)合Silero VAD進(jìn)行語音活動(dòng)檢測。該應(yīng)用提供了語音輸入鍵盤,允許用戶通過語音進(jìn)行文字輸入,并且可以被其他應(yīng)用顯式使用,或者設(shè)置為用戶選擇的語音轉(zhuǎn)文字應(yīng)用,部分應(yīng)用可能會(huì)使用它來進(jìn)行語音轉(zhuǎn)文字。Transcribro的背景是為用戶提供一種更安全、更私密的語音轉(zhuǎn)文字解決方案,避免了云端處理可能帶來的隱私泄露問題。該應(yīng)用是開源的,用戶可以自由地查看、修改和分發(fā)代碼。

  • Oasis:基于Transformer的實(shí)時(shí)開放世界AI模型

    Oasis是由Decart AI開發(fā)的首個(gè)可玩、實(shí)時(shí)、開放世界的AI模型,它是一個(gè)互動(dòng)視頻游戲,由Transformer端到端生成,基于逐幀生成。Oasis能夠接收用戶鍵盤和鼠標(biāo)輸入,實(shí)時(shí)生成游戲玩法,內(nèi)部模擬物理、游戲規(guī)則和圖形。該模型通過直接觀察游戲玩法學(xué)習(xí),允許用戶移動(dòng)、跳躍、拾取物品、破壞方塊等。Oasis被視為研究更復(fù)雜交互世界的基礎(chǔ)模型的第一步,未來可能取代傳統(tǒng)的游戲引擎。Oasis的實(shí)現(xiàn)需要模型架構(gòu)的改進(jìn)和模型推理技術(shù)的突破,以實(shí)現(xiàn)用戶與模型的實(shí)時(shí)交互。Decart AI采用了最新的擴(kuò)散訓(xùn)練和Transformer模型方法,并結(jié)合了大型語言模型(LLMs)來訓(xùn)練一個(gè)自回歸模型,該模型可以根據(jù)用戶即時(shí)動(dòng)作生成視頻。此外,Decart AI還開發(fā)了專有的推理框架,以提供NVIDIA H100 Tensor Core GPU的峰值利用率,并支持Etched即將推出的Sohu芯片。

  • 三頓智能助手:多功能AI助手,提供問答、寫作、繪圖等智能服務(wù)。

    三頓智能助手是一個(gè)集成了多種AI功能的在線平臺(tái),它通過提供問答、寫作、繪圖等多種服務(wù),幫助用戶提高工作效率和創(chuàng)造力。該產(chǎn)品以其強(qiáng)大的AI技術(shù)背景和用戶友好的界面,為用戶提供了一個(gè)便捷的智能服務(wù)入口。價(jià)格方面,三頓智能助手提供免費(fèi)試用,同時(shí)也提供付費(fèi)服務(wù)以解鎖更多功能。

  • Light Novels:AI驅(qū)動(dòng)的輕小說閱讀平臺(tái),提供個(gè)性化推薦和翻譯

    Explore Light Novels是一個(gè)AI驅(qū)動(dòng)的輕小說閱讀平臺(tái),旨在通過人工智能技術(shù)打破語言障礙,為全球讀者提供沉浸式的輕小說閱讀體驗(yàn)。平臺(tái)擁有數(shù)千部流行輕小說,并提供AI驅(qū)動(dòng)的個(gè)性化推薦,每日更新新章節(jié)和根據(jù)讀者偏好定制的新鮮內(nèi)容。此外,平臺(tái)還提供AI生成的文化背景注釋,幫助讀者深入了解故事背景,并通過AI推薦系統(tǒng)學(xué)習(xí)用戶的輕小說偏好,推薦新作者和故事。平臺(tái)還設(shè)有AI主持的全球社區(qū)討論,以及AI生成的每日內(nèi)容,確保讀者總有新鮮內(nèi)容可讀。

  • SDXL_EcomID_ComfyUI:ComfyUI的EcomID原生支持插件

    SDXL_EcomID_ComfyUI是一個(gè)為ComfyUI提供原生SDXL-EcomID支持的插件。它通過增強(qiáng)肖像表示,提供更真實(shí)、審美上更令人愉悅的外觀,同時(shí)確保語義一致性和更大的內(nèi)部ID相似性。這個(gè)插件完全集成于ComfyUI,并且不使用diffusers,而是本地實(shí)現(xiàn)EcomID。它的重要性在于能夠提升圖像生成的質(zhì)量和一致性,特別是在處理人物肖像時(shí),能夠保持不同年齡、發(fā)型、眼鏡等物理變化下的內(nèi)部特征一致性。

  • Promega:通過ChatGPT加速制造、銷售和市場營銷。

    Promega是一家在生命科學(xué)領(lǐng)域領(lǐng)先的公司,提供用于研究和應(yīng)用技術(shù)的開創(chuàng)性生物試劑和集成系統(tǒng)。Promega通過自上而下地采用ChatGPT,幫助員工更高效地管理數(shù)千種產(chǎn)品和超過60,000個(gè)賬戶,從而加速產(chǎn)品交付到生物技術(shù)生態(tài)系統(tǒng)。ChatGPT的使用不僅提高了工作效率,還增強(qiáng)了客戶關(guān)系,并在制造、銷售和市場營銷等多個(gè)領(lǐng)域發(fā)揮了重要作用。

  • Excerptor:從實(shí)體書籍中提取劃線或手寫標(biāo)記的文本

    Excerptor是一個(gè)專門設(shè)計(jì)來從實(shí)體書籍中提取劃線或手寫標(biāo)記文本的工具。它通過圖像處理和光學(xué)字符識(shí)別技術(shù),將書籍中的標(biāo)記文本轉(zhuǎn)換為數(shù)字格式,方便用戶編輯和保存。這項(xiàng)技術(shù)的重要性在于它能夠幫助用戶快速從大量書籍中提取關(guān)鍵信息,提高研究和學(xué)習(xí)的效率。Excerptor以其高效、準(zhǔn)確的文本識(shí)別能力和用戶友好的操作界面,滿足了學(xué)術(shù)研究、教育和個(gè)人學(xué)習(xí)等不同領(lǐng)域的需求。目前,Excerptor是免費(fèi)提供給用戶的,它的開發(fā)和維護(hù)由開源社區(qū)負(fù)責(zé)。

  • Spafe Code:AI代碼翻譯器

    Spafe Code是一個(gè)利用人工智能技術(shù)實(shí)現(xiàn)代碼翻譯的平臺(tái),它能夠?qū)⒋a從一種編程語言翻譯成另一種編程語言。這項(xiàng)技術(shù)的重要性在于它能夠幫助開發(fā)者跨越語言障礙,提高代碼的可讀性和可維護(hù)性,促進(jìn)全球開發(fā)者之間的協(xié)作。Spafe Code以其高效的翻譯能力、易用性和對多種編程語言的支持而受到開發(fā)者的歡迎。目前,Spafe Code提供免費(fèi)試用,具體價(jià)格和定位信息需要進(jìn)一步查詢。

  • Browser AI Kit:在瀏覽器中直接運(yùn)行的AI工具箱

    Browser AI Kit是一個(gè)集成了多種AI工具的平臺(tái),用戶可以在瀏覽器中直接使用這些工具,無需安裝或設(shè)置。它提供了音頻轉(zhuǎn)文本、去除背景、文本轉(zhuǎn)語音等多種功能,并且完全免費(fèi)。這個(gè)工具箱基于Transformers.js開發(fā),強(qiáng)調(diào)數(shù)據(jù)安全和隱私保護(hù),所有數(shù)據(jù)處理都在本地進(jìn)行,不上傳任何服務(wù)器。它的目標(biāo)是為用戶提供一個(gè)便捷、安全、多功能的AI工具平臺(tái)。

  • Emotive AI Actors by CreatorKit:視頻廣告中的情感AI演員

    Emotive AI Actors by CreatorKit是一個(gè)利用人工智能技術(shù)創(chuàng)建用戶生成內(nèi)容(UGC)視頻和廣告的平臺(tái)。它通過與真實(shí)UGC演員和內(nèi)容策略師合作訓(xùn)練AI,使得用戶能夠快速創(chuàng)建出具有真實(shí)情感反應(yīng)的視頻廣告。這個(gè)產(chǎn)品的重要性在于它能夠以更低的成本、更快的速度和更好的性能來替代傳統(tǒng)的視頻制作方式,同時(shí)提供可擴(kuò)展的解決方案,允許用戶在幾分鐘內(nèi)創(chuàng)建出100個(gè)視頻廣告。AI Actors的主要優(yōu)點(diǎn)包括成本效益、快速制作、性能優(yōu)越和易于擴(kuò)展。

  • SELA:通過結(jié)合蒙特卡洛樹搜索和基于LLM的代理來增強(qiáng)自動(dòng)化機(jī)器學(xué)習(xí)。

    SELA是一個(gè)創(chuàng)新系統(tǒng),它通過將蒙特卡洛樹搜索(MCTS)與基于大型語言模型(LLM)的代理結(jié)合起來,增強(qiáng)了自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)。傳統(tǒng)的AutoML方法經(jīng)常產(chǎn)生低多樣性和次優(yōu)的代碼,限制了它們在模型選擇和集成方面的有效性。SELA通過將管道配置表示為樹,使代理能夠智能地探索解決方案空間,并根據(jù)實(shí)驗(yàn)反饋迭代改進(jìn)其策略。

  • Universal-2:下一代語音AI,提供卓越的音頻數(shù)據(jù)處理能力。

    Universal-2是AssemblyAI推出的最新語音識(shí)別模型,它在準(zhǔn)確度和精確度上超越了前一代Universal-1,能夠更好地捕捉人類語言的復(fù)雜性,為用戶提供無需二次檢查的音頻數(shù)據(jù)。這一技術(shù)的重要性在于它能夠?yàn)楫a(chǎn)品體驗(yàn)提供更敏銳的洞察力、更快的工作流程和一流的產(chǎn)品體驗(yàn)。Universal-2在專有名詞識(shí)別、文本格式化和字母數(shù)字識(shí)別方面都有顯著提升,減少了實(shí)際應(yīng)用中的詞錯(cuò)誤率。

  • Laminar.ai:開源全棧平臺(tái),為打造頂級LLM產(chǎn)品提供支持

    Laminar是一個(gè)開源的全棧平臺(tái),專注于從第一性原理出發(fā)進(jìn)行AI工程。它幫助用戶收集、理解和使用數(shù)據(jù),以提高大型語言模型(LLM)應(yīng)用的質(zhì)量。Laminar支持對文本和圖像模型的追蹤,并且即將支持音頻模型。產(chǎn)品的主要優(yōu)點(diǎn)包括零開銷的可觀測性、在線評估、數(shù)據(jù)集構(gòu)建和LLM鏈管理。Laminar完全開源,易于自托管,適合需要構(gòu)建和管理LLM產(chǎn)品的開發(fā)者和團(tuán)隊(duì)。

  • HOVER:人形機(jī)器人多功能神經(jīng)全身控制器

    HOVER是一個(gè)針對人形機(jī)器人的多功能神經(jīng)全身控制器,它通過模仿全身運(yùn)動(dòng)來提供通用的運(yùn)動(dòng)技能,學(xué)習(xí)多種全身控制模式。HOVER通過多模式策略蒸餾框架將不同的控制模式整合到一個(gè)統(tǒng)一的策略中,實(shí)現(xiàn)了在不同控制模式之間的無縫切換,同時(shí)保留了每種模式的獨(dú)特優(yōu)勢。這種控制器提高了人形機(jī)器人在多種模式下的控制效率和靈活性,為未來的機(jī)器人應(yīng)用提供了一個(gè)健壯且可擴(kuò)展的解決方案。

  • LinkedIn Hiring Assistant:LinkedIn招聘助手,助力招聘流程自動(dòng)化。

    Hiring Assistant for Recruiter & Jobs是LinkedIn推出的一款A(yù)I助手,旨在幫助招聘人員自動(dòng)化執(zhí)行耗時(shí)的任務(wù),從而讓他們專注于更有影響力的、以人為中心的工作部分。這款產(chǎn)品代表了LinkedIn在利用人工智能技術(shù)優(yōu)化招聘流程方面邁出的重要一步,它通過自動(dòng)構(gòu)建候選人管道、篩選頂級申請者、起草外展郵件甚至回答有關(guān)角色的基本問題來減輕招聘人員的工作負(fù)擔(dān)。產(chǎn)品背景信息顯示,LinkedIn一直致力于通過AI技術(shù)提升用戶體驗(yàn),而Hiring Assistant的推出進(jìn)一步強(qiáng)化了這一點(diǎn)。產(chǎn)品定位于幫助招聘人員提高效率,同時(shí)保持對招聘過程的完全控制。

  • Fable:AI驅(qū)動(dòng)的交互式產(chǎn)品演示軟件

    Fable是一款A(yù)I驅(qū)動(dòng)的交互式產(chǎn)品演示軟件,旨在幫助企業(yè)通過創(chuàng)建高轉(zhuǎn)化率的產(chǎn)品演示來吸引潛在客戶、完成交易并簡化產(chǎn)品上線流程。Fable通過其AI技術(shù),允許用戶輕松創(chuàng)建個(gè)性化的演示,這些演示可以嵌入網(wǎng)站、通過電子郵件發(fā)送或添加到幫助中心。產(chǎn)品背景信息顯示,F(xiàn)able在G2上獲得了4.9的高評分,并被全球各地的GTM團(tuán)隊(duì)所信賴。Fable的價(jià)格定位是免費(fèi)試用和付費(fèi),適合需要提高銷售轉(zhuǎn)化率和客戶滿意度的商業(yè)團(tuán)隊(duì)。

  • Trieve:AI優(yōu)先的基礎(chǔ)設(shè)施API,提供搜索、推薦和RAG服務(wù)

    Trieve是一個(gè)AI優(yōu)先的基礎(chǔ)設(shè)施API,結(jié)合了語言模型和工具,用于微調(diào)排名和相關(guān)性,提供一站式的搜索、推薦、RAG和分析解決方案。它能夠自動(dòng)持續(xù)改進(jìn),基于數(shù)十個(gè)反饋信號(hào),確保相關(guān)性。Trieve支持語義向量搜索、BM25和SPlade全文搜索,以及混合搜索,結(jié)合全文搜索和語義向量搜索。此外,它還提供了商品推銷和相關(guān)性調(diào)整功能,幫助用戶通過API或無代碼儀表板調(diào)整搜索結(jié)果以實(shí)現(xiàn)KPI。Trieve建立在最佳基礎(chǔ)之上,使用開源嵌入模型和LLMs,運(yùn)行在自己的服務(wù)器上,確保數(shù)據(jù)安全。

  • Open Source AI Definition:開源人工智能定義,推動(dòng)AI領(lǐng)域的開放與合作

    Open Source AI Definition(OSAID)是由Open Source Initiative(OSI)發(fā)布的行業(yè)首個(gè)開源人工智能定義。它提供了一個(gè)標(biāo)準(zhǔn),通過社區(qū)領(lǐng)導(dǎo)的開放和公共評估來驗(yàn)證一個(gè)AI系統(tǒng)是否可以被認(rèn)為是開源AI。OSAID v1.0的發(fā)布是多年研究和合作的結(jié)果,經(jīng)過國際研討會(huì)和為期一年的共同設(shè)計(jì)過程。這個(gè)定義要求開源模型提供足夠的訓(xùn)練數(shù)據(jù)信息,以便熟練的人可以使用相同或類似的數(shù)據(jù)重建一個(gè)大致等效的系統(tǒng)。OSAID的發(fā)布對于推動(dòng)AI領(lǐng)域的開放性、透明度和合作具有重要意義,它強(qiáng)調(diào)了開源原則在AI發(fā)展中的核心地位,并為獨(dú)立機(jī)器學(xué)習(xí)研究人員和大型AI開發(fā)者之間的透明度提供了支持。

今日大家都在搜的詞:

熱文

  • 3 天
  • 7天