劃重點(diǎn):
? AI 語(yǔ)音技公司面臨應(yīng)對(duì) Deepfakes 的挑戰(zhàn)
? ElevenLabs CEO 提出數(shù)字水印技術(shù)應(yīng)對(duì) Deepfakes
? 技術(shù)應(yīng)前景廣闊,但也存在濫用風(fēng)險(xiǎn)和合規(guī)難題
站長(zhǎng)之家(ChinaZ.com)5月6日 消息:AI 語(yǔ)音技術(shù)領(lǐng)域的公司正努力尋求何規(guī)范 Deepfakes,同時(shí)又不抑制創(chuàng)新。ElevenLabs 的聯(lián)合創(chuàng)始人兼 CEO Mati Staniszewski 告訴《大西洋月刊》說(shuō):“這將是一場(chǎng)貓鼠游戲”。去年在測(cè)試版推出后,ElevenLabs 一躍成為價(jià)值億美元的公司,其使用 AI 生成逼真的音頻剪輯。這包括文本轉(zhuǎn)語(yǔ)音配音、在29種語(yǔ)中配音以及克隆聲音。該公司聲稱,其用戶在過(guò)去一年內(nèi)生成了超過(guò)100年的音頻內(nèi)容。
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
立法者擔(dān)心這項(xiàng)技術(shù)存在危險(xiǎn)的濫用潛力。人工智能的進(jìn)步與電話詐騙的增加關(guān),詐騙者會(huì)冒充愛(ài)人、家庭成員或政府官員進(jìn)行超級(jí)電話詐騙。拜登的人工智能主管布魯斯?里德甚至表示,“聲音克隆” 是一讓他夜不能寐的事情。去年,4chan 用戶利用 ElevenLabs 的工具生成了名人深度偽造,視頻中的內(nèi)容充斥著種族主義和跨性別歧視,據(jù)《副刊》報(bào)道。
但 Staniszewski 是一個(gè)理想義者。他認(rèn)為 ElevenLabs 的技術(shù)可以促進(jìn)一個(gè)世界,在那里患有像肌萎縮側(cè)索硬化癥 ALS)這樣的神經(jīng)退行性疾病的患者失去說(shuō)話能力后仍然可以用他們自己的聲音交流。這項(xiàng)技術(shù)還有助于幫助人們跨越文化和語(yǔ)言進(jìn)行溝通。紐約市市長(zhǎng)埃里克?亞當(dāng)斯用 ElevenLabs 的技術(shù)用普通話、意第緒語(yǔ)和海地克里奧爾語(yǔ)撥打電話,稱他已經(jīng)能夠到更多的非英語(yǔ)母語(yǔ)的市民。
為了充分發(fā)揮這一潛力并防止欺詐,Staniszweski 表示,用戶應(yīng)該能夠識(shí)別人工智能生成的聲音和人類的聲音。Staniszewski 告訴《大西洋刊》,“真正的解決方案” 是對(duì)合成聲音進(jìn)行數(shù)字水印處理,以便人類能夠區(qū)分真假。該公司正在開(kāi)發(fā)這項(xiàng)技術(shù),但只有在其他公司的合作下才能發(fā)揮作用。ElevenLabs 已與包括 AI、Anthropic、Google 和 Meta 在內(nèi)的幾家人工智能公司簽署了一項(xiàng)協(xié)議,共同打擊2024年選舉中的 Deepfakes。
(舉報(bào))