11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享。快來騰訊云選購吧!
【新智元導(dǎo)讀】Deepfake到底有多可怕?國外一名律師的父親,險些陷入一場巨大AI騙局。詐騙者借助AI克隆其兒子的聲音,偽造車禍?zhǔn)鹿室獟?萬保釋金。在這個世界中,沒有真實,一切全是AI。
StabilityAI今天發(fā)布了StableAudioOpen1.0,這是其音頻領(lǐng)域的新一款生成AI模型。StabilityAI以穩(wěn)定擴散文本到圖像生成AI技術(shù)聞名,但這只是該公司產(chǎn)品組合的一部分。我們期待進一步發(fā)布商業(yè)和開放模型,以反映我們研究的進展。
歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、抖音:將打擊使用AI技術(shù)P圖侮辱他人等行為抖音發(fā)布公告表示嚴(yán)厲打擊網(wǎng)絡(luò)暴力行為,已處置162件網(wǎng)暴輿情,警示教育施暴者近70萬個。豆包的AI大模型系列涵蓋了多種功能模型?
ElevenLabs最近推出了一款創(chuàng)新的AI音頻模型,這一技術(shù)允許用戶僅通過文本提示就能生成各種音效、短樂器曲目、音景和各種角色聲音。這項技術(shù)的應(yīng)用范圍非常廣泛,尤其對以下領(lǐng)域的專業(yè)人士來說是一個巨大的福音:內(nèi)容創(chuàng)作者:無論是制作YouTube視頻、播客還是其他任何形式的音頻內(nèi)容,ElevenLabs的AI音頻模型能夠幫助創(chuàng)作者快速生成所需的背景音樂和音效,提升作品的整體質(zhì)?
兩位知名配音演員保羅·斯凱·萊爾曼和林尼·塞奇起訴人工智能公司Lovo,指控該公司以虛假借口委托他們錄制語音樣本,隨后卻將這些樣本用于創(chuàng)建和銷售人工智能生成的聲音版本。圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney據(jù)悉,萊爾曼在2020年通過零工網(wǎng)站Fiverr接受了一份配音工作,被告知僅用于"學(xué)術(shù)研究"。人工智能模型的訓(xùn)練可能違反版權(quán)和知識產(chǎn)權(quán)法,因為它們需要大量數(shù)據(jù)。
SkeletonFingers是一款基于AI技術(shù)的網(wǎng)頁音頻轉(zhuǎn)錄產(chǎn)品。它可以直接在瀏覽器中將音頻鏈接、上傳的音頻文件或語音錄制轉(zhuǎn)換為文字。SkeletonFingers產(chǎn)品特色音頻鏈接轉(zhuǎn)錄本地音頻文件轉(zhuǎn)錄語音錄制轉(zhuǎn)錄導(dǎo)出文本想要了解更多關(guān)于SkeletonFingers的信息以及開始音頻轉(zhuǎn)錄之旅,請訪問SkeletonFingers官網(wǎng)。
AniPortrait是一個根據(jù)音頻和圖像輸入生成會說話、唱歌的動態(tài)視頻的項目。它能夠根據(jù)音頻和靜態(tài)人臉圖片生成逼真的人臉動畫,口型保持一致。想要了解更多關(guān)于AniPortrait的信息并開始體驗音頻驅(qū)動人臉動畫生成工具,請訪問AniPortrait官方網(wǎng)站。
PixelPlayer是一項革命性的工具,可以通過觀看大量無標(biāo)注視頻學(xué)會定位產(chǎn)生聲音的圖像區(qū)域并分離輸入聲音成一組表示每個像素聲音的組件的系統(tǒng)。該系統(tǒng)利用視覺和聽覺雙模態(tài)的自然同步特點,在無需額外人工標(biāo)注的情況下學(xué)習(xí)聯(lián)合解析聲音和圖像模型。欲了解更多關(guān)于PixelPlayer的信息,請訪問官方網(wǎng)站。
audio2photoreal是一個開源項目,專注于從音頻生成照片級逼真的avatar。它包含一個基于pytorch的實現(xiàn),可以從音頻中合成交談中的人類形象。要獲取更多詳細(xì)信息并開始您的AI頭像生成之旅,請訪問audio2photoreal官方網(wǎng)站。
Meta最新發(fā)布了Audiobox,這是一款基于語音和自然語言提示生成音頻的先進研究模型。通過結(jié)合語音輸入和文本提示,Audiobox可以輕松生成各種聲音,包括語音、音效和音景,從為多種用例提供定制音頻。這對于視頻、播客、游戲等多種用例都具有潛在的影響,為未來的音頻創(chuàng)作開辟了新的可能性。
Adobe正在開發(fā)一種全新的音頻工具,利用AI技術(shù)可以分離混合錄音中的不同聲音層。該工具名為ProjectSoundLift,它可以自動檢測錄音中的不同元素,比如掌聲、笑聲、背景噪音等,并將其與人聲分開生成獨立的音頻文件。這表明Adobe繼續(xù)利用AI創(chuàng)新音視頻技術(shù),為創(chuàng)作者提供更強大的創(chuàng)作工具。
最近這幾天,高通方面在夏威夷舉行的2023驍龍峰會上發(fā)布了多款全新的芯片。除了我們?nèi)咨畲饲耙呀?jīng)為大家做過詳細(xì)解析的驍龍XElite和第三代驍龍8這兩款“大芯片”外,其實還有兩款體積上比較小,但在技術(shù)層面同樣“重量級”的方案也很值得關(guān)注。但如果從長遠的角度來看,一個開放的、包容性強的、且本身硬件規(guī)格也極為強大的音頻平臺,既可以幫助終端廠商打造出
越來越多的音頻工程師和音樂制作人利用人工智能音頻工具,來提升創(chuàng)作過程中的多個方面,如生成旋律和和聲、提高音質(zhì)等。由于其能夠分析大量數(shù)據(jù)集并檢測復(fù)雜模式,這些技術(shù)在尋求優(yōu)化工作流程的音樂制作人和聲音設(shè)計師中越來越受歡迎。該平臺由MetaVoice技術(shù)驅(qū)動,確保音頻搜索引擎的持續(xù)安全性和可靠性。