歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、豆包推出Ola Friend智能體耳機(jī):售價(jià)1199元
豆包推出Ola Friend智能體耳機(jī),這款集成了人工智能技術(shù)的耳機(jī)旨在為用戶提供一個(gè)隨時(shí)陪伴在耳邊的AI朋友。用戶可以享受聽音樂、學(xué)習(xí)英語(yǔ)、獲取導(dǎo)游服務(wù)等多種功能,需要下載豆包APP來充分利用。
【AiBase提要:】
?? Ola Friend智能體耳機(jī)售價(jià)1199元,支持智能對(duì)話功能。
?? Ola Friend耳機(jī)是隨時(shí)陪伴在耳邊的AI朋友,提供聽音樂、學(xué)習(xí)英語(yǔ)、導(dǎo)游服務(wù)等功能。
?? 用戶需下載豆包APP來充分利用Ola Friend耳機(jī)的功能,APP支持搜索信息、答疑解惑、激發(fā)靈感等多種功能。
2、vivo發(fā)布全新藍(lán)心大模型矩陣
vivo在2024vivo開發(fā)者大會(huì)上發(fā)布了全新藍(lán)心大模型矩陣,升級(jí)了語(yǔ)言、語(yǔ)音、圖像和多模態(tài)能力,提供更強(qiáng)大的性能和功能。新的藍(lán)心大模型矩陣將行業(yè)標(biāo)準(zhǔn)提升至新高度,為用戶帶來更優(yōu)質(zhì)的體驗(yàn)。
【AiBase提要:】
?? 藍(lán)心大模型矩陣全面升級(jí),包括語(yǔ)言、端側(cè)、語(yǔ)音、圖像和多模態(tài)大模型。
?? 推出30億藍(lán)心端側(cè)大模型3B,性能提升300%,功耗優(yōu)化46%,內(nèi)存減小63%,出詞速度達(dá)80字/s。
?? 新自研藍(lán)心語(yǔ)音大模型支持自然語(yǔ)義理解、情感表達(dá)和同聲傳譯,圖像&多模態(tài)大模型強(qiáng)化中國(guó)特色與東方美學(xué)融合生成能力。
3、開源版NotebookLM來了!Podcastfy:輸入PDF、文本、網(wǎng)址等即可轉(zhuǎn)換成播客
在數(shù)字時(shí)代,制作引人入勝的多語(yǔ)言音頻內(nèi)容成為熱門話題。谷歌的NotebookLM備受好評(píng),而開源Python軟件包Podcastfy引起廣泛關(guān)注。Podcastfy是開源版NotebookLM,采用先進(jìn)的生成式人工智能技術(shù),讓用戶實(shí)現(xiàn)更多個(gè)性化和規(guī)?;牟タ椭谱鳌?/p>
【AiBase提要:】
?? Podcastfy是開源Python軟件包,可將文本和網(wǎng)絡(luò)內(nèi)容轉(zhuǎn)換為多語(yǔ)言音頻對(duì)話。
?? 用戶可以通過Gradio演示應(yīng)用或HuggingFace體驗(yàn)Podcastfy,操作簡(jiǎn)單易上手。
?? 使用外部?jī)?nèi)容時(shí),需確保擁有版權(quán)和權(quán)限,生成的音頻內(nèi)容由AI生成,不模仿現(xiàn)實(shí)人物。
詳情鏈接:https://github.com/souzatharsis/podcastfy-demo?tab=readme-ov-file
4、圖像修復(fù)新魔法!突破性算法PMRF
PMRF(后驗(yàn)均值修正流)算法是圖像處理領(lǐng)域的一項(xiàng)創(chuàng)新技術(shù),解決了圖像恢復(fù)中失真與感知質(zhì)量之間的矛盾,開辟了高質(zhì)量圖像重建的新可能。其獨(dú)特之處在于在多種圖像恢復(fù)任務(wù)中展現(xiàn)卓越性能,取得了令人矚目的成績(jī),平衡了失真和感知質(zhì)量。
【AiBase提要:】
? PMRF算法巧妙結(jié)合后驗(yàn)均值預(yù)測(cè)和修正流模型,創(chuàng)造全新圖像恢復(fù)框架,最大程度減少失真,提升感知質(zhì)量。
?? 應(yīng)用廣泛,涵蓋去噪、超分辨率、修復(fù)受損區(qū)域和顏色恢復(fù)等多個(gè)方面,生成自然真實(shí)圖像。
?? 在基準(zhǔn)和真實(shí)數(shù)據(jù)集測(cè)試中,PMRF表現(xiàn)優(yōu)異,平衡失真和感知質(zhì)量,樹立新的圖像恢復(fù)標(biāo)準(zhǔn)。
詳情鏈接:https://huggingface.co/spaces/ohayonguy/PMRF
5、沃爾瑪推出新型人工智能模型 Wallaby
沃爾瑪最近推出了名為Wallaby的大型語(yǔ)言模型,專注于零售行業(yè)數(shù)據(jù),旨在提升客戶服務(wù)體驗(yàn)。他們采用多模型組合的方法,靈活應(yīng)對(duì)不同應(yīng)用需求。升級(jí)后的客戶支持助手能夠更精準(zhǔn)地理解客戶意圖,提供個(gè)性化服務(wù)。
【AiBase提要:】
? 沃爾瑪推出 Wallaby 大型語(yǔ)言模型,專注于零售行業(yè)數(shù)據(jù),旨在提升客戶服務(wù)體驗(yàn)。
?? 沃爾瑪采用多模型組合的方法,靈活應(yīng)對(duì)不同應(yīng)用需求。
??? 升級(jí)后的客戶支持助手能夠更精準(zhǔn)地理解客戶意圖,提供個(gè)性化服務(wù)。
6、夸張!GPT-4無意中掌握面部識(shí)別技術(shù),準(zhǔn)確率超越專業(yè)算法
最近的研究顯示,GPT-4具備了面部識(shí)別、性別判斷和年齡估算能力,準(zhǔn)確率超越專業(yè)算法,但存在安全隱患。研究揭示了繞過GPT-4安全機(jī)制的方法,引發(fā)了對(duì)大型語(yǔ)言模型安全性的思考。盡管GPT-4在生物識(shí)別任務(wù)表現(xiàn)出色,研究作者警告不能完全依賴其識(shí)別能力。
【AiBase提要:】
?? GPT-4在性別識(shí)別測(cè)試中達(dá)到了100%的完美準(zhǔn)確率,超越了DeepFace模型。
?? GPT-4的年齡估算準(zhǔn)確率為74.25%,但對(duì)年長(zhǎng)者的估算可能較寬泛。
?? 研究發(fā)現(xiàn)可繞過GPT-4的安全機(jī)制,需加強(qiáng)對(duì)大型語(yǔ)言模型安全性的研究。
7、200萬(wàn)用戶量!Hugging Face旗下Gradio5發(fā)布:用自然語(yǔ)言輕松構(gòu)建AI應(yīng)用
Hugging Face旗下Gradio5發(fā)布,致力于簡(jiǎn)化AI開發(fā),提供企業(yè)級(jí)安全性和AI Playground功能,進(jìn)一步推動(dòng)AI應(yīng)用開發(fā)體驗(yàn)。
【AiBase提要:】
?? Gradio5引入企業(yè)級(jí)安全性,確保應(yīng)用安全無憂。
?? 新增的AI Playground功能,簡(jiǎn)化開發(fā)流程,讓生成應(yīng)用變得輕松。
?? Hugging Face規(guī)劃未來,推出多種新功能,進(jìn)一步提升AI應(yīng)用開發(fā)體驗(yàn)。
詳情鏈接:https://www.gradio.app/
8、OpenAI 申請(qǐng)法庭駁回馬斯克訴訟,稱其為 “騷擾” 行為
在這篇文章中,OpenAI向法庭申請(qǐng)駁回馬斯克對(duì)公司的訴訟,稱其為“騷擾”行為。文章揭示了馬斯克和OpenAI之間的法律糾紛背景,強(qiáng)調(diào)馬斯克的指控缺乏證據(jù),并質(zhì)疑他的法律地位。
【AiBase提要:】
?? 馬斯克對(duì) OpenAI 的多項(xiàng)訴訟被 OpenAI 稱為 “騷擾”,并申請(qǐng)駁回。
?? OpenAI 強(qiáng)調(diào)馬斯克的指控缺乏證據(jù),稱其為不切實(shí)際的主張。
?? 馬斯克聲稱 OpenAI 未遵循創(chuàng)始協(xié)議的承諾,但法律上被質(zhì)疑無權(quán)提出此類指控。
9、Zoom推數(shù)字分身功能:便利還是隱憂?
Zoom計(jì)劃推出數(shù)字分身功能引發(fā)了人們對(duì)于深度偽造技術(shù)的擔(dān)憂。雖然這項(xiàng)功能能提高視頻創(chuàng)作效率,但也可能帶來虛假信息傳播的風(fēng)險(xiǎn)。
【AiBase提要:】
? Zoom計(jì)劃推出數(shù)字分身功能,將用戶視頻轉(zhuǎn)化為AI驅(qū)動(dòng)的逼真數(shù)字化身,提高異步交流效率。
?? 深度偽造技術(shù)的普及使得區(qū)分真相和虛假信息變得困難,可能導(dǎo)致虛假視頻的濫用。
?? Zoom對(duì)安全措施描述模糊,仍需加強(qiáng)保護(hù)措施以防止惡意虛假視頻的生成。
10、DressRecon:輸入視頻就能構(gòu)建出還原服裝細(xì)節(jié)的3D模型
近日,卡內(nèi)基梅隆大學(xué)的研究團(tuán)隊(duì)發(fā)布了名為“DressRecon”的新技術(shù),通過單目視頻實(shí)現(xiàn)高質(zhì)量的人體重建,尤其適用于寬松衣物和手持物體的場(chǎng)景。該技術(shù)利用神經(jīng)隱式模型將身體與衣物變形分開處理,借助圖像基礎(chǔ)的先驗(yàn)知識(shí)捕捉細(xì)微幾何特征。重建結(jié)果生成高保真的三維模型,支持從任意角度渲染,提升了可視化體驗(yàn)。
【AiBase提要:】
?? 研究團(tuán)隊(duì)推出DressRecon技術(shù),通過單目視頻實(shí)現(xiàn)高質(zhì)量的人體重建,特別適用于寬松衣物和手持物體的場(chǎng)景。
?? 該技術(shù)利用神經(jīng)隱式模型將身體與衣物變形分開處理,借助圖像基礎(chǔ)的先驗(yàn)知識(shí)來捕捉細(xì)微幾何特征。
?? 重建結(jié)果不僅生成高保真的三維模型,還支持從任意角度渲染,提升了可視化體驗(yàn)。
詳情鏈接:https://jefftan969.github.io/dressrecon/
11、DreamWaltz-G:從文本生成生動(dòng)的3D 可動(dòng)畫頭像
在數(shù)字化時(shí)代,個(gè)性化的虛擬形象受到關(guān)注。DreamWaltz-G框架通過結(jié)合骨骼引導(dǎo)的得分蒸餾和混合3D高斯表示,提升了頭像生成的一致性和動(dòng)畫表現(xiàn)力。該框架支持形狀控制、視頻重演和多主體場(chǎng)景構(gòu)建,拓展了數(shù)字內(nèi)容創(chuàng)作的可能性。
【AiBase提要:】
?? 創(chuàng)新框架DreamWaltz-G能根據(jù)文本描述生成生動(dòng)的3D可動(dòng)畫頭像。
?? 結(jié)合骨骼引導(dǎo)的得分蒸餾和混合3D高斯表示,提升頭像生成的一致性和動(dòng)畫表現(xiàn)力。
?? 支持形狀控制、視頻重演和多主體場(chǎng)景構(gòu)建,拓展了數(shù)字內(nèi)容創(chuàng)作的可能性。
(舉報(bào))