歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、炸裂!Runway Gen 3可以生成電影片頭3D巨幅字幕效果了
Runway最新推出的Gen-3Alpha視頻生成模型在保真度、一致性和動作表現(xiàn)方面有重大改進(jìn),不僅生成穩(wěn)定光影,還展現(xiàn)強(qiáng)大想象力。內(nèi)測博主展示了3D巨幅字幕效果,Gen3即將對所有人開放使用。模型精細(xì)控制運(yùn)動,審美強(qiáng)大,想象力豐富,符合物理規(guī)律,生成速度快。
【AiBase提要:】
?? Runway Gen3 可模仿漫威電影片頭效果制作3D巨幅字幕效果
?? 極度穩(wěn)定的光影效果,保持高質(zhì)量輸出,即使在高速移動場景中
?? 控制模式包括 Motion Brush、高級攝像頭控制、導(dǎo)演模式,生成速度快,審美強(qiáng)大
詳情鏈接:https://top.aibase.com/tool/gen-3-alpha
2、百度網(wǎng)盤一刻相冊App推出寶寶AI長相預(yù)測功能
百度網(wǎng)盤一刻相冊App推出了AI長相預(yù)測功能,用戶上傳照片即可預(yù)測寶寶未來樣子,訓(xùn)練數(shù)據(jù)貼合中國寶寶特征,操作簡單快速。未來將開發(fā)更多實(shí)用AI功能,征集用戶意見。
【AiBase提要:】
?? 預(yù)測寶寶未來樣子,訓(xùn)練數(shù)據(jù)貼合中國寶寶特征,操作簡單快速。
?? 上傳照片即可得到高清預(yù)測圖像,提供多種時尚濾鏡效果供選擇。
?? 未來將開發(fā)更多實(shí)用AI功能,如預(yù)測孩子不同成長階段的樣子,征集用戶意見。
3、谷歌推出AI視頻編輯應(yīng)用Google Vids 上線測試
谷歌最新推出的AI視頻編輯應(yīng)用Google Vids在測試中展現(xiàn)出強(qiáng)大的功能和用戶友好的特點(diǎn),為用戶提供了高效、便捷的視頻編輯工具。該應(yīng)用集成Gemini大模型,幫助用戶輕松創(chuàng)建視頻內(nèi)容,降低了視頻制作門檻,未來有望成為視頻創(chuàng)作者的得力助手。
【AiBase提要:】
? Google Vids集成Gemini大模型,可幫助用戶創(chuàng)建幻燈片、編寫視頻腳本,并制作分鏡頭腳本。
?? 用戶通過添加或刪除元素來編輯視頻,最終導(dǎo)出為MP4文件,入口位于Google Docs文檔處理工具中。
?? Google Vids的上線測試豐富了Google Workspace套件,展示強(qiáng)大的AI技術(shù)能力,為用戶提供便捷的視頻編輯工具。
4、Luma AI新功能:首尾幀生成視頻與向后延長5秒
Luma AI推出了新功能,讓視頻創(chuàng)作充滿無限可能,雖然偶爾會有硬切換畫面,但這正是剪輯的魅力所在,讓每一秒充滿驚喜和創(chuàng)意。未來的視頻生成將基于這種延長操作完成,實(shí)現(xiàn)智能個性化的視頻創(chuàng)作。
【AiBase提要:】
? 視頻延長魔法:首尾幀生成視頻能力,向后延長5秒,讓每一幀充滿無限可能
?? 創(chuàng)新視頻功能“Extend”:智能分析視頻內(nèi)容,保持原有風(fēng)格和對象一致性的基礎(chǔ)上延長視頻長度
?? Dream Machine模型發(fā)布:支持文本和圖片輸入,生成高質(zhì)量視頻,模擬現(xiàn)實(shí)物理特性,免費(fèi)開放體驗(yàn)
詳情鏈接:https://top.aibase.com/tool/dream-machine
5、全新Solos AirGo Vision智能眼鏡發(fā)布
Solos公司在香港智能眼鏡峰會上發(fā)布了全新的Solos AirGo Vision智能眼鏡,集成了ChatGPT-4o的可穿戴AI大腦,讓用戶的雙眼瞬間升級為超能力。這款智能眼鏡不僅支持實(shí)時問答和視覺提示,還具備多語言翻譯功能,模塊化設(shè)計(jì),售價為249美元。
【AiBase提要:】
? 集成 ChatGPT-4o 的多模態(tài) AI 功能,支持實(shí)時問答和視覺提示
? 支持超過10種語言的實(shí)時翻譯,輕松打破語言障礙
? 模塊化設(shè)計(jì),可替換不同樣式的傳統(tǒng)框架,售價為249美元
6、商湯如影AI視頻生成平臺推出央視記者王冰冰AI數(shù)字人
商湯科技的AI數(shù)字人“AI冰冰”在《2024中國?AI 盛典》中首次亮相,展現(xiàn)了出色的多語言能力和逼真的視覺效果。數(shù)字人技術(shù)在傳媒行業(yè)具有巨大潛力,能夠拉近人物IP與受眾之間的距離。
【AiBase提要:】
? 商湯科技創(chuàng)造的AI數(shù)字人“AI冰冰”在舞臺上展現(xiàn)出專業(yè)且自然的表現(xiàn),得益于SenseNova大模型技術(shù)。
?? 如影平臺的AI視頻生成技術(shù)實(shí)現(xiàn)了高清復(fù)制和自然的表情、嘴型、動作效果,展示出卓越的語言能力。
?? 商湯如影提供強(qiáng)大的核心技術(shù)支持,使AI冰冰能夠展現(xiàn)逼真的視覺效果和流暢的多語種表達(dá)能力。
7、知乎宣布推出獨(dú)立AI搜索平臺「知乎直答」
知乎最近推出了全新AI產(chǎn)品「知乎直答」,旨在提升問答效率和質(zhì)量,縮短用戶與優(yōu)質(zhì)回答之間的距離,增強(qiáng)社區(qū)創(chuàng)作者內(nèi)容的流通。這一舉措預(yù)示著問答社區(qū)將進(jìn)入更智能和個性化的新時代。
【AiBase提要:】
?? 知乎直答是基于知乎豐富問答數(shù)據(jù)開發(fā)的AI產(chǎn)品,提供簡略和深入兩種答案生成方式,支持用戶快速找到所需內(nèi)容或?qū)<摇?/p>
?? 產(chǎn)品定位為生產(chǎn)力工具和發(fā)現(xiàn)世界的連接器,幫助用戶通過提問來探索世界的能力。
?? 未來計(jì)劃推出App版本,引入多模態(tài)能力,與知乎社區(qū)深度融合,探索對外合作,為整個問答領(lǐng)域帶來新的發(fā)展方向。
詳情鏈接:https://zhida.zhihu.com/
8、WhatsApp最新Android測試版2.24.14.7推出選擇Meta AI Llama模型功能
WhatsApp最新測試版引入了選擇Meta AI Llama模型的功能,用戶可以根據(jù)需求自定義AI交互體驗(yàn),體驗(yàn)更快速簡單的回應(yīng)或處理更復(fù)雜的查詢。該功能展示了WhatsApp在AI領(lǐng)域持續(xù)創(chuàng)新的決心。
【AiBase提要:】
?? WhatsApp最新Android測試版2.24.14.7通過Google Play Beta計(jì)劃推出選擇Meta AI Llama模型功能。
?? 用戶可以選擇默認(rèn)的Llama3-70B模型獲得更快速簡單的回應(yīng),或選擇高級的Llama3-405B模型處理更復(fù)雜的查詢。
?? WhatsApp計(jì)劃提供更先進(jìn)的Llama3-405B模型預(yù)覽版,每周有使用次數(shù)限制,達(dá)到限制后用戶將回到默認(rèn)模型繼續(xù)對話。
9、蘋果可能在今年秋季宣布與谷歌 Gemini 的交易
蘋果計(jì)劃在今年秋季推出與谷歌 Gemini 的整合交易以及測試版的 Apple Intelligence,將人工智能作為直接盈利途徑。第三方AI服務(wù)可能成為蘋果的過渡選擇,同時蘋果將逐步推出自己的生成式AI系統(tǒng)。
【AiBase提要:】
?? 蘋果計(jì)劃整合谷歌 Gemini 到設(shè)備中,推出測試版的 Apple Intelligence。
?? 蘋果將人工智能作為直接盈利途徑,不僅僅是推動硬件銷售的功能。
?? 第三方AI服務(wù)可能成為蘋果的過渡選擇,同時蘋果將逐步推出自己的生成式AI系統(tǒng)。
10、GPTPdf:使用類似GPT-4o的多模態(tài)LLM分析PDF文件
近日,一款名為gptpdf的開源項(xiàng)目在github贊火,使用了類似 GPT-4o 的 VLLM 模型解析 PDF 文件并轉(zhuǎn)換為 Markdown 格式。該項(xiàng)目代碼簡潔高效,只有293行,卻能完美解析排版、數(shù)學(xué)公式、表格、圖片、圖表等各種內(nèi)容。費(fèi)用每頁平均成本為0.013美元。
【AiBase提要:】
?? 使用類似 GPT-4o 多模態(tài)模型解析 PDF 文件,轉(zhuǎn)換為 Markdown 格式。
?? 代碼簡潔高效,僅293行。
?? 解析結(jié)果幾乎完美包括排版、數(shù)學(xué)公式、表格、圖片、圖表等內(nèi)容。
詳情鏈接:https://top.aibase.com/tool/gptpdf
11、AI音頻魔法師Resona V2A 可自動為視頻配音效
在AI技術(shù)大行其道的時代,Resona V2A技術(shù)橫空出世,像一位神奇的魔術(shù)師,讓視頻自動開口,唱出屬于自己的旋律。這不僅是技術(shù)突破,更是創(chuàng)意者的福音。Resona V2A一鍵生成音頻,快速高效,創(chuàng)意者得力助手。高性價比,成本降低99%,提供高質(zhì)量音頻解決方案。
【AiBase提要:】
?? 視頻自動開口,唱出屬于自己的旋律,技術(shù)突破與創(chuàng)意者福音。
?? 一鍵生成音頻,快速高效,加快音頻生成速度,創(chuàng)意者投入更多時間和精力到視頻創(chuàng)意設(shè)計(jì)。
?? 成本降低99%,高性價比的音頻解決方案,滿足不同用戶需求。
詳情鏈接:https://top.aibase.com/tool/resona-v2a
12、AI換裝黑科技 MMTryon虛擬試穿框架可按需搭配一鍵疊穿
中山大學(xué)和字節(jié)智創(chuàng)數(shù)字人團(tuán)隊(duì)聯(lián)合推出的MMTryon虛擬試穿框架顛覆了傳統(tǒng)換裝方式,實(shí)現(xiàn)一鍵生成模特試穿效果,質(zhì)量高且操作簡便。其服裝編碼器和多模態(tài)多參考注意機(jī)制讓換裝更精確靈活,打破了傳統(tǒng)算法束縛,獲得新SOTA。MMTryon不僅可試穿單件服裝,還支持組合換裝,無需分割,通過文本指令即可實(shí)現(xiàn)高質(zhì)量虛擬換裝。
【AiBase提要:】
?? 一鍵生成模特試穿效果,質(zhì)量高且操作簡便
?? 打破傳統(tǒng)算法束縛,獲得新SOTA,支持組合換裝
?? 利用服裝編碼器和多模態(tài)多參考注意機(jī)制,換裝更精確靈活
詳情鏈接:https://arxiv.org/abs/2405.00448
(舉報(bào))