歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產(chǎn)品應用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、生圖能力超越Flux1.1Pro!神秘AI模型紅熊貓Red_panda橫空出世
一款名為red_panda的神秘AI圖像生成模型在Artificial Analysis的基準測試中表現(xiàn)驚人,超越了行業(yè)領軍企業(yè)的產(chǎn)品。其在文本轉(zhuǎn)圖像測試中以1244分的成績領跑,展現(xiàn)出技術優(yōu)勢和高效率。紅熊貓的真實感圖像超越了傳統(tǒng)AI作品,展現(xiàn)出色的文本提示理解和執(zhí)行能力。紅熊貓的橫空出世推動了行業(yè)標準的提升,引發(fā)關注。
【AiBase提要:】
?? 紅熊貓AI模型在基準測試中以1244分的成績領跑,超越行業(yè)領軍企業(yè)產(chǎn)品
?? 紅熊貓生成的圖像具有極高的真實感,超越了傳統(tǒng)AI作品
?? 紅熊貓的橫空出世推動了行業(yè)標準的提升,引發(fā)關注
詳情鏈接:https://artificialanalysis.ai/text-to-image/arena
2、xAI為Grok添加圖像理解功能 還能看懂梗圖的幽默
馬斯克旗下xAI公司最新為其AI模型Grok增添了圖像理解功能,用戶可上傳圖片向AI助手提問。馬斯克展示了Grok的新能力,包括理解圖片內(nèi)容和幽默元素。功能仍在早期階段,團隊將持續(xù)改進。xAI通過與黑森林實驗室合作,新增多模態(tài)理解功能,提升用戶體驗和開發(fā)者API。
【AiBase提要:】
? 圖像理解功能:Grok現(xiàn)可理解圖片內(nèi)容和幽默元素。
?? 功能擴展:自推出Grok-2模型以來,xAI不斷擴展功能,與FLUX.1模型合作實現(xiàn)圖像生成。
?? 用戶體驗提升:新增多模態(tài)理解功能,馬斯克承諾很快實現(xiàn)文檔處理需求。
3、又要被玩壞了!PixVerse V3升級:不但能玩AI捏捏,還能讓杯子長腿
PixVerse V3版本帶來了全方位的功能升級,讓創(chuàng)作者體驗更專業(yè)、更有趣。從視頻特效到風格功能再到視頻延長,都有顯著提升,為內(nèi)容創(chuàng)作者提供更全面、更專業(yè)的視頻創(chuàng)作平臺。
【AiBase提要:】
? 視頻特效升級:新增萬圣節(jié)主題特效,操作簡單直觀,豐富節(jié)日創(chuàng)作素材。
?? 風格功能升級:支持動漫、3D動畫、粘土和寫實四種風格,可應用于不同場景。
?? 視頻延長功能:用戶可額外增加5-8秒內(nèi)容,精確控制新增片段內(nèi)容走向,生成連貫動作畫面。
詳情鏈接:https://app.pixverse.ai/home
4、谷歌Gmail網(wǎng)頁版上線AI功能 “幫我寫”,郵件撰寫潤色更輕松
谷歌在網(wǎng)頁版Gmail上推出了“幫我寫”功能,利用Gemini AI幫助用戶撰寫和修改郵件,提升了郵件撰寫的便利性和效率。這一功能僅限于訂閱Google One AI Premium或擁有Gemini Workspace插件的用戶使用,為用戶提供了個性化的郵件撰寫體驗。新增的“潤色”快捷方式讓用戶可以快速優(yōu)化郵件內(nèi)容,進一步提升郵件的質(zhì)量。
【AiBase提要:】
?? “幫我寫”功能上線網(wǎng)頁版Gmail,利用Gemini AI幫助用戶撰寫和修改郵件。
?? 僅限訂閱Google One AI Premium或擁有Gemini Workspace插件的用戶使用。
? 新增“潤色”快捷方式,方便用戶快速優(yōu)化郵件內(nèi)容。
5、視頻理解領域殺出黑馬!Video-XL這款模型能處理長達一小時的視頻!
Video-XL是一款專為高效的小時級視頻理解而設計的超長視覺語言模型,利用“視覺上下文潛在摘要”技術將長視頻內(nèi)容壓縮成精簡形式,提高效率并保留關鍵信息。在多個長視頻理解基準測試中表現(xiàn)出色,效率和效果平衡。應用前景廣闊,可用于電影摘要、監(jiān)控異常檢測和廣告植入識別。
【AiBase提要:】
?? Video-XL是專為處理超長視頻而設計的超長視覺語言模型,利用視覺上下文潛在摘要技術壓縮視頻內(nèi)容。
?? Video-XL在多個長視頻理解基準測試中表現(xiàn)領先,尤其在VNBench測試中準確率高出近10%。
?? Video-XL在效率和效果之間取得平衡,在單個80GB GPU上處理2048幀視頻,同時保持近95%的準確率。
詳情鏈接:https://github.com/VectorSpaceLab/Video-XL
6、蘋果iOS18.2確認于12月推送 將為Siri植入ChatGPT
蘋果公司宣布將在12月推出iOS18.2、iPadOS18.2和macOS Sequoia15.2系統(tǒng)更新,引入革命性的AI功能升級,包括Siri首次接入ChatGPT,為用戶帶來更智能、更便捷的體驗。系統(tǒng)強調(diào)用戶隱私保護,整合頂級AI技術與硬件優(yōu)勢,展現(xiàn)了蘋果在AI領域的雄心。
【AiBase提要:】
?? Siri將首次接入ChatGPT,用戶無需額外注冊賬戶即可免費使用
?? ChatGPT整合到系統(tǒng)寫作工具中,提升創(chuàng)作能力
?? 蘋果采取嚴格安全措施保護用戶隱私,不保存ChatGPT使用記錄
7、報道稱,Meta 正在研發(fā)自家AI搜索引擎,減少對谷歌依賴
最近,據(jù)報道,Meta 正在開發(fā)一款全新的人工智能搜索引擎,旨在減少對谷歌和微軟的依賴。這一舉措將為Meta的聊天機器人提供AI生成的時事摘要,進一步深入信息獲取領域。科技巨頭之間的競爭日益激烈,Meta、蘋果、OpenAI等公司都在推出創(chuàng)新產(chǎn)品以滿足用戶需求。
【AiBase提要:】
?? Meta 正在開發(fā)AI搜索引擎,減少對谷歌的依賴。
?? 新的搜索引擎將為Meta的聊天機器人提供AI生成的時事摘要。
?? Meta與路透社達成合作,讓聊天機器人可使用其新聞文章進行回答。
8、智源推出全能視覺生成模型 OmniGen 集多項能力于一體
北京智源人工智能研究院(BAAI)推出全新全能視覺生成模型OmniGen,標志著圖像生成領域重大突破。OmniGen以統(tǒng)一性、簡單性和跨任務知識遷移能力著稱,可處理多種圖像生成任務,包括文生圖、圖像編輯、主題驅(qū)動生成和視覺條件生成。模型簡化架構、用戶友好操作,無需插件或復雜步驟,能有效跨任務遷移知識,展示新穎功能。
【AiBase提要:】
?? OmniGen模型集多項能力于一體,處理多種圖像生成任務。
?? 模型簡化架構、用戶友好操作,無需額外插件,可完成復雜任務。
?? OmniGen開源權重和代碼,構建大規(guī)模統(tǒng)一圖像生成數(shù)據(jù)集X2I,推動通用圖像生成領域發(fā)展。
詳情鏈接:https://arxiv.org/pdf/2409.11340
9、突破性開源項目:手機也能運行的輕量級數(shù)字人來了
近日,一個名為Ultralight-Digital-Human的開源項目成功解決了數(shù)字人技術在移動端的部署難題,讓普通智能手機也能實時運行數(shù)字人應用,為相關技術的普及帶來新的可能。該項目采用了創(chuàng)新的深度學習技術,通過算法優(yōu)化和模型壓縮,成功將龐大的數(shù)字人系統(tǒng)瘦身到可以在移動設備上流暢運行的程度。
【AiBase提要:】
?? 創(chuàng)新深度學習技術實現(xiàn)數(shù)字人在移動設備上流暢運行
?? 集成Wenet和Hubert音頻特征提取方案,提升數(shù)字人唇形同步效果
?? 提供完整的訓練流程文檔,讓開發(fā)者輕松訓練自己的數(shù)字人模型
詳情鏈接:https://github.com/anliyuan/Ultralight-Digital-Human
10、環(huán)球音樂與AI公司攜手打造 “有道德” 的AI 音樂生成模型KLayMM
環(huán)球音樂集團與Klay Vision合作開發(fā)道德音樂生成模型KLayMM,旨在推動可持續(xù)AI音樂創(chuàng)作。這一合作標志著音樂行業(yè)對AI技術的重視,展示了新的音樂創(chuàng)作方向。
【AiBase提要:】
?? UMG與Klay Vision合作推出KLayMM,尊重版權與藝術家權益。
?? 模型將與音樂行業(yè)合作,確保AI內(nèi)容準確歸屬與可持續(xù)發(fā)展。
?? Klay Vision建立全球生態(tài)系統(tǒng),促進AI音樂創(chuàng)作與版權變現(xiàn)。
11、蘋果推配備M4的新款iMac Apple Intelligence解鎖Mac更多可能
蘋果公司發(fā)布了全新的iMac,搭載強大的M4芯片和Apple Intelligence,保持超薄設計。新款iMac將于11月8日正式發(fā)售,起價1299美元。M4芯片帶來顯著性能提升,日常生產(chǎn)力提升1.7倍,處理照片編輯和游戲速度提升2.1倍。Apple Intelligence帶來全新體驗,結合生成模型和隱私保護功能,解鎖Mac新方式。
【AiBase提要:】
?? M4芯片帶來顯著性能提升,日常生產(chǎn)力提升1.7倍,處理照片編輯和游戲速度提升2.1倍。
?? Apple Intelligence結合生成模型和隱私保護功能,為用戶解鎖Mac新方式。
?? 新款iMac提供七種鮮艷配色,24英寸4.5K視網(wǎng)膜顯示屏、1200萬像素Center Stage攝像頭等功能。
12、周鴻祎:AI不該成為超級神明,而應是人類的茶葉蛋
周鴻祎在新浪新聞探索大會上分享了對人工智能發(fā)展的獨特見解,強調(diào)AI應賦能而非簡單替代人類,呼吁降低AI應用成本實現(xiàn)產(chǎn)業(yè)重塑。他認為中國應走專業(yè)化發(fā)展道路,與具體行業(yè)需求結合,提升生產(chǎn)效率。
【AiBase提要:】
?? AI不應成為宇宙超級無敵存在,而應降低應用成本實現(xiàn)產(chǎn)業(yè)重塑。
?? AI技術目前僅能模擬人腦部分功能,短期內(nèi)不構成威脅。
?? AI發(fā)展應專業(yè)化,如DeepMind的AlphaGo和AlphaFold,在特定領域發(fā)揮優(yōu)勢。
13、預測:生成式AI將產(chǎn)生大量電子廢物
近日,劍橋大學和中國科學院的研究人員發(fā)表論文指出,到2030年,生成式AI可能每年產(chǎn)生相當于超過10億部iPhone的電子廢物。研究旨在提前了解技術發(fā)展帶來的后果,提出減少廢物的建議。
【AiBase提要:】
?? 生成式AI預計每年產(chǎn)生超過10億部iPhone的電子廢物
?? 減少廢物產(chǎn)生的建議包括降級處理和再利用組件
?? 通過采取措施,電子廢物產(chǎn)生量可減少16%到86%
(舉報)