歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產(chǎn)品應用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、OpenAI正式上線Sora,ChatGPT Pro用戶可無限生成、最長20秒
OpenAI 在 "ship-mas" 系列活動中發(fā)布了 Sora Turbo 視頻生成 AI,支持生成20秒1080p 視頻,用戶可通過文本、圖片或視頻進行創(chuàng)作,具有多種風格和剪輯功能。該平臺強調創(chuàng)意表達與內容安全,用戶可瀏覽其他創(chuàng)作者的視頻。
【AiBase 提要:】
?? Sora Turbo 支持生成最高1080p 分辨率的20秒視頻。
?? 用戶可以使用多種工具進行創(chuàng)意視頻制作。
?? 所有生成視頻均附加水印和 C2PA 元數(shù)據(jù)確保安全。
詳情鏈接:https://sora.com/
2、智譜AI上線免費多模態(tài)模型GLM-4V-Flash:圖像處理精確度提升
北京智譜華章科技有限公司推出了其首個免費多模態(tài)API——GLM-4V-Flash,旨在提升圖像處理的精確度,降低開發(fā)者的使用門檻。該模型支持多種語言,并具備多項高級圖像處理功能,如圖像描述生成和視覺問答等,能夠為特定行業(yè)提供精準解決方案。
【AiBase提要:】
?? GLM-4V-Flash是首個免費多模態(tài)API,支持26種語言,降低開發(fā)門檻。
?? 具備圖像描述生成、分類、視覺推理等高級功能,適用于多個行業(yè)。
?? 該模型已在社交媒體、教育、美容等領域展現(xiàn)出顯著效益。
詳情鏈接:https://www.bigmodel.cn/console/trialcenter
3、騰訊云AI代碼助手上線,基于混元大模型打造
騰訊云推出的AI代碼助手旨在通過預測和提供代碼建議來幫助程序員提升開發(fā)效率。該工具利用混元大模型,能夠深入理解代碼上下文,提供精準的代碼補全建議,超越傳統(tǒng)的關鍵詞匹配方式。它不僅能適應程序員的編碼風格,還在多個關鍵場景中展現(xiàn)了強大的編碼輔助能力,如生成正則表達式、快速生成前端頁面以及清晰解讀復雜代碼。
【AiBase提要:】
?? AI代碼助手通過深入理解代碼上下文,提供精準的代碼補全建議,顯著提升開發(fā)效率。
?? 該助手能夠學習程序員的編碼風格,提供定制化的代碼補全,貼合個人習慣。
?? 通過混元大模型,AI代碼助手在多個場景中展現(xiàn)強大能力,包括生成正則表達式和快速適配新接口規(guī)范。
4、可靈AI API V1.5模型新增標準std模式、V1.0模型新增運動筆刷
北京快手科技有限公司近日推出了可靈AI的API V1.5模型標準模式和V1.0模型的“運動筆刷”功能。這些更新旨在提升用戶體驗,增強藝術創(chuàng)作的靈活性與效率。V1.5模型以其卓越的效果和快速的處理速度為用戶提供了高性價比的選擇,而V1.0模型的新功能則允許用戶為圖片中的人物或物體指定運動軌跡,帶來了更精準的運動控制和生動的表現(xiàn)。
【AiBase提要:】
? V1.5模型標準模式提供了出色的效果和快速的處理速度,提升用戶體驗。
??? V1.0模型新增的“運動筆刷”功能允許用戶指定運動軌跡,實現(xiàn)精準控制。
?? 新功能豐富了可靈AI的功能,為視覺藝術創(chuàng)作帶來了創(chuàng)新的可能性。
5、書生·萬象多模態(tài)大模型InternVL2.5開源 性能媲美GPT-4o
上海 AI 實驗室推出的書生·萬象InternVL2.5模型在多模態(tài)理解基準上取得了超過70%的準確率,成為首個開源模型與商業(yè)模型如GPT-4o和Claude-3.5-Sonnet相媲美。該模型通過鏈式思考推理技術提升了性能,并在多個領域展現(xiàn)了強大的測試時間可擴展性及多學科推理能力。
【AiBase提要:】
?? InternVL2.5模型在多模態(tài)理解基準上達到了超過70%的準確率,表現(xiàn)出色。
?? 通過鏈式思考推理技術,該模型實現(xiàn)了3.7個百分點的性能提升,展現(xiàn)了強大的可擴展性。
?? 開源特性使得研究人員和開發(fā)者能夠自由訪問和使用該模型,推動多模態(tài)AI技術的發(fā)展。
詳情鏈接:https://www.modelscope.cn/collections/InternVL-25-fbde6e47302942
6、Swift Ventures發(fā)布AI公司指數(shù)明確人工智能投資標準
Swift Ventures推出了一項新的人工智能公司指數(shù),旨在幫助投資者識別真正進行AI技術投資的上市公司。該指數(shù)分析了數(shù)千份數(shù)據(jù),發(fā)現(xiàn)盡管公司在財報中頻繁提及AI,實際大規(guī)模投資的公司卻寥寥無幾。當前追蹤的90家公司在AI研究和人才密度方面表現(xiàn)突出,年增長率遠超市場平均水平。
【AiBase提要:】
?? 該指數(shù)追蹤約90家公司,依據(jù)AI研究投資、人才密度和AI收入進行評分。
?? 投資AI研究的公司,其平均毛利潤是未投資公司的兩倍,顯示出研究與盈利能力的正相關。
?? 一些低調公司在AI領域表現(xiàn)出色,年增長率超過50%,表明AI轉型已超越大技術公司。
7、量子計算驚天一躍!谷歌Willow芯片5分鐘搞定138億年計算,OpenAI都看傻了
谷歌的Willow量子芯片在量子計算領域取得了劃時代的突破,成功將計算任務從傳統(tǒng)計算機需要的10^25年縮短至僅5分鐘,展示了量子技術的巨大潛力。通過精細的工程設計,Willow在增加量子比特數(shù)量的同時,顯著降低了計算誤差,推動了量子計算的進步。
【AiBase提要:】
? Willow芯片在量子計算中實現(xiàn)了低于閾值的誤差控制,錯誤率顯著降低。
?? 計算速度驚人,10^25年的任務僅需5分鐘,展現(xiàn)了量子計算的巨大潛力。
?? Willow的進步引發(fā)了對加密安全的擔憂,尤其是對比特幣等加密貨幣的潛在威脅。
8、宅男福音!VR角色扮演AI來了,南洋理工“造人”新突破,唱跳互動還能陪你聊!
新加坡南洋理工大學的研究團隊推出了名為SOLAMI的AI技術,能夠創(chuàng)造出活靈活現(xiàn)的3D虛擬角色,支持實時互動、語音理解和動作響應。該技術利用深度學習,將用戶的語音和動作轉化為虛擬角色可理解的語言,提供自然流暢的互動體驗。SOLAMI還配備VR界面,用戶可通過VR設備與虛擬角色進行面對面交流。
【AiBase提要:】
?? SOLAMI是一個端到端的社會視覺-語言-動作建模框架,實現(xiàn)用戶與虛擬角色的自然互動。
?? SynMSI合成數(shù)據(jù)集為訓練提供了豐富的對話和動作數(shù)據(jù),解決了數(shù)據(jù)缺乏的問題。
?? SOLAMI的沉浸式VR界面讓用戶能夠身臨其境地與虛擬角色互動,提升了社交體驗。
詳情鏈接:https://solami-ai.github.io/
9、X 正式表態(tài),全新AI圖像生成器Aurora將在本周內向所有用戶推出
近日,社交網(wǎng)絡 X(前身為推特)推出了新的圖像生成器Aurora,經(jīng)過數(shù)十億個樣本訓練,具備高質量圖像生成能力。雖然最初被撤下,但現(xiàn)已重新上線,計劃在一周內向所有用戶推廣。Aurora能夠精準渲染真實世界的視覺細節(jié),盡管在測試中發(fā)現(xiàn)其生成的圖像偶爾存在不自然的融合和細節(jié)缺失問題。
【AiBase提要:】
? Aurora是由xAI開發(fā)的新圖像生成器,具備照片級渲染能力。
?? 目前已在部分國家上線,預計一周內向所有用戶推廣。
?? 測試發(fā)現(xiàn)Aurora生成的圖像有時存在不自然的融合和人物細節(jié)缺失問題。
詳情鏈接:https://x.ai/blog/grok-image-generation-release
10、Reddit 推出 AI 問答功能,但用戶卻不買賬!
Reddit最近推出了名為“Reddit Answers”的新功能,旨在通過AI驅動的問答提升用戶搜索體驗。然而,盡管該功能可以基于平臺內的帖子和評論提供答案,用戶的反饋卻并不積極,許多人認為改善搜索功能的優(yōu)先級更高。該功能目前僅在美國的有限用戶中測試,且尚未在Android平臺上推出。
【AiBase提要:】
?? 新功能“Reddit Answers”開始在美國有限用戶中測試,旨在提升搜索體驗。
?? 該功能利用Reddit平臺內的帖子和評論,提供AI驅動的問答服務。
?? 用戶反響平平,許多人對搜索功能改善的優(yōu)先級表示不滿。
11、特斯拉陶琳:將堅持自動駕駛純視覺路線
特斯拉副總裁陶琳重申了公司在自動駕駛技術上堅持純視覺路線的決心。她強調,只有通過攝像頭和視覺神經(jīng)網(wǎng)絡的結合,才能更好地模擬人類的駕駛習慣,從而實現(xiàn)更安全、更智能的完全自動駕駛。特斯拉的AI4芯片已在所有在售車型中配備,算力提升顯著,標志著公司在硬件上已為完全自動駕駛做好準備。
【AiBase提要:】
?? 特斯拉堅持通過純視覺技術實現(xiàn)完全自動駕駛,認為這是最安全、最智能的方案。
?? 自動駕駛技術采用端到端大模型,已實現(xiàn)從光子輸入到?jīng)Q策輸出的全過程。
?? 所有在售車型均配備最新AI4芯片,算力提升5倍,為實現(xiàn)完全自動駕駛奠定基礎。
12、驚人復蘇!Stability AI新管理層六個月實現(xiàn)無債務、三位數(shù)業(yè)務增長
Stability AI在新任首席執(zhí)行官普雷姆?阿卡拉朱的帶領下,經(jīng)過六個月的努力,成功實現(xiàn)了業(yè)務的三位數(shù)增長,并清除了所有債務。阿卡拉朱強調公司資產(chǎn)負債表的健康狀態(tài),并專注于API和許可服務的快速發(fā)展。新管理團隊的形成吸引了曾經(jīng)離開的投資者回歸,標志著公司前景的向好。
【AiBase提要:】
?? Stability AI新CEO普雷姆?阿卡拉朱表示,公司業(yè)務已實現(xiàn)三位數(shù)增長,且無債務。
?? 新管理團隊在六個月內完成復蘇,吸引曾離開的投資者回歸。
?? 知名導演詹姆斯?卡梅隆已加入Stability AI董事會,顯示行業(yè)信心回升。
13、智源開源無標注視頻學習的3D 生成模型 See3D
北京智源人工智能研究院推出了 See3D 模型,能夠利用無標注互聯(lián)網(wǎng)視頻進行3D 生成。該模型通過視覺條件技術,生成相機方向可控且何一致的多視角圖像,避免傳統(tǒng)相機標注的需求,具有良好的數(shù)據(jù)擴展性和適用性。See3D 已開源,支持多種3D 創(chuàng)作應用。
【AiBase 提要:】
?? See3D 利用大規(guī)模無標注視頻進行3D 學習,降低數(shù)據(jù)采集成本。
?? 模型支持從文本、單視圖到3D 生成,功能多樣。
?? 開源模型和數(shù)據(jù)集促進3研究社區(qū)關注無相機標注數(shù)據(jù)。
項目地址:https://vision.baai.ac.cn/see3d
(舉報)