歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、昆侖萬維天工大模型4.0o1版和4o版正式上線
2025年1月6日,昆侖萬維集團推出了其最新的「天工大模型4.0」o1版和4o版,標志著在人工智能領(lǐng)域的一次重大進展。o1版是國內(nèi)首款具備中文邏輯推理能力的模型,經(jīng)過技術(shù)升級,能夠處理多種推理挑戰(zhàn)。而4o版則是一款多模態(tài)模型,擁有情感表達和多語言能力,為用戶提供了更自然的對話體驗。。
【AiBase提要:】
?? o1版具備中文邏輯推理能力,經(jīng)過技術(shù)升級,能處理數(shù)學、代碼等多種推理挑戰(zhàn)。
??4o版是一款多模態(tài)模型,提供情感表達和快速響應(yīng)的實時語音對話助手Skyo。
?? 兩款模型的發(fā)布推動了昆侖萬維在AI領(lǐng)域的技術(shù)進步和應(yīng)用拓展。
詳情鏈接:https://www.tiangong.cn/
2、羅永浩新 AI 助理 “J1Assistant” 正式上線,語音交互引領(lǐng)智能新時代
羅永浩的人工智能項目Jarvis推出了名為“J1Assistant”的AI助理軟件,現(xiàn)僅在海外提供安卓版本。該軟件的亮點在于其音頻輸入功能,用戶可以通過語音輕松發(fā)送消息、搜索信息或與AI模型互動。J1Assistant集成了Jarvis自家AI模型,具備備忘錄功能,幫助用戶管理日常事務(wù)。
【AiBase提要:】
?? J1Assistant推出音頻輸入功能,用戶可通過語音進行操作,提升交互體驗。
?? 集成Jarvis自家AI模型,提供實用答案及備忘錄功能,幫助用戶管理事務(wù)。
?? 目前僅支持安卓版本,未來有望推出更多功能和平臺,滿足用戶需求。
3、愛奇藝起訴MiniMax:AI模型涉嫌侵犯版權(quán),要求賠償10萬元
有媒體報道稱愛奇藝向法院提起訴訟,指控AI初創(chuàng)企業(yè)MiniMax在模型訓練中侵犯其版權(quán)。MiniMax被指未經(jīng)授權(quán)使用愛奇藝的素材,生成侵權(quán)內(nèi)容。愛奇藝要求MiniMax立即停止侵權(quán)并索賠10萬元。MiniMax可能會以素材為公開資源或用戶輸入為由進行抗辯,爭取法律免責。此事件尚未有雙方公開回應(yīng),法律爭議仍在發(fā)展中。
【AiBase提要:】
?? 愛奇藝已向法院起訴MiniMax,指控其侵犯版權(quán)。
?? MiniMax被指未經(jīng)授權(quán)使用愛奇藝的版權(quán)素材進行模型訓練。
?? 愛奇藝要求MiniMax停止侵權(quán)并索賠約10萬元人民幣。
4、阿里團隊出品!妝容遷移技術(shù)SHMT:提供化妝參考圖就能給你上妝
阿里巴巴達摩院最近推出的SHMT模型,利用潛在擴散模型實現(xiàn)化妝效果的精準轉(zhuǎn)移,已被國際頂級學術(shù)會議NeurIPS2024接收。該技術(shù)通過簡單的化妝參考圖和目標角色照片,能夠快速生成妝容效果,極大地推動了化妝應(yīng)用和圖像處理領(lǐng)域的發(fā)展。
【AiBase提要:】
?? SHMT模型利用潛在擴散模型實現(xiàn)化妝效果轉(zhuǎn)移,已被NeurIPS2024接收。
?? 團隊提供完整的開源代碼和預訓練模型,便于研究人員進行應(yīng)用與改進。
?? 數(shù)據(jù)準備和參數(shù)調(diào)整至關(guān)重要,研究中詳細指導了操作流程和目錄結(jié)構(gòu)。
詳情鏈接:https://github.com/Snowfallingplum/SHMT
5、字節(jié)跳動開源全新AI模型LatentSync 精準控制唇形同步
字節(jié)跳動推出的LatentSync是一項先進的端到端唇同步技術(shù),利用音頻條件的潛在擴散模型,實現(xiàn)了視頻中人物唇部動作與音頻的精確匹配。該技術(shù)通過引入TREPA技術(shù),增強了時間一致性,同時優(yōu)化了SyncNet的收斂性,顯著提升了唇同步的準確性。
【AiBase提要:】
?? 端到端框架:LatentSync無需中間運動表示,直接從音頻生成唇部動作。
?? 高質(zhì)量生成:利用Stable Diffusion生成動態(tài)逼真的說話視頻,提升視覺效果。
?? 時間一致性:通過TREPA技術(shù)增強視頻幀之間的時間一致性,確保唇同步的準確性。
詳情鏈接:https://github.com/bytedance/LatentSync
6、Meta 發(fā)布新型記憶層技術(shù):突破參數(shù)限制,大幅提升 AI 事實準確性
Meta 公司近日推出了一項創(chuàng)新的記憶層技術(shù),旨在提升大型語言模型的事實準確性并擴展參數(shù)規(guī)模。這項技術(shù)通過可訓練的鍵值查找機制,顯著提高了模型的信息存儲和檢索能力。實驗結(jié)果表明,配備記憶層的模型在多個任務(wù)中表現(xiàn)優(yōu)異,尤其在事實性任務(wù)上,性能提升顯著。
【AiBase提要:】
?? 記憶層技術(shù)通過稀疏激活機制提升事實準確性,達到1280億參數(shù)的規(guī)模。
?? 實驗顯示,配備記憶層的模型在事實性問答等任務(wù)中表現(xiàn)優(yōu)于傳統(tǒng)稠密模型。
?? 研究人員對記憶層進行了多項優(yōu)化,提升了性能和穩(wěn)定性,展示出強大的可擴展性。
詳情鏈接:https://arxiv.org/pdf/2412.09764
7、Yukai推出陪伴型機器人“Mirumi”:毛茸茸的帶給你嬰兒般的情感體驗
Yukai Engineering以其創(chuàng)新的機器人產(chǎn)品而聞名,最新推出的Mirumi是一款裝在錢包上的毛茸茸小球,能夠自發(fā)轉(zhuǎn)頭觀察周圍的人。這款機器人旨在模仿嬰兒的天真與愉快,帶給人們愉悅的互動體驗。Mirumi的設(shè)計靈感源自日本妖怪,結(jié)合運動感應(yīng)技術(shù),展現(xiàn)多種情感,如好奇、害羞等,進一步彰顯了Yukai在奇特機器人領(lǐng)域的獨特地位。
【AiBase提要:】
?? Mirumi是一款毛茸茸的小球,能自發(fā)轉(zhuǎn)頭觀察周圍,帶來愉悅感。
?? 該機器人通過運動感應(yīng)表達情感,模仿嬰兒的天真與互動。
?? Mirumi的設(shè)計靈感源自日本妖怪,旨在重現(xiàn)與嬰兒互動的快樂體驗。
8、OpenAI 開始將目標轉(zhuǎn)向“超級智能”
OpenAI CEO 山姆?奧特曼在其博客中宣布,公司已掌握構(gòu)建人工智能(AGI)的核心技術(shù),并將目標轉(zhuǎn)向超智能。他認為,超智能將顯著提升科學發(fā)現(xiàn)和創(chuàng)新速度,推動社會繁榮。盡管當前技術(shù)存在限制,如“幻覺”現(xiàn)象和高運行成本,奧特曼對未來充滿信心,認為技術(shù)進步將改變時間線。
【AiBase提要:】
?? OpenAI CEO 山姆?奧特曼表示,公司已經(jīng)掌握了構(gòu)建 AGI 的技術(shù),并將目標轉(zhuǎn)向超智能。
?? AGI 被定義為在經(jīng)濟上超越人類的高度自主系統(tǒng),OpenAI 與微軟的協(xié)議對其有明確約定。
?? 盡管當前技術(shù)仍有限制,奧特曼對未來發(fā)展充滿信心,認為時間線會隨著技術(shù)進步而變化。
9、哈佛大學華人研究員Jeffrey Wang加盟OpenAI 專注模型預訓練和推理工作
Jeffrey Wang,哈佛大學的華人研究員,最近加入OpenAI,專注于模型預訓練和推理工作。他的學術(shù)成就和研究背景引起了廣泛關(guān)注,尤其是在機器學習和隱私性領(lǐng)域的貢獻。Jeffrey的加入不僅是他個人職業(yè)生涯的重要一步,也展示了OpenAI對頂尖人才的吸引力,預示著未來AI研究的蓬勃發(fā)展。
【AiBase提要:】
?? Jeffrey Wang在哈佛大學期間積極參與機器學習和統(tǒng)計學的研究,并教授相關(guān)課程。
?? 他的研究成果在多個國際會議上發(fā)表,探討了語言模型隱私和擴散模型的公平性問題。
?? Jeffrey Wang的加入標志著OpenAI吸引頂尖人才的能力,推動AI領(lǐng)域的發(fā)展。
10、微軟計劃在2025財年投入800億美元建設(shè)人工智能數(shù)據(jù)中心
微軟公司在2025財年計劃投入800億美元用于建設(shè)專門處理人工智能工作負載的數(shù)據(jù)中心。這一投資旨在加速AI模型的訓練和云應(yīng)用的全球部署,展現(xiàn)了美國在新技術(shù)浪潮中的重要地位。隨著AI技術(shù)的迅速發(fā)展,微軟的投資不僅是對自身業(yè)務(wù)的擴展,也反映了對基礎(chǔ)設(shè)施的迫切需求,未來將為更多行業(yè)的數(shù)字化轉(zhuǎn)型提供強大支持。
【AiBase提要:】
?? 超過一半的資金將用于美國建設(shè),彰顯其在AI技術(shù)中的重要地位。
?? 微軟與OpenAI的競爭關(guān)系日益緊張,未來可能影響行業(yè)格局。
? 隨著AI技術(shù)需求增加,電力需求也在急劇上升,數(shù)據(jù)中心面臨電力短缺風險。
11、這能力絕了!AI 可以“聽出”鋰電池即將起火的信號
鋰離子電池在我們的日常生活中無處不在,但其過熱或損壞可能引發(fā)嚴重火災(zāi)。2023年,紐約市因電動自行車電池引發(fā)的火災(zāi)事件頻發(fā),造成多起傷亡。為應(yīng)對這一風險,NIST研究團隊開發(fā)了一種基于聲音的火災(zāi)預警技術(shù),能夠通過AI算法識別電池安全閥破裂聲,提前約兩分鐘發(fā)出警告。
【AiBase提要:】
?? NIST研究團隊開發(fā)基于聲音的鋰電池火災(zāi)預警技術(shù),利用AI識別安全閥破裂聲。
?? 經(jīng)過訓練的算法識別率高達94%,在多種噪音干擾下仍能保持高效檢測。
? 新型火災(zāi)警報器預計提供約兩分鐘的提前預警,幫助人們及時逃生。
12、馬斯克宣布 Grok3即將上線,實力提升十倍!
在人工智能領(lǐng)域,埃隆·馬斯克再次成為焦點,他在社交媒體上透露,備受期待的Grok3模型即將推出,計算能力較Grok2提升十倍。Grok系列自發(fā)布以來備受關(guān)注,盡管Grok3的推出經(jīng)歷了一些延遲,但馬斯克的最新消息無疑令期待已久的用戶振奮。
【AiBase提要:】
?? Grok3模型即將推出,計算能力提升十倍,使用了10萬塊英偉達H100芯片。
?? 盡管Grok3原定去年底發(fā)布,但由于多種原因推遲,馬斯克確認預訓練工作已完成。
?? 全球?qū)I技術(shù)的需求增長,Grok3的發(fā)布將為開發(fā)者和企業(yè)帶來新的機遇和挑戰(zhàn)。
(舉報)