幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關(guān)鍵詞  > 智能體最新資訊  > 正文

從智能體到世界模型,2025年AI行業(yè)還會發(fā)生哪些大事?

2025-01-13 15:18 · 稿源:?AI新榜公眾號

聲明:本文來自于微信公眾號 AI新榜,作者:卷毛,授權(quán)站長之家轉(zhuǎn)載發(fā)布。

2024年,是AI指數(shù)級發(fā)展的又一年。

大模型浪潮滾滾向前,在技術(shù)創(chuàng)新和應(yīng)用落地上取得多項(xiàng)突破,引起了海內(nèi)外廣泛關(guān)注和討論。

從年初Sora驚艷亮相到國產(chǎn)AI視頻生成模型大放異彩;

image.png

AI視頻進(jìn)化對比,X@Dexerto

從多模態(tài)模型GPT-4o到推理模型o3;

圖片

OpenAI o3模型演示

從一句話生成一首歌到一張圖生成3D建模;

圖片

Suno主頁

從毒舌Dan成為賽博男友到AI獨(dú)角獸C.ai賣身谷歌;

圖片

Character.ai主頁

智能體會自主操作手機(jī)和電腦到AI編程工具Cursor爆火;

圖片

Cursor主頁

從首部《人工智能法案》頒布到AI“魔改”短視頻被整改……

image.png

AI魔改《甄嬛傳》

這一年,AI行業(yè)在快速發(fā)展的同時(shí),也面臨著版權(quán)、倫理、隱私等多方面的挑戰(zhàn),不斷沖擊著人類社會的各個(gè)角落。

AI科技公司的競爭更加白熱化,巨頭們輪番推出各自的新模型和新產(chǎn)品,技術(shù)突破與商業(yè)化并進(jìn),尤其在圖像、視頻、3D領(lǐng)域持續(xù)加碼,為AIGC創(chuàng)作帶來更多想象力。

“AI新榜”一直在追蹤AI行業(yè)的前沿?zé)狳c(diǎn),特別是與內(nèi)容行業(yè)相關(guān)的大模型和應(yīng)用發(fā)展,每個(gè)工作日更新#AI日報(bào),每周更新#AI一周熱門,每月匯總AIGC行業(yè)關(guān)鍵信息,從2024年2月起至今,已發(fā)布11期#AIGC月刊。

以此為基礎(chǔ),我們整理了2024年值得關(guān)注的AI大事件,并嘗試對2025年AI行業(yè)的熱門趨勢進(jìn)行了預(yù)測。

接下來,請與我們一起循著AI的脈絡(luò),通向未來的大門。

圖片

圖片

制圖:NUPD

AI推理模型訓(xùn)練加速

自2023年推出GPT-4后,OpenAI的GPT系列成為全球最具影響力的基礎(chǔ)大模型,但其壟斷優(yōu)勢在2024年被打破,比如Anthropic的Claude3Sonnet、谷歌的Gemini2.0都已經(jīng)后來追上,穩(wěn)列第一梯隊(duì)。

2024年“百模大戰(zhàn)”主要聚焦在多模態(tài)和推理能力,OpenAI上線了高級語音模式和視頻通話功能,《Her》逐漸成為現(xiàn)實(shí)。而推理模型需要消耗更多的算力,也需要更久的等待時(shí)間,據(jù)量子位《2024年度AI十大趨勢報(bào)告》,以O(shè)penAI的o1模型為代表,模仿學(xué)習(xí)+強(qiáng)化學(xué)習(xí)成為典型AI發(fā)展路徑范式。

“從o1到o3的進(jìn)展只有三個(gè)月,這表明RL的新范式在擴(kuò)展推理計(jì)算的思維鏈上的進(jìn)展將有多快,”O(jiān)penAI研究員Jason Wei在一條推文中寫道,“比每1-2年對新模型進(jìn)行預(yù)訓(xùn)練范式要快得多?!?/p>

Anthropic聯(lián)創(chuàng)Jack Clark認(rèn)為,OpenAI年底發(fā)布的o3意味著2025年的AI進(jìn)展將比2024年更快。

圖片

Jack Clark博客:https://jack-clark.net/

此外,開源模型與閉源模型并行發(fā)展,Meta AI、微軟、谷歌、Mistral AI 、阿里、智譜、DeepSeek等團(tuán)隊(duì)陸續(xù)將開源模型推向了新的高度,其中年底發(fā)布的DeepSeek v3表現(xiàn)亮眼,與Claude3.5Sonnet不相上下。另一方面,大模型運(yùn)行token的成本也在激烈的價(jià)格戰(zhàn)中快速下降,比如Gemini1.5Flash8B定價(jià)為0.0375美元/mTok——比去年的GPT-3.5Turbo便宜27倍。

AGI仍未到來,2025年我們大概也不會看到所謂的超級智能,但未來的曙光已經(jīng)越來越逼近了。據(jù)埃隆?馬斯克預(yù)測,到2025年底,AI將超越任何單個(gè)個(gè)體的智力,而到2027至2028年,它甚至可能會超越所有人類的智力。到2030年,AI超越所有人類智力的可能性幾乎是100%

第一批AI智能體即將上崗

AI Agent是2024年最熱門的AI行業(yè)應(yīng)用趨勢之一。中文將其通常翻譯為“智能體”,兩者的概念定義不盡相同,這里我們指的是基于AI技術(shù),能夠自主感知、思考并執(zhí)行決策的智能體。

據(jù)谷歌智能體白皮書,智能體是“加強(qiáng)版”的AI,它通過觀察世界、使用工具、制定計(jì)劃和采取行動來實(shí)現(xiàn)目標(biāo),可以自主行動,超越了基礎(chǔ)模型,更像是人類解決問題的方式。即使缺少人類的指令,智能體也能推理下一步應(yīng)該做什么。

圖片

谷歌智能體白皮書:https://www.kaggle.com/whitepaper-agents

微軟、谷歌、OpenAI、Anthropic、百度、智譜、字節(jié)等各大廠商都在積極搶占AI智能體市場。2024年10月,Anthropic推出的Computer Use(計(jì)算機(jī)使用)功能驚艷四座,可以讓Claude像人一樣使用計(jì)算機(jī)。智譜的AutoGLM同樣不甘示弱,手機(jī)端可以自主執(zhí)行超過50步的長步驟操作,也可以跨App執(zhí)行任務(wù),包括導(dǎo)航、網(wǎng)購、點(diǎn)外賣、微信聊天、寫點(diǎn)評等。

2025年1月6日,Sam Altman在《反思(Reflections)》這篇博客中表示,現(xiàn)在OpenAI知道如何構(gòu)建傳統(tǒng)定義的AGI,開始將目標(biāo)轉(zhuǎn)向真正意義上的超級智能。

“在2025年,我們可能會看到第一批AI智能體‘加入勞動力大軍’,并實(shí)質(zhì)性地改變公司的產(chǎn)出。”

圖片

Sam Altman博客全文:https://blog.samaltman.com/

此前據(jù)內(nèi)部員工爆料,OpenAI正準(zhǔn)備推出一款代號為“Operator”的智能體,可以自動執(zhí)行各種復(fù)雜操作,包括編寫代碼、預(yù)訂旅行、自動電商購物等,該產(chǎn)品預(yù)計(jì)將在2025年1月發(fā)布。

正如前騰訊混元大模型技術(shù)負(fù)責(zé)人劉威所預(yù)測的,到2025年,智能體作為AI原生應(yīng)用將會爆發(fā),成為商業(yè)軟件和SaaS的未來。

國產(chǎn)AI視頻模型繼續(xù)領(lǐng)先

英偉達(dá)高級科學(xué)家Jim Fan曾預(yù)測2024年是AI視頻之年,實(shí)際的確如此。

OpenAI推出Sora之后,其創(chuàng)新的DiT(Diffusion Transformer)架構(gòu)引領(lǐng)行業(yè)發(fā)展,市面上AI視頻生成模型和產(chǎn)品層出不窮,尤其從下半年開始,快手可靈、智譜清影、MiniMax的海螺視頻、阿里的通義萬相、字節(jié)的豆包和即夢、騰訊混元視頻等國產(chǎn)AI視頻產(chǎn)品后來居上,在生成時(shí)長、分辨率、運(yùn)動合理性、可控性等方面都有了顯著提升。

頭號AI玩家,贊16

海外AI視頻產(chǎn)品的更新迭代依舊沒有放緩,包括谷歌的Veo、Runway Gen-3Alpha、Pika、Luma AI的Dream Machine等;開源方面,初創(chuàng)公司Lightricks的LTX Video、Genmo的Mochi1等模型則降低了AI視頻的應(yīng)用門檻。

在產(chǎn)品功能上,AI逐漸向視頻創(chuàng)作的全流程滲透,生成長度更長,也更加穩(wěn)定可控了。除了基礎(chǔ)的文生視頻、圖生視頻,現(xiàn)在部分產(chǎn)品還支持多張圖片生成視頻(首尾幀、參考圖片主體/背景),視頻生視頻(風(fēng)格轉(zhuǎn)繪、視頻拓展),此外還有給視頻配音效、人物對口型、AI換臉、故事板等功能。

對于專業(yè)創(chuàng)作者來說,AI已是輔助創(chuàng)作的得力工具,業(yè)內(nèi)不少AI加持的短劇、廣告片、電影相繼落地。而對于C端用戶,AI視頻產(chǎn)品簡單易上手,各種有趣的特效模板最受歡迎,例如可靈讓人們穿越時(shí)空擁抱,Pika用AI模擬爆炸、捏扁等視頻特效,Pixverse的毒液變身特效等。我們還給網(wǎng)友們激情創(chuàng)作的AI抽象視頻專門頒了個(gè)獎。

隨著AI視頻質(zhì)量不斷提升,訓(xùn)練數(shù)據(jù)侵權(quán)、深度偽造詐騙等安全合規(guī)問題也引起廣泛關(guān)注。對于AI視頻廠商而言,如何降低算力成本、提高推理速度、商業(yè)化等都是擺在眼前的一道道難題。

可以預(yù)見,2025年AI視頻依舊是競逐激烈的熱門賽道,技術(shù)創(chuàng)新是競爭核心,國產(chǎn)AI視頻產(chǎn)品仍有優(yōu)勢。

通向AGI的關(guān)鍵路徑是世界模型

AI對話、圖像生成和視頻生成已經(jīng)“卷”到飛起,一些玩家開始將目光鎖定至3D內(nèi)容生成,例如Luma AI、Meshy、Tripo。在短視頻、游戲配件、工業(yè)設(shè)計(jì)等領(lǐng)域,AI建模的3D內(nèi)容已經(jīng)有了用武之地。

“我們生活在一個(gè)三維世界中,AI只有突破對3D世界的理解和生成,才能真正追趕上人類智能?!?024年12月,由“AI教母”李飛飛聯(lián)合創(chuàng)辦的World Labs發(fā)布了首個(gè)“空間智能(Spatial intelligence)”模型,能夠僅從一張二維圖片生成可交互的3D世界,用戶可以在3D場景中像玩游戲一樣自由控制相機(jī)來探索。

圖片

World Labs官網(wǎng):https://www.worldlabs.ai/blog

空間智能是相對于語言智能的一個(gè)概念,比大型語言模型 (LLM)更進(jìn)一步,可以感知、生成3D世界并與之交互,這樣的AI系統(tǒng)被稱為大型世界模型(LWM) 。

類似的世界模型還有谷歌的Genie2,它能夠生成各種可操作、可玩的3D環(huán)境,可用于訓(xùn)練和評估智能體。

圖片

Genie2博客:https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/

Sora核心作者Tim Brooks跳槽到谷歌DeepMind后,近期他表示要招募新團(tuán)隊(duì)來制作大量世界模型。據(jù)量子位報(bào)道,新團(tuán)隊(duì)會和谷歌旗下Gemini、Veo和Genie等團(tuán)隊(duì)合作,致力于在構(gòu)建的世界模型之上開發(fā)“實(shí)時(shí)交互生成”工具;并研究如何將世界模型們與現(xiàn)有的多模態(tài)模型,如Gemini等集成。

谷歌表示,在視頻和多模態(tài)數(shù)據(jù)上擴(kuò)展預(yù)訓(xùn)練是實(shí)現(xiàn)AGI的關(guān)鍵路徑。

不僅是3D內(nèi)容創(chuàng)作,未來世界模型有望推動自動駕駛、機(jī)器人、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)等多個(gè)領(lǐng)域的創(chuàng)新和進(jìn)步。

蘋果入場,AI硬件有待爆發(fā)

QuestMobile報(bào)告顯示,當(dāng)下LLM的落地應(yīng)用在網(wǎng)頁端、移動端都已比較成熟,正逐步拓展至智能硬件端。手機(jī)則是目前LLM最成熟的落地硬件載體之一,廠商從“卷”配置走向“卷”AI,熱賣的新上市機(jī)型基本均為AI手機(jī)。

蘋果在2024年秋季正式進(jìn)入AI市場,首批Apple Intelligence功能已面向iPhone、iPad和Mac用戶推出,支持AI寫作、通知摘要、照片增強(qiáng)等功能。并且隨著Siri和ChatGPT的整合,蘋果可能在2025年占據(jù)AI手機(jī)市場的領(lǐng)先地位。

圖片

不過蘋果Apple Intelligence暫時(shí)沒有向中國市場推出。國內(nèi)Android手機(jī)廠商則陸續(xù)啟動了AI手機(jī)戰(zhàn)略,華為、小米、榮耀、OPPO、VIVO等品牌都在新品中內(nèi)置了AI功能,包括AI語音助手、AI寫作、AI修圖、AI搜索、AI翻譯等。

據(jù)新智元報(bào)道,IT前沿創(chuàng)新與智能科技產(chǎn)業(yè)研究專家胡延平認(rèn)為,2025年會是智能手機(jī)大年,且有多場熱戰(zhàn)。AI顯而易見是第一戰(zhàn)場,超級入口又是AI的第一戰(zhàn)場,而語音自然交互的“嘴控”又是超級入口的第一戰(zhàn)場。

除了手機(jī),面向C端消費(fèi)者的AI硬件主要集中在智能穿戴設(shè)備和智能家居,如耳機(jī)、眼鏡、音箱。其中AI眼鏡受到熱捧,蘋果、Meta、谷歌、華為、百度、字節(jié)等科技大廠都有所布局。

圖片

雷朋和Meta合作的AI眼鏡

但現(xiàn)階段智能穿戴類產(chǎn)品無法脫離軟件實(shí)現(xiàn)AI功能(大多需要與其對應(yīng)的App連接),技術(shù)局限和相對高昂的價(jià)格也是制約因素。未來AI眼鏡的應(yīng)用場景或?qū)⑦M(jìn)一步拓展和深化,從騎行、徒步等運(yùn)動垂類場景,覆蓋至戶外多場景需求。

總之,新的一年,“AI新榜”會繼續(xù)和你一起見證、參與AI行業(yè)的風(fēng)起云涌。

舉報(bào)

  • 相關(guān)推薦
  • 2025年,每一個(gè)公眾號都該擁有自己的智能體

    大模型只是開始,智能體是下一個(gè)里程碑。在OpenAI通往AGI的五大等級中,Agent智能體位于L3,是具備推理能力后的大模型的下一步,也是走向通用人工智能的重要一步。”在這個(gè)充滿無限可能的時(shí)代,每一個(gè)人都有機(jī)會成為頭號玩家。

  • 2025年,這些趨勢正在爆發(fā)

    AI眼鏡、具身智能、即時(shí)零售、零食折扣……2025年,去哪里能搞到錢?剛剛過去的2024年告訴我們,這個(gè)問題的答案隨時(shí)在變,因?yàn)锳I來了。AI被視為2015年之后,唯一能和移動互聯(lián)網(wǎng)相媲美的風(fēng)口。不管技術(shù)如何發(fā)展,懂生活、懂人性的創(chuàng)業(yè)者,才能做出一家好公司。

  • 2025年社交趨勢報(bào)告》:悅己時(shí)代,為世界賦魅

    Z世代正經(jīng)歷一場前所未有的自我探索。他們對自我、他人和世界的關(guān)系提出了全新的思考。Soul也將繼續(xù)秉持對年輕人社交需求的深刻理解,持續(xù)探索和創(chuàng)新,為年輕人的社交生活提供更加廣闊的空間和更加優(yōu)質(zhì)的社交體驗(yàn)。

  • 雷軍立flag:2025年要學(xué)會開叉車

    今天,小米創(chuàng)辦人雷軍發(fā)布小米汽車工廠2月份參觀計(jì)劃。在2月份,小米汽車工廠從初五至初七開放5場參觀,與用戶一起到工廠過大年。叉車駕駛是特種作業(yè),叉車駕駛證屬于特種車輛駕駛證,要到全國市級質(zhì)量監(jiān)督局指定叉車訓(xùn)練基地報(bào)考辦理。

  • 2025年科技向善創(chuàng)新節(jié),探索AI與社會的擬合之道

    由騰訊研究院與騰訊可持續(xù)社會價(jià)值事業(yè)部聯(lián)合主辦的“擬合·T-Week2025科技向善創(chuàng)新節(jié)”于2025年1月8日至10日舉行。本屆創(chuàng)新節(jié)以“擬合”為主題,匯聚了來自全球科技、人文、藝術(shù)等領(lǐng)域的頂尖專家學(xué)者、行業(yè)領(lǐng)袖及實(shí)踐者,共同探討在人工智能技術(shù)飛速發(fā)展的當(dāng)下,如何推動技術(shù)與社會、經(jīng)濟(jì)、個(gè)人的深度融合,實(shí)現(xiàn)人與技術(shù)的和諧共生,共創(chuàng)美好未來。科技向善創(chuàng)新節(jié)也在面向社會各界發(fā)起呼吁,共同探索科技向善的理念和實(shí)踐路徑,推動構(gòu)建一個(gè)更加公正、包容、可持續(xù)的數(shù)字未來。

  • AI 智能體如何在教育領(lǐng)域崛起并塑造 2025

    人工智能一直是教育技術(shù)和創(chuàng)新討論的焦點(diǎn)話題這種趨勢預(yù)計(jì)將在可預(yù)見的未來繼續(xù)延續(xù)。展望2025年的教育發(fā)展趨勢,幾位在2024年推動教育變革的重要創(chuàng)新者的一致觀點(diǎn)是:AI智能體的崛起將成為未來教育的重要轉(zhuǎn)折點(diǎn)。到2025年,AI智能體將全面塑造教育的各個(gè)層面,推動教育體驗(yàn)進(jìn)入一個(gè)全新時(shí)代。

  • 2025年,年輕人的摳門遠(yuǎn)遠(yuǎn)不止反向消費(fèi)

    關(guān)于“平替”“性價(jià)比”“反向消費(fèi)”“智性腦”“松弛感”等新消費(fèi)熱詞高頻出現(xiàn),我們能看到年輕人群體的消費(fèi)價(jià)值觀在不斷發(fā)生變化。消費(fèi)曾被視為享受生活、滿足欲望的方式曾幾何時(shí),年輕人似乎對消費(fèi)主義產(chǎn)生了某種“反叛精神”,更加清醒地意識到,不再盲目追求物質(zhì)的堆砌與過度消費(fèi)。也不能否認(rèn)正是這一次次的消費(fèi)觀念轉(zhuǎn)變,使新的消費(fèi)商機(jī)迎來了大爆發(fā),?

  • 2025年,黃仁勛畫了個(gè)更大的餅

    物理AI,或許將成為2025關(guān)鍵詞之一。剛剛結(jié)束的CES大會上,黃仁勛表示,「AI下一個(gè)前沿就是物理AI,蘊(yùn)藏著價(jià)值數(shù)萬億美元的機(jī)會」?!钡畲筅A家無疑將還是中國。

  • 京東科技宣布落實(shí)20薪:計(jì)劃到2025年實(shí)現(xiàn)

    作為京東集團(tuán)旗下的業(yè)務(wù)子集團(tuán),專注于為客戶提供金融科技產(chǎn)品與技術(shù)服務(wù),近日宣布了一項(xiàng)新的薪酬計(jì)劃。該公司計(jì)劃到2025年實(shí)現(xiàn)全員平均20薪,這是繼2024年年終獎發(fā)放計(jì)劃和超過2萬名京東客服漲薪通知后,京東在年底前再次實(shí)施的大規(guī)模加薪計(jì)劃。通過這一薪酬計(jì)劃,京東旨在吸引和保留人才,同時(shí)激勵(lì)員工的工作熱情和創(chuàng)造力,以推動公司的長期發(fā)展和市場競爭力。

  • 進(jìn)入2025年,支付寶“碰一下”的線下之戰(zhàn)來到新階段

    2025年來臨,支付體系的雙寡頭:支付寶和微信支付這場大戲仍舊你方唱罷我方休,不斷上演著他們的“愛恨情仇”,讓我們從支付寶碰一下的視角一起見證過去不平凡又跌宕起伏的2024吧!1.支付寶“宿敵”微信支付1.1市場主導(dǎo)地位;常言道:既生瑜何生亮這不正是支付寶與微信支付這一對宿敵嗎?現(xiàn)如今,支付寶與微信支付共占據(jù)國內(nèi)支付市場90%的市場份額,形成雙寡頭格局。兩者都是擁有自身生態(tài)體系、聯(lián)通外部多平臺應(yīng)用場景的支付行業(yè)領(lǐng)先布局者,通過生態(tài)內(nèi)場景的聯(lián)通與支付體系的先發(fā)布局,優(yōu)先確立了國內(nèi)移動個(gè)人商業(yè)支付行業(yè)的雙領(lǐng)先地位。隨著技術(shù)的不斷進(jìn)步和用戶習(xí)慣的逐漸培養(yǎng),支付寶有望通過這一創(chuàng)新功能,扭轉(zhuǎn)線下支付場景情況,讓支付寶進(jìn)一步提升其在數(shù)字支付領(lǐng)域的競爭力。

熱文

  • 3 天
  • 7天