幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關(guān)鍵詞  > NeurIPS2024最新資訊  > 正文

Ilya向全世界宣布:預(yù)訓(xùn)練結(jié)束了!全球AI數(shù)據(jù)耗盡,智能才是未來

2024-12-15 10:09 · 稿源: 新智元公眾號

聲明:本文來自于微信公眾號新智元,作者:新智元,授權(quán)站長之家轉(zhuǎn)載發(fā)布。

【新智元導(dǎo)讀】全球頂會NeurIPS2024中,Ilya登場演講,向全世界宣告:預(yù)訓(xùn)練結(jié)束了!數(shù)據(jù)如同化石燃料般難以再生,未來,AI的發(fā)展方向就是具備自我意識超級智能。

剛剛,Ilya現(xiàn)身NeurIPS2024,宣布:預(yù)訓(xùn)練從此將徹底終結(jié)。

短短16分鐘的發(fā)言,足以震撼全場。

是的,他的原話是——

正如我們所知的那樣,預(yù)訓(xùn)練毫無疑問將會終結(jié),與此同時我們也不會再有更多數(shù)據(jù)了。

原因在于,我們只有一個互聯(lián)網(wǎng),訓(xùn)練模型需要的海量數(shù)據(jù)即將枯竭,唯有從現(xiàn)有數(shù)據(jù)中尋找新的突破,AI才會繼續(xù)發(fā)展。

Ilya的預(yù)測是,以后的突破點,就在于智能體、合成數(shù)據(jù)和推理時計算。

圖片

未來,我們會走向何方?

Ilya告訴我們:接下來登場的就是超級智能(superintelligence)——智能體,推理,理解和自我意識。

11月底,NeurIPS2024時間檢驗獎公布,Ilya和GAN之父獲獎。

圖片

論文地址:https://arxiv.org/abs/1409.3215

Ilya感謝了自己的兩位合著者Oriel Vinyals和Kwok-Lee,放出了下面這張圖。

圖片

這是在十年前,2014年蒙特利爾NeurIPS 會議上一次類似演講的截圖。Ilya說,那是一個更加純粹的時代。

而如今,圖中的三位青蔥少年已經(jīng)長成了下面的模樣。

Ilya要做的第一件事,是展示10年前同一個演講的PPT。

他們的工作,可以用以下三個要點概括——

這是一個基于文本訓(xùn)練的自回歸模型;它是一個大型神經(jīng)網(wǎng)絡(luò);它使用了一個大規(guī)模的數(shù)據(jù)集。

圖片

10層神經(jīng)網(wǎng)絡(luò),只需幾分之一秒

下面,Ilya與我們探討了「深度學(xué)習(xí)假設(shè)」。

如果你有一個10層的大型神經(jīng)網(wǎng)絡(luò),它就可以在幾分之一秒內(nèi),完成任何人類能做的事。

為什么要強(qiáng)調(diào)幾分之一秒內(nèi)?

如果你相信深度學(xué)習(xí)的基本假設(shè),即人工神經(jīng)元和生物神經(jīng)元是相似的,并且你也相信真實神經(jīng)元的速度比人類快速完成任務(wù)的速度更慢,那么只要全世界有一個人能夠在不到一秒內(nèi)完成某項任務(wù),那么一個10層神經(jīng)網(wǎng)絡(luò)也能做到。

只要把它們的連接,嵌入到你的人工神經(jīng)網(wǎng)絡(luò)中。

這就是我們的動機(jī)。

我們專注于10層神經(jīng)網(wǎng)絡(luò),因為在那個時候,這就是我們能夠訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。如果你能突破10層,你當(dāng)然可以完成更多事。

圖片

下面這張PPT,描述的是他們的「主要想法」。

核心觀點就是,如果你有一個自回歸模型,并且它能夠足夠好地預(yù)測下一個Token,那么它實際上會抓取、捕獲、掌握接下來任何序列的真實分布。

在當(dāng)時,這是一個相對新穎的觀點。

盡管它并不是第一個被應(yīng)用于實踐的自回歸神經(jīng)網(wǎng)絡(luò),但I(xiàn)lya認(rèn)為,這是第一個令他們深信不疑的自回歸網(wǎng)絡(luò):如果把它訓(xùn)練得足夠好,那么你就會得到想要的任何結(jié)果。

當(dāng)時,他們嘗試的是翻譯。這個任務(wù)如今看來平凡無奇,當(dāng)時卻極具挑戰(zhàn)性。

圖片

接下來,Ilya展示了一些可能很多人從未見過的古老歷史——LSTM。

不熟悉的人會覺得,LSTM是Transformer出現(xiàn)之前,深度學(xué)習(xí)研究者所使用的工具。它可以被看作是一個旋轉(zhuǎn)了90度的ResNet,但更復(fù)雜一些。

我們可以看到積分器(integrator),如今被稱為殘差流(residual stream),還涉及一些更為復(fù)雜的乘法操作。

圖片

Ilya還想強(qiáng)調(diào)的一點是,他們當(dāng)時使用了并行化。

不過并不是普通的并行化,而是流水線并行化(pipelining),每層神經(jīng)網(wǎng)絡(luò)都分配一塊GPU。

從今天來看,這個策略并不明智,但當(dāng)時的他們并不知道。于是,他們使用8塊GPU,實現(xiàn)了3.5倍的速度。

圖片

從這里,Scaling Law開始了

最終,ILya放出了那次演講中最為意義重大的一張PPT,因為,它可以說是「Scaling Law」的開端——

如果你有一個非常大的數(shù)據(jù)集,訓(xùn)練一個非常大的神經(jīng)網(wǎng)絡(luò),那么可以保證成功。

從廣義上來說,后來發(fā)生的事情也的確如此。

圖片

接下來,Ilya提到了一個真正經(jīng)得起時間考驗的想法——聯(lián)結(jié)主義(connectionism),這樣說深度學(xué)習(xí)的核心思想。

這種理念認(rèn)為,如果你愿意相信人工神經(jīng)元在某種程度上有點像生物神經(jīng)元,那么你就會相信,超大規(guī)模神經(jīng)網(wǎng)絡(luò)并不需要達(dá)到人類大腦的級別,就可以用來完成幾乎所有人類能做的事。

但它與人類仍然不同。因為人類大腦會弄清楚自己如何配置,它使用的是最優(yōu)的學(xué)習(xí)算法,需要與參數(shù)數(shù)量相當(dāng)?shù)臄?shù)據(jù)點。

在這一點上,人類仍然更勝一籌。

圖片

所有這些,最終都引出了「預(yù)訓(xùn)練時代」。

這個時代,可以用GPT-2、GPT-3和Scaling Laws定義。

此處,ILya格外感謝了前同事Alec Radford,Jared Kaplan和Dario Amodei。

這項技術(shù),是推動我們今日所見所有技術(shù)進(jìn)步的核心驅(qū)動力。

圖片

預(yù)訓(xùn)練時代,即將終結(jié)

然而,我們所知的預(yù)訓(xùn)練路線,毫無疑問會終結(jié)。

為什么?

這是因為,盡管計算能力正通過更好的硬件、更優(yōu)的算法和更大的集群不斷增長,但數(shù)據(jù)量并沒有增長——我們只有一個互聯(lián)網(wǎng)。

甚至可以說,數(shù)據(jù)是AI的化石燃料。它們是以某種方式被創(chuàng)造出來的,而如今,我們已經(jīng)達(dá)到了數(shù)據(jù)峰值,不可能再有更多數(shù)據(jù)了。

當(dāng)然,目前現(xiàn)存的數(shù)據(jù),仍能支持我們走得很遠(yuǎn),但我們只有一個互聯(lián)網(wǎng)。

圖片

接下來會發(fā)生什么?Ilya給出了下列預(yù)測。(或者只是提到他人的猜測)

首先,智能體會有一些突破,這些能自主完成任務(wù)的AI智能體,就是未來的發(fā)展方向。

其次,還會有一些模糊的合成數(shù)據(jù),但這到底意味著什么?很多人都會取得有趣的進(jìn)展。

最后,就是推理時計算了,最引人矚目的例子,就是o1。在預(yù)訓(xùn)練后,我們接下來該探索什么?o1給出了生動的例子。

圖片

下面,是一個來自生物學(xué)的例子。

這張圖,展示了哺乳動物的身體大小與大腦大小之間的關(guān)系。

在生物學(xué)中,一切都很混亂,但上面這個緊密聯(lián)系,卻是一個罕見的例子。

從人類及其近親的進(jìn)化分支上看,包括尼安德特人、能人等等,大腦與身體比例的縮放指數(shù)都不同。

這意味著在生物學(xué)中,確實存在不同比例縮放的先例。

如今我們所擴(kuò)展的,可以說是第一個我們知道該如何擴(kuò)展的事物。這個領(lǐng)域中的每個人,都會找到解決辦法。

而我們在相關(guān)領(lǐng)域,也取得了驚人的進(jìn)步。10年前這個領(lǐng)域的人,還會記得當(dāng)時是多么無能為力。過去2年進(jìn)入深度學(xué)習(xí)的人,可能都無法感同身受。

圖片

超級智能是未來,還會與意識結(jié)合

最后Ilya談到的,就是超級智能(superintelligence)了。它是公認(rèn)的發(fā)展方向,也是研究人員們正在構(gòu)建的東西。

從本質(zhì)上來說,超級智能與現(xiàn)在的AI完全不同。

目前,我們擁有出色的LLM和聊天機(jī)器人,但它們也表現(xiàn)出某些奇怪的不可靠性——時常會感到困惑,但卻能在評估中表現(xiàn)出遠(yuǎn)超人類的能力。

雖然我們還不知道如何調(diào)和這一點,但最終遲早會實現(xiàn)以下目標(biāo):AI將真正具備實際意義上的智能體特性,并將正學(xué)會推理。

由于推理會引入了更多的復(fù)雜性,因此一個會推理的系統(tǒng),推理量越多,就會變得越不可預(yù)測。相比之下,我們熟知的深度學(xué)習(xí)都是可以預(yù)測的。

舉個例子,那些優(yōu)秀的國際象棋AI,對于最頂尖的人類棋手來說就是不可預(yù)測的。

所以,我們將來不得不面對的,是一些極其不可預(yù)測的AI系統(tǒng)——它們能夠從有限的數(shù)據(jù)中理解事物,同時也不會感到困惑。

同樣,自我意識也是有用的,它構(gòu)成了我們自身的一部分,同時也是我們世界模型中的一部分。

當(dāng)所有這些特性與自我意識結(jié)合在一起時,就會帶來與現(xiàn)有系統(tǒng)完全不同性質(zhì)和特性的系統(tǒng),它們將擁有令人難以置信的驚人能力。

圖片

當(dāng)然,雖然無法確定如何實現(xiàn)、何時實現(xiàn),但這終將發(fā)生。

至于這種系統(tǒng)可能帶來的問題,就留給大家自己去想象吧。

畢竟預(yù)測未來是不可能的,任何事情都有可能發(fā)生。

參考資料:

https://x.com/_jasonwei/status/1867696401830096970

https://x.com/blueberry_feed/status/1867764724206629224

https://x.com/tmychow/status/1867695173783925071

舉報

  • 相關(guān)推薦
  • 讓一讓,全球最鮮活的AI小貓來了

    2012年,計算機(jī)科學(xué)家吳恩達(dá)和JeffDean進(jìn)行了一場試驗。他們用1.6萬個CPU、1000萬張貓咪圖片以及當(dāng)時全球最大的深度學(xué)習(xí)網(wǎng)絡(luò),訓(xùn)練了3天,生成了世界上第一張AI貓臉圖像。但若想帶領(lǐng)更多的普通用戶走進(jìn)AI時代,也許除了突破性的AI技術(shù),同樣也需要進(jìn)一步降低使用門檻、選擇適宜的產(chǎn)品定位以及營銷策略,唯有如此,才能有越來越多的AI產(chǎn)品“飛入尋常百姓家”。

  • 沸蛇AI語音鼠標(biāo)面評測,從硬件到軟件,好用才是智能

    在科技飛速發(fā)展的浪潮中,AI技術(shù)正以前所未有的速度改變著人們的工作和生活方式。AI鼠標(biāo)作為一種創(chuàng)新產(chǎn)品,迅速嶄露頭角,成為市場上的熱門選擇。在當(dāng)下AI技術(shù)不斷發(fā)展的背景下,選擇更高效的辦公硬件,無疑是順應(yīng)時代潮流、提升工作效率的明智之選。

  • 瓊瑤走了 一個時代宣告結(jié)束了:小米王化發(fā)文悼念

    著名作家瓊瑤于今日下午1時許離世,享年86歲。瓊瑤1938年出生于四川成都,原籍湖南衡陽,她的作品在華人世界中享有極高的聲譽(yù),其中多部小說被改編成深受歡迎的電影和電視劇,如《還珠格格》和《一簾幽夢》等。她的作品曾陪伴著一代又一代人成長,留下了深刻的印記。

  • 愛聊強(qiáng)化網(wǎng)絡(luò)安,智能AI與大數(shù)據(jù)守護(hù)用戶社交安

    在科技浪潮的推動下,人類的社交領(lǐng)域正經(jīng)歷著前所未有的變革,變得愈發(fā)多元化與便捷。社交平臺不僅跨越了地理的局限,讓遙遠(yuǎn)的距離不再是溝通的障礙,更促進(jìn)了信息的瞬息傳遞與個人表達(dá)的無限自由,極大地拓寬了現(xiàn)代人的社交視野與體驗。

  • 全球AI監(jiān)管差異凸顯 政策松緊將成為發(fā)展差距重要因素

    近日德國《法蘭克福匯報》報道稱,中美人工智能“中場之爭”日益激烈,繼軟件、云計算和芯片之后,歐洲在人工智能領(lǐng)域也處于守勢。美國和中國的領(lǐng)先優(yōu)勢不斷擴(kuò)大。法規(guī)、數(shù)據(jù)要求和語言模型的可用性可能會因政治決策迅速改變,因此多國監(jiān)管政策的差異化,也將成為國與國之間在人工智能創(chuàng)新方面拉開差距的重要因素。

  • 世紀(jì)華通謝斐:以全球視野激發(fā)中國游戲形成“世界標(biāo)準(zhǔn)”

    “中華文化‘點石成金’的魅力,為內(nèi)容創(chuàng)造者提供了富足的精神食糧。在科技全球化的當(dāng)下,應(yīng)當(dāng)打破思維定式,以全球視野去做‘世界標(biāo)準(zhǔn)’的內(nèi)容,讓中國文化全球化?!?12 月 13 日,世紀(jì)華通總裁謝斐在 2024 游戲產(chǎn)業(yè)年會大會上發(fā)表《展文化全球新視野 樹游戲企業(yè)新?lián)?dāng)》主題演講,認(rèn)為游戲產(chǎn)業(yè)未來將在中國經(jīng)濟(jì)全面出海、國內(nèi)國際雙循環(huán)驅(qū)動的道路上扮演更加重?

  • 華龍航空榮獲全球首個“世界領(lǐng)先公務(wù)航空企業(yè)”獎項

    2024年11月24日,世界旅游大獎頒獎盛典在葡萄牙盛大舉行,華龍航空榮膺全球首個“世界領(lǐng)先公務(wù)航空企業(yè)”獎項。這是WTA首次頒發(fā)此類獎項,高度肯定了對華龍航空卓越的服務(wù)品質(zhì)、持續(xù)的創(chuàng)新精神和對公務(wù)航空領(lǐng)域的杰出貢獻(xiàn)。公司還將為行業(yè)的可持續(xù)發(fā)展貢獻(xiàn)更多力量,積極履行社會責(zé)任,努力成為一家不僅偉大且具有深遠(yuǎn)影響力的企業(yè)。

  • 全球首個AI Agent程序員面開放!3600元/月

    全球首個AIAgent程序員Devin今日宣布全面開放使用實現(xiàn)商業(yè)化,從最初的展示到全面使用不到一年時間。不過Devin的月費(fèi)高達(dá)500美元,成為目前市場上最貴的生成式AI產(chǎn)品之一。值得一提的是,對于一個公司言,Devin是沒有任何用戶數(shù)量限制的,無論多少人都能無限制的使用。

  • 雷軍:武漢大學(xué)是全球最好大學(xué) 沒有之一

    快科技12月8日消息,日前,小米CEO雷軍和武漢大學(xué)計算機(jī)學(xué)院雷軍班的同學(xué)在小米科技園進(jìn)行面對面交流。對于為什么支持辦雷軍班,雷軍表示,主要有三點:首先,在他心里,武漢大學(xué)是全球最好的大學(xué),沒有之一;第二,計算機(jī)學(xué)科在這個時代還有巨大的機(jī)會;第三,產(chǎn)學(xué)研的深度融合,中國科技的進(jìn)步要建立在超強(qiáng)的產(chǎn)業(yè)基礎(chǔ)上。雷軍稱,雷軍班對我個人是莫大的榮譽(yù),也是巨大的壓力?!崩总娺€給學(xué)生提了兩點建議,第一是把握機(jī)遇非常非常的重要,第二,在大學(xué)最重要的還是學(xué)知識,要像海綿一樣充分吸取知識的營養(yǎng),并努力擴(kuò)大知識面。據(jù)了解,

  • 全球 AI 實力排名出爐:美國核心領(lǐng)域表現(xiàn)卓越,斯坦福工具揭示 AI 生態(tài)新趨勢

    站長之家11月23日消息:斯坦福人類中心人工智能研究所發(fā)布的2024年版人工智能全球活力工具顯示,美國在人工智能領(lǐng)域繼續(xù)全球領(lǐng)先,中國和英國分列第二和第三。這一工具通過研究論文、私人投資、專利等關(guān)鍵指標(biāo),評估了36個國家的AI生態(tài)系統(tǒng)?!鸽S著更多國家建設(shè)其AI生態(tài)系統(tǒng),我們將不斷添加新數(shù)據(jù)和新國家,」Maslej指出。

熱文

  • 3 天
  • 7天