Ilya向全世界宣布：預(yù)訓(xùn)練結(jié)束了！全球AI數(shù)據(jù)耗盡，智能才是未來

2024-12-15 10:09 · 稿源：新智元公眾號

聲明:本文來自于微信公眾號新智元，作者:新智元，授權(quán)站長之家轉(zhuǎn)載發(fā)布。

【新智元導(dǎo)讀】全球頂會NeurIPS2024中，Ilya登場演講，向全世界宣告:預(yù)訓(xùn)練結(jié)束了!數(shù)據(jù)如同化石燃料般難以再生，未來，AI的發(fā)展方向就是具備自我意識的超級智能。

剛剛，Ilya現(xiàn)身NeurIPS2024，宣布:預(yù)訓(xùn)練從此將徹底終結(jié)。

短短16分鐘的發(fā)言，足以震撼全場。

是的，他的原話是——

正如我們所知的那樣，預(yù)訓(xùn)練毫無疑問將會終結(jié)，與此同時我們也不會再有更多數(shù)據(jù)了。

原因在于，我們只有一個互聯(lián)網(wǎng)，訓(xùn)練模型需要的海量數(shù)據(jù)即將枯竭，唯有從現(xiàn)有數(shù)據(jù)中尋找新的突破，AI才會繼續(xù)發(fā)展。

Ilya的預(yù)測是，以后的突破點，就在于智能體、合成數(shù)據(jù)和推理時計算。

未來，我們會走向何方?

Ilya告訴我們:接下來登場的就是超級智能（superintelligence）——智能體，推理，理解和自我意識。

11月底，NeurIPS2024時間檢驗獎公布，Ilya和GAN之父獲獎。

論文地址:https://arxiv.org/abs/1409.3215

Ilya感謝了自己的兩位合著者Oriel Vinyals和Kwok-Lee，放出了下面這張圖。

這是在十年前，2014年蒙特利爾NeurIPS 會議上一次類似演講的截圖。Ilya說，那是一個更加純粹的時代。

而如今，圖中的三位青蔥少年已經(jīng)長成了下面的模樣。

Ilya要做的第一件事，是展示10年前同一個演講的PPT。

他們的工作，可以用以下三個要點概括——

這是一個基于文本訓(xùn)練的自回歸模型;它是一個大型神經(jīng)網(wǎng)絡(luò);它使用了一個大規(guī)模的數(shù)據(jù)集。

10層神經(jīng)網(wǎng)絡(luò)，只需幾分之一秒

下面，Ilya與我們探討了「深度學(xué)習(xí)假設(shè)」。

如果你有一個10層的大型神經(jīng)網(wǎng)絡(luò)，它就可以在幾分之一秒內(nèi)，完成任何人類能做的事。

為什么要強(qiáng)調(diào)幾分之一秒內(nèi)?

如果你相信深度學(xué)習(xí)的基本假設(shè)，即人工神經(jīng)元和生物神經(jīng)元是相似的，并且你也相信真實神經(jīng)元的速度比人類快速完成任務(wù)的速度更慢，那么只要全世界有一個人能夠在不到一秒內(nèi)完成某項任務(wù)，那么一個10層神經(jīng)網(wǎng)絡(luò)也能做到。

只要把它們的連接，嵌入到你的人工神經(jīng)網(wǎng)絡(luò)中。

這就是我們的動機(jī)。

我們專注于10層神經(jīng)網(wǎng)絡(luò)，因為在那個時候，這就是我們能夠訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。如果你能突破10層，你當(dāng)然可以完成更多事。

下面這張PPT，描述的是他們的「主要想法」。

核心觀點就是，如果你有一個自回歸模型，并且它能夠足夠好地預(yù)測下一個Token，那么它實際上會抓取、捕獲、掌握接下來任何序列的真實分布。

在當(dāng)時，這是一個相對新穎的觀點。

盡管它并不是第一個被應(yīng)用于實踐的自回歸神經(jīng)網(wǎng)絡(luò)，但I(xiàn)lya認(rèn)為，這是第一個令他們深信不疑的自回歸網(wǎng)絡(luò):如果把它訓(xùn)練得足夠好，那么你就會得到想要的任何結(jié)果。

當(dāng)時，他們嘗試的是翻譯。這個任務(wù)如今看來平凡無奇，當(dāng)時卻極具挑戰(zhàn)性。

接下來，Ilya展示了一些可能很多人從未見過的古老歷史——LSTM。

不熟悉的人會覺得，LSTM是Transformer出現(xiàn)之前，深度學(xué)習(xí)研究者所使用的工具。它可以被看作是一個旋轉(zhuǎn)了90度的ResNet，但更復(fù)雜一些。

我們可以看到積分器（integrator），如今被稱為殘差流(residual stream)，還涉及一些更為復(fù)雜的乘法操作。

Ilya還想強(qiáng)調(diào)的一點是，他們當(dāng)時使用了并行化。

不過并不是普通的并行化，而是流水線并行化（pipelining），每層神經(jīng)網(wǎng)絡(luò)都分配一塊GPU。

從今天來看，這個策略并不明智，但當(dāng)時的他們并不知道。于是，他們使用8塊GPU，實現(xiàn)了3.5倍的速度。

從這里，Scaling Law開始了

最終，ILya放出了那次演講中最為意義重大的一張PPT，因為，它可以說是「Scaling Law」的開端——

如果你有一個非常大的數(shù)據(jù)集，訓(xùn)練一個非常大的神經(jīng)網(wǎng)絡(luò)，那么可以保證成功。

從廣義上來說，后來發(fā)生的事情也的確如此。

接下來，Ilya提到了一個真正經(jīng)得起時間考驗的想法——聯(lián)結(jié)主義（connectionism），這樣說深度學(xué)習(xí)的核心思想。

這種理念認(rèn)為，如果你愿意相信人工神經(jīng)元在某種程度上有點像生物神經(jīng)元，那么你就會相信，超大規(guī)模神經(jīng)網(wǎng)絡(luò)并不需要達(dá)到人類大腦的級別，就可以用來完成幾乎所有人類能做的事。

但它與人類仍然不同。因為人類大腦會弄清楚自己如何配置，它使用的是最優(yōu)的學(xué)習(xí)算法，需要與參數(shù)數(shù)量相當(dāng)?shù)臄?shù)據(jù)點。

在這一點上，人類仍然更勝一籌。

所有這些，最終都引出了「預(yù)訓(xùn)練時代」。

這個時代，可以用GPT-2、GPT-3和Scaling Laws定義。

此處，ILya格外感謝了前同事Alec Radford，Jared Kaplan和Dario Amodei。

這項技術(shù)，是推動我們今日所見所有技術(shù)進(jìn)步的核心驅(qū)動力。

預(yù)訓(xùn)練時代，即將終結(jié)

然而，我們所知的預(yù)訓(xùn)練路線，毫無疑問會終結(jié)。

為什么?

這是因為，盡管計算能力正通過更好的硬件、更優(yōu)的算法和更大的集群不斷增長，但數(shù)據(jù)量并沒有增長——我們只有一個互聯(lián)網(wǎng)。

甚至可以說，數(shù)據(jù)是AI的化石燃料。它們是以某種方式被創(chuàng)造出來的，而如今，我們已經(jīng)達(dá)到了數(shù)據(jù)峰值，不可能再有更多數(shù)據(jù)了。

當(dāng)然，目前現(xiàn)存的數(shù)據(jù)，仍能支持我們走得很遠(yuǎn)，但我們只有一個互聯(lián)網(wǎng)。

接下來會發(fā)生什么?Ilya給出了下列預(yù)測。（或者只是提到他人的猜測）

首先，智能體會有一些突破，這些能自主完成任務(wù)的AI智能體，就是未來的發(fā)展方向。

其次，還會有一些模糊的合成數(shù)據(jù)，但這到底意味著什么?很多人都會取得有趣的進(jìn)展。

最后，就是推理時計算了，最引人矚目的例子，就是o1。在預(yù)訓(xùn)練后，我們接下來該探索什么?o1給出了生動的例子。

下面，是一個來自生物學(xué)的例子。

這張圖，展示了哺乳動物的身體大小與大腦大小之間的關(guān)系。

在生物學(xué)中，一切都很混亂，但上面這個緊密聯(lián)系，卻是一個罕見的例子。

從人類及其近親的進(jìn)化分支上看，包括尼安德特人、能人等等，大腦與身體比例的縮放指數(shù)都不同。

這意味著在生物學(xué)中，確實存在不同比例縮放的先例。

如今我們所擴(kuò)展的，可以說是第一個我們知道該如何擴(kuò)展的事物。這個領(lǐng)域中的每個人，都會找到解決辦法。

而我們在相關(guān)領(lǐng)域，也取得了驚人的進(jìn)步。10年前這個領(lǐng)域的人，還會記得當(dāng)時是多么無能為力。過去2年進(jìn)入深度學(xué)習(xí)的人，可能都無法感同身受。

超級智能是未來，還會與意識結(jié)合

最后Ilya談到的，就是超級智能（superintelligence）了。它是公認(rèn)的發(fā)展方向，也是研究人員們正在構(gòu)建的東西。

從本質(zhì)上來說，超級智能與現(xiàn)在的AI完全不同。

目前，我們擁有出色的LLM和聊天機(jī)器人，但它們也表現(xiàn)出某些奇怪的不可靠性——時常會感到困惑，但卻能在評估中表現(xiàn)出遠(yuǎn)超人類的能力。

雖然我們還不知道如何調(diào)和這一點，但最終遲早會實現(xiàn)以下目標(biāo):AI將真正具備實際意義上的智能體特性，并將正學(xué)會推理。

由于推理會引入了更多的復(fù)雜性，因此一個會推理的系統(tǒng)，推理量越多，就會變得越不可預(yù)測。相比之下，我們熟知的深度學(xué)習(xí)都是可以預(yù)測的。

舉個例子，那些優(yōu)秀的國際象棋AI，對于最頂尖的人類棋手來說就是不可預(yù)測的。

所以，我們將來不得不面對的，是一些極其不可預(yù)測的AI系統(tǒng)——它們能夠從有限的數(shù)據(jù)中理解事物，同時也不會感到困惑。

同樣，自我意識也是有用的，它構(gòu)成了我們自身的一部分，同時也是我們世界模型中的一部分。

當(dāng)所有這些特性與自我意識結(jié)合在一起時，就會帶來與現(xiàn)有系統(tǒng)完全不同性質(zhì)和特性的系統(tǒng)，它們將擁有令人難以置信的驚人能力。

當(dāng)然，雖然無法確定如何實現(xiàn)、何時實現(xiàn)，但這終將發(fā)生。

至于這種系統(tǒng)可能帶來的問題，就留給大家自己去想象吧。

畢竟預(yù)測未來是不可能的，任何事情都有可能發(fā)生。

參考資料:

https://x.com/_jasonwei/status/1867696401830096970

https://x.com/blueberry_feed/status/1867764724206629224

https://x.com/tmychow/status/1867695173783925071

（舉報）

相關(guān)推薦

關(guān)鍵詞：

薦讓一讓，全球最鮮活的AI小貓來了

2012年，計算機(jī)科學(xué)家吳恩達(dá)和JeffDean進(jìn)行了一場試驗。他們用1.6萬個CPU、1000萬張貓咪圖片以及當(dāng)時全球最大的深度學(xué)習(xí)網(wǎng)絡(luò)，訓(xùn)練了3天，生成了世界上第一張AI貓臉圖像。但若想帶領(lǐng)更多的普通用戶走進(jìn)AI時代，也許除了突破性的AI技術(shù)，同樣也需要進(jìn)一步降低使用門檻、選擇適宜的產(chǎn)品定位以及營銷策略，唯有如此，才能有越來越多的AI產(chǎn)品“飛入尋常百姓家”。

?AI生成 ?深度學(xué)習(xí) ?計算機(jī)視覺
沸蛇AI語音鼠標(biāo)全面評測，從硬件到軟件，好用才是真智能

在科技飛速發(fā)展的浪潮中，AI技術(shù)正以前所未有的速度改變著人們的工作和生活方式。AI鼠標(biāo)作為一種創(chuàng)新產(chǎn)品，迅速嶄露頭角，成為市場上的熱門選擇。在當(dāng)下AI技術(shù)不斷發(fā)展的背景下，選擇更高效的辦公硬件，無疑是順應(yīng)時代潮流、提升工作效率的明智之選。

?AI技術(shù) ?沸蛇AI鼠標(biāo) ?語音鼠標(biāo)
瓊瑤走了一個時代宣告結(jié)束了：小米王化發(fā)文悼念

著名作家瓊瑤于今日下午1時許離世，享年86歲。瓊瑤1938年出生于四川成都，原籍湖南衡陽，她的作品在華人世界中享有極高的聲譽(yù)，其中多部小說被改編成深受歡迎的電影和電視劇，如《還珠格格》和《一簾幽夢》等。她的作品曾陪伴著一代又一代人成長，留下了深刻的印記。

?瓊瑤 ?作家離世 ?華人文學(xué)
愛聊強(qiáng)化網(wǎng)絡(luò)安全，智能AI與大數(shù)據(jù)守護(hù)用戶社交安全

在科技浪潮的推動下，人類的社交領(lǐng)域正經(jīng)歷著前所未有的變革，變得愈發(fā)多元化與便捷。社交平臺不僅跨越了地理的局限，讓遙遠(yuǎn)的距離不再是溝通的障礙，更促進(jìn)了信息的瞬息傳遞與個人表達(dá)的無限自由，極大地拓寬了現(xiàn)代人的社交視野與體驗。

?愛聊
全球AI監(jiān)管差異凸顯政策松緊將成為發(fā)展差距重要因素

近日德國《法蘭克福匯報》報道稱，中美人工智能“中場之爭”日益激烈，繼軟件、云計算和芯片之后，歐洲在人工智能領(lǐng)域也處于守勢。美國和中國的領(lǐng)先優(yōu)勢不斷擴(kuò)大。法規(guī)、數(shù)據(jù)要求和語言模型的可用性可能會因政治決策迅速改變，因此多國監(jiān)管政策的差異化，也將成為國與國之間在人工智能創(chuàng)新方面拉開差距的重要因素。

?中美人工智能 ?軟件與芯片 ?歐洲科技實力
世紀(jì)華通謝斐：以全球視野激發(fā)中國游戲形成“世界標(biāo)準(zhǔn)”

“中華文化‘點石成金’的魅力，為內(nèi)容創(chuàng)造者提供了富足的精神食糧。在科技全球化的當(dāng)下，應(yīng)當(dāng)打破思維定式，以全球視野去做‘世界標(biāo)準(zhǔn)’的內(nèi)容，讓中國文化全球化?！?12 月 13 日，世紀(jì)華通總裁謝斐在 2024 游戲產(chǎn)業(yè)年會大會上發(fā)表《展文化全球新視野樹游戲企業(yè)新?lián)?dāng)》主題演講，認(rèn)為游戲產(chǎn)業(yè)未來將在中國經(jīng)濟(jì)全面出海、國內(nèi)國際雙循環(huán)驅(qū)動的道路上扮演更加重?

?中華文化 ?內(nèi)容創(chuàng)造者 ?游戲產(chǎn)業(yè)
華龍航空榮獲全球首個“世界領(lǐng)先公務(wù)航空企業(yè)”獎項

2024年11月24日，世界旅游大獎頒獎盛典在葡萄牙盛大舉行，華龍航空榮膺全球首個“世界領(lǐng)先公務(wù)航空企業(yè)”獎項。這是WTA首次頒發(fā)此類獎項，高度肯定了對華龍航空卓越的服務(wù)品質(zhì)、持續(xù)的創(chuàng)新精神和對公務(wù)航空領(lǐng)域的杰出貢獻(xiàn)。公司還將為行業(yè)的可持續(xù)發(fā)展貢獻(xiàn)更多力量，積極履行社會責(zé)任，努力成為一家不僅偉大且具有深遠(yuǎn)影響力的企業(yè)。

?世界旅行獎 ?華龍航空 ?公務(wù)航空
全球首個AI Agent程序員全面開放！3600元/月

全球首個AIAgent程序員Devin今日宣布全面開放使用實現(xiàn)商業(yè)化，從最初的展示到全面使用不到一年時間。不過Devin的月費(fèi)高達(dá)500美元，成為目前市場上最貴的生成式AI產(chǎn)品之一。值得一提的是，對于一個公司言，Devin是沒有任何用戶數(shù)量限制的，無論多少人都能無限制的使用。

?AI程序員 ?生成式AI ?Devin
雷軍：武漢大學(xué)是全球最好大學(xué) 沒有之一

快科技12月8日消息，日前，小米CEO雷軍和武漢大學(xué)計算機(jī)學(xué)院雷軍班的同學(xué)在小米科技園進(jìn)行面對面交流。對于為什么支持辦雷軍班，雷軍表示，主要有三點：首先，在他心里，武漢大學(xué)是全球最好的大學(xué)，沒有之一；第二，計算機(jī)學(xué)科在這個時代還有巨大的機(jī)會；第三，產(chǎn)學(xué)研的深度融合，中國科技的進(jìn)步要建立在超強(qiáng)的產(chǎn)業(yè)基礎(chǔ)上。雷軍稱，雷軍班對我個人是莫大的榮譽(yù)，也是巨大的壓力?！崩总娺€給學(xué)生提了兩點建議，第一是把握機(jī)遇非常非常的重要，第二，在大學(xué)最重要的還是學(xué)知識，要像海綿一樣充分吸取知識的營養(yǎng)，并努力擴(kuò)大知識面。據(jù)了解，

?小米 ?雷軍班 ?武漢大學(xué)
全球 AI 實力排名出爐：美國核心領(lǐng)域表現(xiàn)卓越，斯坦福工具揭示 AI 生態(tài)新趨勢

站長之家11月23日消息：斯坦福人類中心人工智能研究所發(fā)布的2024年版人工智能全球活力工具顯示，美國在人工智能領(lǐng)域繼續(xù)全球領(lǐng)先，中國和英國分列第二和第三。這一工具通過研究論文、私人投資、專利等關(guān)鍵指標(biāo)，評估了36個國家的AI生態(tài)系統(tǒng)?！鸽S著更多國家建設(shè)其AI生態(tài)系統(tǒng)，我們將不斷添加新數(shù)據(jù)和新國家，」Maslej指出。

?人工智能 ?斯坦福 ?AI

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

Ilya向全世界宣布：預(yù)訓(xùn)練結(jié)束了！全球AI數(shù)據(jù)耗盡，智能才是未來

薦讓一讓，全球最鮮活的AI小貓來了

沸蛇AI語音鼠標(biāo)全面評測，從硬件到軟件，好用才是真智能

瓊瑤走了一個時代宣告結(jié)束了：小米王化發(fā)文悼念

愛聊強(qiáng)化網(wǎng)絡(luò)安全，智能AI與大數(shù)據(jù)守護(hù)用戶社交安全

全球AI監(jiān)管差異凸顯政策松緊將成為發(fā)展差距重要因素

世紀(jì)華通謝斐：以全球視野激發(fā)中國游戲形成“世界標(biāo)準(zhǔn)”

華龍航空榮獲全球首個“世界領(lǐng)先公務(wù)航空企業(yè)”獎項

全球首個AI Agent程序員全面開放！3600元/月

雷軍：武漢大學(xué)是全球最好大學(xué) 沒有之一

全球 AI 實力排名出爐：美國核心領(lǐng)域表現(xiàn)卓越，斯坦福工具揭示 AI 生態(tài)新趨勢

熱文

小紅書封號上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

小紅書被吐槽無理由封號客服回應(yīng)：未說明處罰時間就是永封

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

極越公關(guān)負(fù)責(zé)人被開除本人回應(yīng)：此前未接到任何通知

微信緊急提醒：警惕木馬病毒將加強(qiáng)對此類行為打擊

馬斯克稱星鏈可實現(xiàn)火星玩游戲：但存在約4到20分鐘延遲

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車?yán)m(xù)航之王

美團(tuán)：冬至期間將針對餃子等應(yīng)時食品訂單提供“超時保護(hù)”

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

英偉達(dá)AI芯片最大買家揭曉！微軟力壓同行霸榜

微信朋友圈崩了上熱搜騰訊客服：請嘗試這幾種方法

極越員工萬字怒懟ceo：公關(guān)總監(jiān)徐繼業(yè)怒罵員工蒼蠅

馬斯克將推出X Mail電子郵箱服務(wù)

百度回應(yīng)進(jìn)軍短?。寒?dāng)前內(nèi)容生態(tài)的一個重點發(fā)展方向

極越員工善后方案已出爐：員工獲“N+1”賠償由百度吉利出資

螞蟻集團(tuán)否認(rèn)借殼上市：目前沒有上市計劃

小紅書封號上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

阿里74億元出售銀泰！銀泰集團(tuán)回應(yīng)：與銀泰百貨無直接關(guān)聯(lián)

小紅書被吐槽無理由封號客服回應(yīng)：未說明處罰時間就是永封

站長商機(jī)

Ilya向全世界宣布：預(yù)訓(xùn)練結(jié)束了！全球AI數(shù)據(jù)耗盡，智能才是未來

熱文

站長商機(jī)

Ilya向全世界宣布：預(yù)訓(xùn)練結(jié)束了！全球AI數(shù)據(jù)耗盡，智能才是未來