o3模型智商157，比肩愛因斯坦！AI只用7個月，超過人類100年

2024-12-24 08:44 · 稿源： ? AIGC開放社區(qū)公眾號

聲明：本文來自于微信公眾號 AIGC開放社區(qū)，作者：AIGC開放社區(qū)，授權(quán)站長之家轉(zhuǎn)載發(fā)布。

根據(jù)OpenAI公布的數(shù)據(jù)顯示，新模型o3在Codeforces上的評級為2727，比全球99.8%程序員都要好。

如果轉(zhuǎn)化為智商大約在157，歷史上的愛因斯坦還能與AI較量一下。他沒有正式測試過智商，但外界普遍認為其智商在160以上。

雖然AI還沒有情商，只論智商的話，目前人類已經(jīng)無法看到AI的追尾燈了。

其實，OpenAI今年發(fā)布GPT-4o時智商也只有115，屬于正常人范圍。o1預覽版模型達到了123，相當于博士級水平。從完整版的o1開始達到驚人的135，o3mini則突破140大關(guān)。

OpenAI只用了短短7多個月的時間，就把AI的智商足足提升了42分。

如果按照Flynn Effect效應的智商進化論來看，人類想把智商提升42分的話，大約需要140年才能完成。

Flynn Effect效應是在1983年首次系統(tǒng)性提出來的，主要揭示了智力測試得分的變化規(guī)律，也幫助人們重新思考智力的本質(zhì)及其受到的影響因素。

調(diào)查顯示，在不同人群和年齡組中具有一致性，無論是發(fā)達國家還是發(fā)展中國家，不同種族和年齡的個體都觀察到了智商的增長，主要影響智商增長的因素包括，營養(yǎng)改善、教育質(zhì)量提高、健康條件改善、家庭規(guī)模減小、認知刺激增加等社會性原因。

平均而言，每10年人類的智商普遍會增加3分左右。

另外一個能體現(xiàn)高智商的就是做數(shù)學測試題。根據(jù)OpenAI發(fā)布的測試數(shù)據(jù)顯示，o3模型在美國AIME2024數(shù)學競賽的成績達到了恐怖的96.7。

大幅度超過預覽版o1模型，幾乎秒殺了GPT-4o的13.4。o3模型相當于全球最頂級的數(shù)學家。

不少網(wǎng)友看到o3模型智商表也相當震驚，感覺自己的智商要被AI嘲笑了。

OpenAI這是要搞一個愛因斯坦大腦計劃啊。

o1模型在門薩測試中獲得了133分。所以，我認為這個智商估算表格是完全正確的!

重要的是，o3模型的推理對合成學習數(shù)據(jù)非常有益。但當涉及到AGI時，這也被描述為‘奇點’，即技術(shù)增長變得無法控制的一個時間點。

愛因斯坦的智商也只有160而已啊~

157智商可能就是人類史上最聰明的人了。要是200+就得做另外那一桌了~

在o3的基準分數(shù)發(fā)布后，人們的恐懼是真實存在的。但由于AI革命可能在未來4年內(nèi)數(shù)據(jù)短缺，我們在接下來1年內(nèi)能取得的成就看起來不太確定。然而，人類的能力似乎已經(jīng)被AI超越了。

目前，o3模型還處于安全測試階段，不敢想全面公測之后有多爽，人手一個愛因斯坦，各種家教的飯碗怕是不保了，最起碼競爭會比現(xiàn)在激烈的多。同時很多困擾人類幾十年甚至上百年的數(shù)學、物理難題都可能得到解決。

本文素材來源o3測試數(shù)據(jù)，如有侵權(quán)請聯(lián)系刪除

（舉報）

相關(guān)推薦

關(guān)鍵詞：

薦OpenAI全量上線4o視頻通話 - 我們等了7個月。

今天是OpenAI直播第6天，終于來了個能看點的。Day4是個很無聊的canvas的極小更新以及向全量用戶開放，昨晚Day5完全就是給蘋果做下PR，都是純粹的垃圾時間。也為了我們這些，每天熬夜的兄弟。

?OpenAI
OpenAI最強推理模型o3發(fā)布：AGI能力暴漲接近人類水平

OpenAI連續(xù)12日圣誕發(fā)布”終于迎來激動人心的大結(jié)局，OpenAI推出重磅收官新品，其迄今最強前沿推理模型的升級版o3。OpenAI號稱o3在一些條件下接近通用人工智能，共有o3和精簡版o3-mini兩個版本。12、o1下一代模型o3亮相，推出兩個版本，正式版o3以及精簡版o3-mini。

?OpenAI ?o3模型 ?通用人工智能
蔚來11月共計交付新車20575臺！連續(xù)7個月突破2萬大關(guān)

快科技12月1日消息，在2024年11月，蔚來公司交付了20,575臺新車，實現(xiàn)了連續(xù)七個月銷量超過2萬臺的佳績。今年1至11月，蔚來累計交付新車190,832臺，同比增長了34.36%。在提升毛利率和穩(wěn)定市場的策略指導下，蔚來品牌11月交付新車15,493臺，而1-11月累計交付量達到180,599臺，同比增長了27.16%。樂道品牌的L60車型在11月交付了5,082臺新車，僅用64天累計交付量就超過了10,000臺，預計12月

?蔚來 ?汽車交付 ?2024年銷量
薦OpenAI甩王炸！發(fā)布新模型o3，一夜再次改變世界！

今天凌晨2點，OpenAI開啟第12天技術(shù)直播，也是最后一天。不負眾望終于整了個大的，發(fā)布全新預覽版模型——o3。研究人員可通過訪問OpenAI的官方網(wǎng)站，填寫申請表格參與測試。

?OpenAI ?o3模型 ?技術(shù)直播
薦AI日報：AI假冒名人直播帶貨違法；OpenAI o3 模型能耗驚人；AI技術(shù)將助推iPhone銷量

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、AI假冒名人直播帶貨屬違法行為可要求退一賠三近年來，AI技術(shù)的迅速發(fā)展帶來了深度偽造技術(shù)的應用，這種技術(shù)通過算法生成逼真的虛假內(nèi)容，導致了名人形象被冒用的現(xiàn)象。彼得·蒂爾的影響力在這些公司中無處不在，他推動的科技優(yōu)先理念引發(fā)了對國家安全與倫理的深思。

?AI技術(shù) ?假冒名人 ?違法行為
00后小伙在美國賣“三蹦子”3個月賺100萬爭取一年賺1000萬元

今天，00后小伙在美國賣三蹦子三個月賺100萬”的話題沖上了熱搜。這位年輕的創(chuàng)業(yè)者于2023年在美國開始銷售自己設(shè)計的電動三輪車。小伙希望能將他的產(chǎn)品推廣到全美各地，讓更多的消費者能夠體驗到這款創(chuàng)新且實用的交通工具，同時他也設(shè)定了一個雄心勃勃的目標：在接下來一年內(nèi)實現(xiàn)銷售額突破1000萬元人民幣。

?電動三輪車 ?創(chuàng)業(yè)成功 ?00后創(chuàng)業(yè)
薦OpenAI正式發(fā)布o3 - 通往AGI的路上，已經(jīng)沒有了任何阻礙

今天凌晨2點，OpenAI的12天直播，終于來到了最終章。也在一片圣誕的氣息中終于回歸。既然看到這里了，如果覺得不錯，隨手點個贊、在看、轉(zhuǎn)發(fā)三連吧，如果想第一時間收到推送，也可以給我個星標?～謝謝你看我的文章，我們，下次再見。

?OpenAI
薦科研也完了，AI暴虐170位人類專家，Nature子刊：大模型精準預測研究結(jié)果，準確率高達81%

知識密集型工作也敗了!大型語言模型在預測神經(jīng)科學結(jié)果方面超越了人類專家，平均準確率達到81%人類專家僅為63%;模型通過整合大量文獻數(shù)據(jù)，展現(xiàn)出了驚人的前瞻性預測能力，預示著未來科研工作中人機協(xié)作的巨大潛力。在現(xiàn)代化工具的幫助下，科研人員的群體規(guī)模、效率都有顯著提升，發(fā)表科學文獻的數(shù)量幾乎是呈指數(shù)級增長人類的閱讀效率卻幾乎沒有提升，新入行的研

?大型語言模型 ?神經(jīng)科學 ?人機協(xié)作
薦o3并非獨門秘技，谷歌已發(fā)背后關(guān)鍵機制，方法更簡單、成本更低

o1/o3帶火的推理計算Scaling，原來谷歌早在今年8月就曾探討過。來自斯坦福、牛津以及谷歌DeepMind的團隊提出通過重復采樣來擴展推理計算量——結(jié)果在編碼任務中將性能最多提高40%。不過也有網(wǎng)友指出了背后的局限性。

?推理計算 ?谷歌技術(shù) ?模型性能
薦AI日報：支付寶推AI創(chuàng)意生成平臺；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中間幀；OpenAI準備o3推理模型

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、谷歌發(fā)布王炸推理模型Gemini2.0FlashThinking，挑戰(zhàn)OpenAIo1谷歌近期推出的Gemini2.0FlashThinking模型在多模態(tài)推理領(lǐng)域展現(xiàn)出強大的能力，支持32，000個輸入標記和8，000個輸出標記，極大提升了處理復雜問題的效率。與前代產(chǎn)品相比，F(xiàn)alcon3的訓練規(guī)模翻倍，展現(xiàn)出強勁的競爭力，尤其是在與其他主流開源模型的基準測試中表現(xiàn)優(yōu)異。

?AI技術(shù) ?人工智能 ?機器學習

熱文

3 天
7天

站長商機

商務合作侵權(quán)投訴廣告服務版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

o3模型智商157，比肩愛因斯坦！AI只用7個月，超過人類100年

薦OpenAI全量上線4o視頻通話 - 我們等了7個月。

OpenAI最強推理模型o3發(fā)布：AGI能力暴漲接近人類水平

蔚來11月共計交付新車20575臺！連續(xù)7個月突破2萬大關(guān)

薦OpenAI甩王炸！發(fā)布新模型o3，一夜再次改變世界！

薦AI日報：AI假冒名人直播帶貨違法；OpenAI o3 模型能耗驚人；AI技術(shù)將助推iPhone銷量

00后小伙在美國賣“三蹦子”3個月賺100萬爭取一年賺1000萬元

薦OpenAI正式發(fā)布o3 - 通往AGI的路上，已經(jīng)沒有了任何阻礙

薦科研也完了，AI暴虐170位人類專家，Nature子刊：大模型精準預測研究結(jié)果，準確率高達81%

薦o3并非獨門秘技，谷歌已發(fā)背后關(guān)鍵機制，方法更簡單、成本更低

薦AI日報：支付寶推AI創(chuàng)意生成平臺；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中間幀；OpenAI準備o3推理模型

熱文

吳柳芳賬號再次被禁粉絲從600萬被清理至4萬抖音：低俗內(nèi)容吸

京東發(fā)布年終獎通知部分員工年前可收到年終獎

劉強東提前發(fā)年終獎絕大多數(shù)員工可獲5到8個月年終獎

肯德基中國漲價官方回應：運營成本變化導致

李斌回應螢火蟲外觀設(shè)計：看過實車的人都喜歡這個設(shè)計

央視曝光未成年人繞開防沉迷只需4元：通過租用游戲賬號規(guī)避

小米SU7最新版本OTA推送：正式接入VLM視覺語言大模型

微信可以線上送實體禮物了：微信小店“藍包”功能正灰度測試逐

FF再獲3000萬美元新一輪融資加速第二品牌FX戰(zhàn)略推進

騰訊QQ 2024年度報告發(fā)布：以脫口秀形式呈現(xiàn)

吳柳芳賬號再次被禁粉絲從600萬被清理至4萬抖音：低俗內(nèi)容吸

小紅書封號上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

京東發(fā)布年終獎通知部分員工年前可收到年終獎

劉強東提前發(fā)年終獎絕大多數(shù)員工可獲5到8個月年終獎

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

肯德基中國漲價官方回應：運營成本變化導致

消息稱OpenAI新模型GPT-5研發(fā)未達到預期：成本高昂效果欠佳

小紅書被吐槽無理由封號客服回應：未說明處罰時間就是永封

李斌回應螢火蟲外觀設(shè)計：看過實車的人都喜歡這個設(shè)計

央視曝光未成年人繞開防沉迷只需4元：通過租用游戲賬號規(guī)避

站長商機

o3模型智商157，比肩愛因斯坦！AI只用7個月，超過人類100年

熱文

站長商機

o3模型智商157，比肩愛因斯坦！AI只用7個月，超過人類100年