聲明:本文來自于微信公眾號 AIGC開放社區(qū),作者:AIGC開放社區(qū),授權(quán)站長之家轉(zhuǎn)載發(fā)布。
根據(jù)OpenAI公布的數(shù)據(jù)顯示,新模型o3在Codeforces上的評級為2727,比全球99.8%程序員都要好。
如果轉(zhuǎn)化為智商大約在157,歷史上的愛因斯坦還能與AI較量一下。他沒有正式測試過智商,但外界普遍認為其智商在160以上。
雖然AI還沒有情商,只論智商的話,目前人類已經(jīng)無法看到AI的追尾燈了。
其實,OpenAI今年發(fā)布GPT-4o時智商也只有115,屬于正常人范圍。o1預覽版模型達到了123,相當于博士級水平。從完整版的o1開始達到驚人的135,o3mini則突破140大關(guān)。
OpenAI只用了短短7多個月的時間,就把AI的智商足足提升了42分。
如果按照Flynn Effect效應的智商進化論來看,人類想把智商提升42分的話,大約需要140年才能完成。
Flynn Effect效應是在1983年首次系統(tǒng)性提出來的,主要揭示了智力測試得分的變化規(guī)律,也幫助人們重新思考智力的本質(zhì)及其受到的影響因素。
調(diào)查顯示,在不同人群和年齡組中具有一致性,無論是發(fā)達國家還是發(fā)展中國家,不同種族和年齡的個體都觀察到了智商的增長,主要影響智商增長的因素包括,營養(yǎng)改善、教育質(zhì)量提高、健康條件改善、家庭規(guī)模減小、認知刺激增加等社會性原因。
平均而言,每10年人類的智商普遍會增加3分左右。
另外一個能體現(xiàn)高智商的就是做數(shù)學測試題。根據(jù)OpenAI發(fā)布的測試數(shù)據(jù)顯示,o3模型在美國AIME2024數(shù)學競賽的成績達到了恐怖的96.7。
大幅度超過預覽版o1模型,幾乎秒殺了GPT-4o的13.4。o3模型相當于全球最頂級的數(shù)學家。
不少網(wǎng)友看到o3模型智商表也相當震驚,感覺自己的智商要被AI嘲笑了。
OpenAI這是要搞一個愛因斯坦大腦計劃啊。
o1模型在門薩測試中獲得了133分。所以,我認為這個智商估算表格是完全正確的!
重要的是,o3模型的推理對合成學習數(shù)據(jù)非常有益。但當涉及到AGI時,這也被描述為‘奇點’,即技術(shù)增長變得無法控制的一個時間點。
愛因斯坦的智商也只有160而已啊~
157智商可能就是人類史上最聰明的人了。要是200+就得做另外那一桌了~
在o3的基準分數(shù)發(fā)布后,人們的恐懼是真實存在的。但由于AI革命可能在未來4年內(nèi)數(shù)據(jù)短缺,我們在接下來1年內(nèi)能取得的成就看起來不太確定。然而,人類的能力似乎已經(jīng)被AI超越了。
目前,o3模型還處于安全測試階段,不敢想全面公測之后有多爽,人手一個愛因斯坦,各種家教的飯碗怕是不保了,最起碼競爭會比現(xiàn)在激烈的多。同時很多困擾人類幾十年甚至上百年的數(shù)學、物理難題都可能得到解決。
本文素材來源o3測試數(shù)據(jù),如有侵權(quán)請聯(lián)系刪除
(舉報)