11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
隨著上個(gè)月2025研究生考試的結(jié)束,最新的考研數(shù)學(xué)真題成為大語言模型尤其是推理模型的「試煉場」,將考驗(yàn)它們的深度思考能力。業(yè)內(nèi)曾有著這樣一種共識:大語言模型在文字水平上的表現(xiàn)令人印象深刻,但說到數(shù)學(xué)就不甚令人滿意了。這些測試結(jié)果一一看下來,我們可以發(fā)現(xiàn):雖然OpenAI的o1在深度推理方面仍然是最強(qiáng)的,但國產(chǎn)推理大模型正在逐漸縮小與它的差距,此次智譜GLM-zero-preview和阿里QwQ的成績說明了這一點(diǎn)。
今天上午全國研究生考試數(shù)學(xué)科目結(jié)束,隨后#數(shù)一才是最猛的1##考研數(shù)學(xué)#等多條關(guān)于考研數(shù)學(xué)的詞條沖上熱搜。有網(wǎng)友表示,英一在數(shù)一面前就是弟弟,模擬卷遠(yuǎn)遠(yuǎn)趕不上真題的難度”,數(shù)一和英一,我都有點(diǎn)磕他倆了”還好我早就跟數(shù)一分手了”。但對于高校應(yīng)屆畢業(yè)生超1000萬的規(guī)模來說,考研群體依然占了其中很大一部分。