4o-mini只有8B，o1也才300B！微軟論文意外曝光GPT核心機密

2025-01-02 11:07 · 稿源：量子位公眾號

聲明:本文來自于微信公眾號量子位，作者:夢晨，授權(quán)站長之家轉(zhuǎn)載發(fā)布。

微軟又把OpenAI的機密泄露了??在論文中明晃晃寫著:

o1-preview約300B參數(shù)，GPT-4o約200B，GPT-4o-mini約8B……?

英偉達2024年初發(fā)布B200時，就攤牌了GPT-4是1.8T MoE也就是1800B，這里微軟的數(shù)字更精確，為1.76T。

除此之外，論文中給OpenAI的mini系列，Claude3.5Sonnet也都附上了參數(shù)，總結(jié)如下:

o1-preview約300B;o1-mini約100B
GPT-4o約200B;GPT-4o-mini約8B
Claude3.5Sonnet2024-10-22版本約175B
微軟自己的Phi-3-7B，這個不用約了就是7B

雖然論文中后面也有免責(zé)聲明:

確切數(shù)據(jù)尚未公開，這里大部分?jǐn)?shù)字是估計的。

但還是有不少人覺得事情沒這么簡單。

比如為什么唯獨沒有放谷歌Gemini模型的參數(shù)估計?或許他們對放出來的數(shù)字還是有信心的。

也有人認(rèn)為，大多數(shù)模型都是在英偉達GPU上運行的，所以可以通過token生成速度來估計。

只有谷歌模型是在TPU上運行的，所以不好估計。

而且微軟也不是第一次干這事了。

23年10月，微軟就在一篇論文里“意外”曝出GPT-3.5-Turbo模型的20B參數(shù)，在后續(xù)論文版本中又刪除了這一信息。

就說你是故意的還是不小心的?

微軟這篇論文說了什么

實際上，原論文介紹了一項與醫(yī)學(xué)相關(guān)的benchmark——MEDEC。

12月26日就已經(jīng)發(fā)布，不過是比較垂直領(lǐng)域的論文，可能非相關(guān)方向的人都不會看，年后才被列文虎克網(wǎng)友們發(fā)現(xiàn)。

研究起因是，據(jù)美國醫(yī)療機構(gòu)調(diào)查顯示，有1/5的患者在閱讀臨床筆記時報告發(fā)現(xiàn)了錯誤，而40%的患者認(rèn)為這些錯誤可能影響他們的治療。

而且另一方面，LLMs（大語言模型）被越來越多的用于醫(yī)學(xué)文檔任務(wù)(如生成診療方法)。

因此，MEDEC此番有兩個任務(wù)。一是識別并發(fā)現(xiàn)臨床筆記中的錯誤;二是還能予以改正。

為了進行研究，MEDEC數(shù)據(jù)集包含3848份臨床文本，其中包括來自三個美國醫(yī)院系統(tǒng)的488份臨床筆記，這些筆記之前未被任何LLM見過。

它涵蓋五種類型的錯誤（診斷、管理、治療、藥物治療和致病因子），這些錯誤類型是通過分析醫(yī)學(xué)委員會考試中最常見的問題類型選擇的，并由8位醫(yī)療人員參與錯誤標(biāo)注。

而參數(shù)泄露即發(fā)生在實驗環(huán)節(jié)。

按照實驗設(shè)計，研究者將選取近期主流的大模型和小模型來參與筆記識別和糾錯。

而就在介紹最終選定的模型時，模型參數(shù)、發(fā)布時間一下子都被公開了。

對了，省去中間過程，這項研究得出的結(jié)論是:Claude3.5Sonnet在錯誤標(biāo)志檢測方面優(yōu)于其他LLM方法，得分為70.16，第二名是o1-mini。

網(wǎng)友:按價格算合理

每一次，ChatGPT相關(guān)模型架構(gòu)和參數(shù)泄露，都會引起軒然大波，這次也不例外。

23年10月，微軟論文聲稱GPT-3.5-Turbo只有20B參數(shù)的時候，就有人感嘆:難怪OpenAI對開源模型這么緊張。

24年3月，英偉達確認(rèn)GPT-4是1.8T MoE，而2000張B200可以在90天內(nèi)完成訓(xùn)練的時候，大家覺得MoE已經(jīng)且仍將是大模型架構(gòu)趨勢。

這一次，基于微軟估計的數(shù)據(jù)，網(wǎng)友們主要有幾個關(guān)注點:

如果Claude3.5Sonnet真的比GPT-4o還小，那Anthropic團隊就擁有技術(shù)優(yōu)勢。

以及不相信GPT-4o-mini只有8B這么小。

不過此前也有人根據(jù)推理成本來算，4o-mini的價格是3.5-turbo的40%，如果3.5-turbo的20B數(shù)字準(zhǔn)確，那么4o-mini剛好是8B左右。

不過這里的8B也是指MoE模型的激活參數(shù)。

總之，OpenAI大概是不會公布確切數(shù)字了。

此前奧特曼征集2024年新年愿望，最后公布的清單中還有“開源”。2025年的最新版本里，開源已經(jīng)被去掉了。

論文地址:

https://arxiv.org/pdf/2412.19260

參考鏈接:

[1]https://x.com/Yuchenj_UW/status/1874507299303379428

[2]https://www.reddit.com/r/LocalLLaMA/comments/1f1vpyt/why_gpt_4o_mini_is_probably_around_8b_active/

（舉報）

相關(guān)推薦

關(guān)鍵詞：

薦微軟發(fā)布Phi-4，最強小模型！參數(shù)極小、超GPT-4o

微軟研究院發(fā)布了最強小參數(shù)模型——Phi-4。Phi系列模型自今已經(jīng)發(fā)布了5代，Phi-4也延續(xù)了之前的小參數(shù)模式只有140億。值得一提的是，微軟AI副總裁、phi系列模型的靈魂人物之一SébastienBubeck已經(jīng)離開了微軟加入了OpenAI。

?Phi-4模型 ?微軟研究院 ?小參數(shù)模型
薦微軟Phi-4封神，14B小模型數(shù)學(xué)擊敗GPT-4o，合成數(shù)據(jù)占比40%，36頁技術(shù)報告出爐

微軟下一代14B小模型Phi-4出世了!僅用了40%合成數(shù)據(jù)，在數(shù)學(xué)性能上擊敗了GPT-4o，最新36頁技術(shù)報告出爐。140億參數(shù)，40%合成數(shù)據(jù)，年度SLM之王誕生!最近，微軟下一代小模型Phi-4正式亮相。還真有點期待，下一個Phi系列小模型的發(fā)布了。

?微軟Phi-4 ?數(shù)學(xué)基準(zhǔn) ?GPT-4o
重磅！OpenAI發(fā)布滿血o1、無限使用，最強大模型來了

今天凌晨兩點，OpenAI正式開啟了12天技術(shù)分享直播，并發(fā)布了最新產(chǎn)品ChatGPTPro。ChatGPTPro可以無限使用完整版o1和Pro模式，同時可以使用高級語音和圖片上傳功能。這只是OpenAI的連續(xù)12天分享技術(shù)的第一天，后續(xù)「AIGC開放社區(qū)」將會繼續(xù)為大家介紹。

?OpenAI ?ChatGPT ?Pro
成本暴降60% OpenAI宣布開放滿血o1模型API

從12月5日開始，OpenAI將在連續(xù)12個工作日直播，每天發(fā)布一款全新的應(yīng)用或功能。今天是發(fā)布會的第9天，直播內(nèi)容面向開發(fā)者，OpenAI正式發(fā)布o(jì)1模型的API，并對實時API進行大升級支持WebRTC。OpenAI的周活躍用戶數(shù)量在今年8月剛剛突破2億。

?OpenAI ?o1模型API ?WebRTC升級
重磅！OpenAI開放滿血o1模型API，成本暴降60%

今天凌晨2點，OpenAI開啟了第9天技術(shù)分享直播，正式發(fā)布了o1模型的API，并且對實時API進行大升級支持WebRTC。o1模型的API與之前的預(yù)覽版本相比，思考成本降低了60%，并且附帶高級視覺功能;GPT-4o的音頻成本降低60%mini版本價格更是暴降了10倍。這些API已經(jīng)普遍可用，更詳細內(nèi)容可以去OpenAI開發(fā)論壇查看。

?OpenAI ?o1模型API ?實時API
天璣9400小屏旗艦！OPPO Find X8 mini參數(shù)首度曝光

博主數(shù)碼閑聊站曝光了OPPOFindX8mini的細節(jié)參數(shù)。OPPOFindX8mini采用6.31英寸1.5KLTPO直屏，后置5000萬三攝，包含一顆5000萬像素潛望長焦，配備金屬中框、玻璃機身，支持屏幕指紋，支持無線充電。這讓寸土寸金的小屏旗艦得以塞下更大容量的電池，做到無明顯短板的使用體驗。

?OPPO ?Find ?X8
小米天璣8系出貨破3000萬！REDMI Turbo系列將深度綁定天璣8系

在今天的天璣8400發(fā)布會上，不光是王騰亮相，盧偉冰也親自登臺。盧偉冰表示，天璣8000系列因REDMI紅，小米集團的天璣8000系列累計出貨量已經(jīng)突破3000萬。除了芯片之外，REDMITurbo4還將采用1.5KLTPS直屏，后置5000萬主攝，電池是6500mAh，支持90W有線充，支持IP68級防塵防水，妥妥的同級爆款配置，值得期待。

?天璣8400 ?REDMI ?中端市場
薦2024的最后一天，由智譜AI新上線的o1為這一年劃上句點。

居然看到智譜也上線他們的o1模型了。哪家好人在2024年的最后一天來發(fā)他們的新模型啊。

?智譜模型 ?o1模型 ?Zero推理
OpenAI發(fā)布最強模型o1滿血版！史上最貴訂閱費1450元/月

在12天12場直播”活動首日，OpenAI推出了其最強推理模型o1滿血版本，同時宣布了史上最貴的訂閱服務(wù)ChatGPTPro，每月訂閱費用高達200美元。此次發(fā)布的滿血版o1模型在速度、性能和準(zhǔn)確性上相較于預(yù)覽版有了顯著提升，同時新增了多模態(tài)輸入功能，允許用戶上傳圖片以獲得更準(zhǔn)確的回答。如果是一名科學(xué)研究人員或程序員，且o1模型的推理能力不足以滿足需求，那么可以考慮氪金”進階模式。

?OpenAI ?ChatGPT ?Pro
薦OpenAI放王炸！Sora、滿血o1，連續(xù)12天發(fā)布最新技術(shù)！

OpenAI首席執(zhí)行官SamAltman宣布，從太平洋時間明天上午10點開始，將進行為期12天的OpenAI活動。在每個工作日，都會有一個直播，包括最新技術(shù)或產(chǎn)品演示，有些是重要的發(fā)布，有些是小驚喜。「AIGC開放社區(qū)」將在這12天里，為大家持續(xù)介紹OpenAI的最新技術(shù)和產(chǎn)品展示。

?OpenAI ?技術(shù)分享 ?Sam

熱文

3 天
7天

站長商機

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

4o-mini只有8B，o1也才300B！微軟論文意外曝光GPT核心機密

微軟這篇論文說了什么

網(wǎng)友:按價格算合理

薦微軟發(fā)布Phi-4，最強小模型！參數(shù)極小、超GPT-4o

薦微軟Phi-4封神，14B小模型數(shù)學(xué)擊敗GPT-4o，合成數(shù)據(jù)占比40%，36頁技術(shù)報告出爐

重磅！OpenAI發(fā)布滿血o1、無限使用，最強大模型來了

成本暴降60% OpenAI宣布開放滿血o1模型API

重磅！OpenAI開放滿血o1模型API，成本暴降60%

天璣9400小屏旗艦！OPPO Find X8 mini參數(shù)首度曝光

小米天璣8系出貨破3000萬！REDMI Turbo系列將深度綁定天璣8系

薦2024的最后一天，由智譜AI新上線的o1為這一年劃上句點。

OpenAI發(fā)布最強模型o1滿血版！史上最貴訂閱費1450元/月

薦OpenAI放王炸！Sora、滿血o1，連續(xù)12天發(fā)布最新技術(shù)！

熱文

蘋果市值一夜蒸發(fā)7248億此前官網(wǎng)已開啟降價活動

辛巴要花15億開超市：號稱將改變大家消費習(xí)慣

雷軍親自出面海底撈正式入駐小米科技園全體員工88折

周鴻祎：打工不可能賺大錢創(chuàng)業(yè)才能財富自由

法拉第未來股價一夜暴漲超50% 第二品牌FX原型車即將亮相

胖東來正式規(guī)定員工不得收付彩禮、依靠父母買房買車

1999元全球首款媽祖平安智能手表發(fā)布：搭載華為智能機芯

抖音宣布將加強內(nèi)容推薦多樣性破除“信息繭房”

格力申請董瓷、明珠瓷和格力好老公等商標(biāo)

周鴻祎：我也要送車什么車大家算了算

雷軍辟謠只招聘35歲以下員工：僅針對未來之星項目

雷軍曬健身房照片：此前設(shè)定100次健身打卡目標(biāo)

雷軍感謝網(wǎng)友祝他年入百萬：愿大家夢想成真今晚8點跨年直播

阿里巴巴AI“生意管家”: 400萬商家的秘密武器

蘋果市值一夜蒸發(fā)7248億此前官網(wǎng)已開啟降價活動

董明珠曾喊話雷軍給股民分多少錢！格力：擬分紅超55億

抖音副總裁回應(yīng)吳柳芳同名賬號被封：仿冒當(dāng)事人

俞敏洪稱東方甄選是火藥桶：未來一定會更加美好

蘋果官網(wǎng)突然降價客服回應(yīng)能否退差價

抖音李亮：字節(jié)70億美元購買英偉達芯片不實張一鳴從未參與算力

站長商機

4o-mini只有8B，o1也才300B！微軟論文意外曝光GPT核心機密

微軟這篇論文說了什么

網(wǎng)友:按價格算合理

熱文

站長商機

4o-mini只有8B，o1也才300B！微軟論文意外曝光GPT核心機密