重磅！微軟開源最強(qiáng)小模型Phi-4，超GPT-4o、可商用

2025-01-09 08:48 · 稿源： ? AIGC開放社區(qū)公眾號

聲明：本文來自于微信公眾號AIGC開放社區(qū)，授權(quán)站長之家轉(zhuǎn)載發(fā)布。

今天凌晨，微軟研究院開源了目前最強(qiáng)小參數(shù)模型——phi-4。

去年12月12日，微軟首次展示了phi-4，參數(shù)只有140億性能卻極強(qiáng)，在GPQA研究生水平、MATH數(shù)學(xué)基準(zhǔn)測試中，超過了OpenAI的GPT-4o，也超過了同類頂級開源模型Qwen2.5-14B和Llama-3.3-70B。

在美國數(shù)學(xué)競賽AMC的測試中phi-4更是達(dá)到了91.8分，超過了Gemini Pro1.5、GPT-4o、Claude3.5Sonnet、Qwen2.5等知名開閉源模型，甚至整體性能可以與4050億參數(shù)的Llama-3.1媲美。

當(dāng)時很多人就希望微軟開源這款超強(qiáng)的小參數(shù)模型，甚至還有人在HuggingFace上傳盜版的phi-4權(quán)重?，F(xiàn)在，終于開源了，并且支持MIT許可證下商業(yè)用途。

開源地址:https://huggingface.co/microsoft/phi-4/tree/main

連HuggingFace官推都來祝賀，phi-4面子不小。

2025年美好的開始!有史以來最好的14B模型!!!

140參數(shù)的模型在MMLU獲得84.8分，太瘋狂了。恭喜!

謝謝你的模型和許可證變更!真棒。

你們都是英雄，趕緊下起來吧!

我期待Phi-4在Azure上實(shí)現(xiàn)無服務(wù)器功能。什么時候會可用?

小參數(shù)模型非常好。

Phi的小參數(shù)對于創(chuàng)意寫作來說是非常驚人的。

哇，phi-4模型能在蘋果的M4Pro筆記本上，以每秒約12個tokens的速度流暢運(yùn)行，這太棒了，感謝!

phi-4簡單介紹

phi-4能以如此小的參數(shù)在眾多測試基準(zhǔn)中打敗著名開閉源模型，高質(zhì)量的合成數(shù)據(jù)發(fā)揮了重要作用。

與傳統(tǒng)的從網(wǎng)絡(luò)爬取的有機(jī)數(shù)據(jù)相比，高質(zhì)量的合成數(shù)據(jù)更具優(yōu)勢。合成數(shù)據(jù)能夠提供結(jié)構(gòu)化、逐步的學(xué)習(xí)材料，使得模型能夠更加高效地學(xué)習(xí)語言的邏輯與推理過程。例如，在數(shù)學(xué)問題的解答中，合成數(shù)據(jù)可以按照解題步驟逐步呈現(xiàn)，幫助模型更好地理解問題的結(jié)構(gòu)與解題思路。

此外，合成數(shù)據(jù)能夠更好地與模型的推理上下文對齊，更接近于模型在實(shí)際應(yīng)用中需要生成的輸出格式，這有助于模型在預(yù)訓(xùn)練階段就適應(yīng)實(shí)際應(yīng)用場景的需求。例如，將網(wǎng)絡(luò)論壇中的事實(shí)信息改寫成類似大模型交互的風(fēng)格，使得這些信息在模型生成的對話中更加自然、合理。

phi-4的合成數(shù)據(jù)生成遵循多樣性、細(xì)膩性與復(fù)雜性、準(zhǔn)確性和推理鏈等原則。涵蓋了50多種不同類型的合成數(shù)據(jù)集，通過多階段提示流程、種子策劃、改寫與增強(qiáng)、自我修訂等多種方法，生成了約4000億個未加權(quán)的 tokens。

除了合成數(shù)據(jù)，phi-4還對有機(jī)數(shù)據(jù)進(jìn)行了嚴(yán)格的篩選與過濾。研究團(tuán)隊(duì)從網(wǎng)絡(luò)內(nèi)容、授權(quán)書籍和代碼庫等多渠道收集數(shù)據(jù)，并通過兩階段過濾過程，提取出具有高教育價值和推理深度的種子數(shù)據(jù)。

這些種子數(shù)據(jù)為合成數(shù)據(jù)的生成提供了基礎(chǔ)，同時也直接用于預(yù)訓(xùn)練，進(jìn)一步豐富了模型的知識儲備。在篩選過程中，微軟采用了基于小分類器的過濾方法，從大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)中挑選出高質(zhì)量的文檔。還針對多語言數(shù)據(jù)進(jìn)行了專門的處理，確保模型能夠處理包括德語、西班牙語、法語、葡萄牙語、意大利語、印地語和日語在內(nèi)的多種語言。

預(yù)訓(xùn)練方面，phi-4主要使用合成數(shù)據(jù)進(jìn)行訓(xùn)練，同時輔以少量的高質(zhì)量有機(jī)數(shù)據(jù)。這種數(shù)據(jù)混合策略使得模型能夠在學(xué)習(xí)推理和問題解決能力的同時，也能夠吸收豐富的知識內(nèi)容。

在中期訓(xùn)練階段，phi-4將上下文長度從4096擴(kuò)展到16384，以提高模型對長文本的處理能力。幫助模型進(jìn)一步增加了對長文本數(shù)據(jù)的訓(xùn)練，包括從高質(zhì)量非合成數(shù)據(jù)集中篩選出的長于8K 上下文的樣本，以及新創(chuàng)建的滿足4K 序列要求的合成數(shù)據(jù)集。

后訓(xùn)練階段是 phi-4優(yōu)化模型的關(guān)鍵。微軟采用了監(jiān)督微調(diào)（SFT）和直接偏好優(yōu)化(DPO)技術(shù)。在 SFT 階段，使用來自不同領(lǐng)域的高質(zhì)量數(shù)據(jù)生成的約8B tokens對預(yù)訓(xùn)練模型進(jìn)行微調(diào)，學(xué)習(xí)率為10-6，并添加了40種語言的多語言數(shù)據(jù)，所有數(shù)據(jù)均采用 chatml 格式。

DPO 技術(shù)則通過生成偏好數(shù)據(jù)來調(diào)整模型的輸出，使其更符合人類偏好。微軟還引入了關(guān)鍵tokens搜索（PTS）技術(shù)來生成DPO 對，該技術(shù)能夠識別對模型回答正確性有重大影響的關(guān)鍵tokens，并針對這些tokens創(chuàng)建偏好數(shù)據(jù)，從而提高模型在推理任務(wù)中的性能。

為了評估 phi-4的性能，微軟在多個基準(zhǔn)測試上進(jìn)行了測試。在學(xué)術(shù)基準(zhǔn)測試方面，如 MMLU、GPQA、MATH、HumanEval 等，phi-4表現(xiàn)出色。

在 MMLU測試中，phi-4取得了84.8的高分，在 GPQA 和 MATH 測試中，甚至超越了GPT -4o，在數(shù)學(xué)競賽相關(guān)的任務(wù)中展現(xiàn)出強(qiáng)大的推理能力。在與其他類似規(guī)模和更大規(guī)模的模型比較中，phi-4在12個基準(zhǔn)測試中的9個上優(yōu)于同類開源模型 Qwen -2.5-14B - Instruct。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

薦微軟發(fā)布Phi-4，最強(qiáng)小模型！參數(shù)極小、超GPT-4o

微軟研究院發(fā)布了最強(qiáng)小參數(shù)模型——Phi-4。Phi系列模型自今已經(jīng)發(fā)布了5代，Phi-4也延續(xù)了之前的小參數(shù)模式只有140億。值得一提的是，微軟AI副總裁、phi系列模型的靈魂人物之一SébastienBubeck已經(jīng)離開了微軟加入了OpenAI。

?Phi-4模型 ?微軟研究院 ?小參數(shù)模型
薦微軟Phi-4封神，14B小模型數(shù)學(xué)擊敗GPT-4o，合成數(shù)據(jù)占比40%，36頁技術(shù)報告出爐

微軟下一代14B小模型Phi-4出世了!僅用了40%合成數(shù)據(jù)，在數(shù)學(xué)性能上擊敗了GPT-4o，最新36頁技術(shù)報告出爐。140億參數(shù)，40%合成數(shù)據(jù)，年度SLM之王誕生!最近，微軟下一代小模型Phi-4正式亮相。還真有點(diǎn)期待，下一個Phi系列小模型的發(fā)布了。

?微軟Phi-4 ?數(shù)學(xué)基準(zhǔn) ?GPT-4o
薦AI日報：“即創(chuàng)”正式版上線；2024胡潤中國AI企業(yè)50強(qiáng)榜單；通義萬相推2.1視頻模型；微軟開源超強(qiáng)小模型Phi-4

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、巨量引擎旗下AIGC工具“即創(chuàng)”正式版上線巨量引擎的AIGC工具“即創(chuàng)”正式上線，提供多種內(nèi)容生成方式，包括AI腳本生成、智能成片和數(shù)字人等。用戶反饋新版本在圖像質(zhì)量和細(xì)節(jié)處理上顯著下降，導(dǎo)致微軟搜索部門負(fù)責(zé)人JordiRibas承認(rèn)并采取措施恢復(fù)舊版。

?人工智能 ?AIGC工具 ?內(nèi)容生成
薦GPT-4o再暴露「弱智」缺陷，大模型無一幸免，港中文等發(fā)布「視覺聽覺」基準(zhǔn)AV-Odyssey：26個任務(wù)直指死角問題

多模態(tài)大模型在聽覺上，居然也出現(xiàn)了「9.11>9.8」的現(xiàn)象，音量大小這種簡單問題都識別不了!港中文、斯坦福等大學(xué)聯(lián)合發(fā)布的AV-Odyssey基準(zhǔn)測試，包含26個視聽任務(wù)，覆蓋了7種聲音屬性，跨越了10個不同領(lǐng)域，確保測試的深度和廣度。在人工智能領(lǐng)域，我們一直以為頂尖的多模態(tài)大模型已經(jīng)無所不能，GPT-4o在ASR任務(wù)上已經(jīng)達(dá)到了97%的正確率，更是凸顯了強(qiáng)大的音頻理解能力?

?多模態(tài)大模型 ?音頻理解 ?AV-Odyssey基準(zhǔn)測試
4o-mini只有8B，o1也才300B！微軟論文意外曝光GPT核心機(jī)密

微軟又把OpenAI的機(jī)密泄露了??在論文中明晃晃寫著:英偉達(dá)2024年初發(fā)布B200時，就攤牌了GPT-4是1.8TMoE也就是1800B，這里微軟的數(shù)字更精確，為1.76T。論文中給OpenAI的mini系列，Claude3.5Sonnet也都附上了參數(shù)，總結(jié)如下:o1-preview約300B;o1-mini約100BGPT-4o約200B;GPT-4o-mini約8BClaude3.5Sonnet2024-10-22版本約175B微軟自己的Phi-3-7B，這個不用約了就是7B雖然論文中后面也有免責(zé)聲明:但還是有不少人覺得事情沒這么簡單。2025年的最新版本里，開源已經(jīng)被去掉了。

?OpenAI ?微軟 ?GPT-4
「天工大模型4.0」o1版和4o版正式上線天工APP和網(wǎng)頁免費(fèi)使用

2024年11月，昆侖萬維「天工大模型4.0」o1版和4o版正式公開發(fā)布，并啟動邀請測試。在2025年1月6日，我們正式將「天工大模型4.0」o1版和4o版同步上線，并全量登陸天工網(wǎng)頁和APP，人人免費(fèi)可用！歡迎所有用戶登陸天工web或下載天工APP體驗(yàn)最新「天工大模型4.0」o1版和4o版。

?天工大模型 ?昆侖萬維 ?中文邏輯推理
重磅！OpenAI開放滿血o1模型API，成本暴降60%

今天凌晨2點(diǎn)，OpenAI開啟了第9天技術(shù)分享直播，正式發(fā)布了o1模型的API，并且對實(shí)時API進(jìn)行大升級支持WebRTC。o1模型的API與之前的預(yù)覽版本相比，思考成本降低了60%，并且附帶高級視覺功能;GPT-4o的音頻成本降低60%mini版本價格更是暴降了10倍。這些API已經(jīng)普遍可用，更詳細(xì)內(nèi)容可以去OpenAI開發(fā)論壇查看。

?OpenAI ?o1模型API ?實(shí)時API
OpenAI最強(qiáng)推理模型o3發(fā)布：AGI能力暴漲接近人類水平

OpenAI連續(xù)12日圣誕發(fā)布”終于迎來激動人心的大結(jié)局，OpenAI推出重磅收官新品，其迄今最強(qiáng)前沿推理模型的升級版o3。OpenAI號稱o3在一些條件下接近通用人工智能，共有o3和精簡版o3-mini兩個版本。12、o1下一代模型o3亮相，推出兩個版本，正式版o3以及精簡版o3-mini。

?OpenAI ?o3模型 ?通用人工智能
薦AI日報：百川智能金融大模型發(fā)布；ChatGPT新增跨對話記憶功能；DeepSeek大模型一開發(fā)者將加盟小米；OpenAI最強(qiáng)推理模型o3

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI發(fā)布o(jì)3:AI推理能力的重大突破，得分高達(dá)87.5%OpenAI最近推出了其最新的o-Model推理系列模型o3，標(biāo)志著在數(shù)學(xué)和科學(xué)推理領(lǐng)域的重大進(jìn)展。閃極還推出了一個吸引人的促銷活動，用戶在300天內(nèi)打卡200天可獲得全額退款。

?人工智能 ?OpenAI ?推理能力
重磅開源！小米自研系統(tǒng)Vela已全面開源：OpenVela亮相GitHub、Gitee

小米自研系統(tǒng)Vela已全面開源，OpenVela項(xiàng)目已上線GitHub和Gitee，采用的是比較寬松的Apache2.0協(xié)議。早在2023年的小米IoT生態(tài)伙伴大會上，小米集團(tuán)曾學(xué)忠就曾宣布，小米自研系統(tǒng)將Vela面向全球軟硬件開發(fā)者正式開源。豐富的開發(fā)者工具：openvela提供了一系列完備的開發(fā)者工具，包括系統(tǒng)監(jiān)控、性能分析、調(diào)試器、追蹤、崩潰分析和日志分析工具，為開發(fā)者提供了強(qiáng)大的支持。

?小米Vela系統(tǒng) ?開源操作系統(tǒng) ?AIoT技術(shù)

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

重磅！微軟開源最強(qiáng)小模型Phi-4，超GPT-4o、可商用

薦微軟發(fā)布Phi-4，最強(qiáng)小模型！參數(shù)極小、超GPT-4o

薦微軟Phi-4封神，14B小模型數(shù)學(xué)擊敗GPT-4o，合成數(shù)據(jù)占比40%，36頁技術(shù)報告出爐

薦AI日報：“即創(chuàng)”正式版上線；2024胡潤中國AI企業(yè)50強(qiáng)榜單；通義萬相推2.1視頻模型；微軟開源超強(qiáng)小模型Phi-4

薦GPT-4o再暴露「弱智」缺陷，大模型無一幸免，港中文等發(fā)布「視覺聽覺」基準(zhǔn)AV-Odyssey：26個任務(wù)直指死角問題

4o-mini只有8B，o1也才300B！微軟論文意外曝光GPT核心機(jī)密

「天工大模型4.0」o1版和4o版正式上線天工APP和網(wǎng)頁免費(fèi)使用

重磅！OpenAI開放滿血o1模型API，成本暴降60%

OpenAI最強(qiáng)推理模型o3發(fā)布：AGI能力暴漲接近人類水平

薦AI日報：百川智能金融大模型發(fā)布；ChatGPT新增跨對話記憶功能；DeepSeek大模型一開發(fā)者將加盟小米；OpenAI最強(qiáng)推理模型o3

重磅開源！小米自研系統(tǒng)Vela已全面開源：OpenVela亮相GitHub、Gitee

熱文

地震被壓廢墟下戴帽小孩系A(chǔ)I生成：請注意甄別

12306三天內(nèi)第二次崩了官方致歉：故障已基本緩解

馬云“臘八之約”透露：接下來10年變化可能超出想象

賈躍亭全新品牌FX官宣！首款MPV車型諜照正式發(fā)布

天貓與銀聯(lián)合作接入云閃付，簡化政府補(bǔ)貼領(lǐng)取流程

淘寶官宣“送禮物”功能上線：送禮教程公布

淘寶上線“送禮物”功能，激烈“紅包大戰(zhàn)”再度升級

東方甄選稱公司從未有人辱罵董宇輝將對造謠者追責(zé)

2024年我國快遞業(yè)務(wù)量突破1700億件同比增長了21%

前谷歌員工創(chuàng)辦的3D設(shè)計(jì)應(yīng)用Rooms獲得 100 萬美元投資

劉強(qiáng)東給小學(xué)老師每人發(fā)10萬現(xiàn)金：希望鄉(xiāng)親們新年開心

騰訊：企業(yè)微信HarmonyOS鴻蒙Next版正式上線

地震被壓廢墟下戴帽小孩系A(chǔ)I生成：請注意甄別

12306三天內(nèi)第二次崩了官方致歉：故障已基本緩解

小紅書突破3000萬老年活躍用戶，創(chuàng)作者數(shù)量三年增三倍

體驗(yàn)了羅永浩的AI應(yīng)用，我發(fā)現(xiàn)這就是一個大鍋亂燉的AI助理？

京東緊急馳援西藏震區(qū) 劉強(qiáng)東：全國任何地方發(fā)生災(zāi)難捐物資無

抖音副總裁回應(yīng)用戶將錢讀成米：以訛傳訛平臺允許提“錢”

騰訊被列入美國“第1260H條清單” 回應(yīng)：是一個錯誤會共同解

重回2008！騰訊官宣《穿越火線》懷舊模式上線時間：預(yù)約已開啟

站長商機(jī)

重磅！微軟開源最強(qiáng)小模型Phi-4，超GPT-4o、可商用

熱文

站長商機(jī)

重磅！微軟開源最強(qiáng)小模型Phi-4，超GPT-4o、可商用