微軟推出全新預(yù)訓(xùn)練模型phi-1.5 僅13億參數(shù)常識推理碾壓Llama2

2023-09-18 09:46 · 稿源：站長之家

要點(diǎn):
1、微軟研究人員推出了一個僅有13億參數(shù)的LLM模型Phi-1.5。
2、Phi-1.5在常識推理任務(wù)上表現(xiàn)優(yōu)異，優(yōu)于多個參數(shù)量十倍以上的模型。
3、研究表明，模型參數(shù)規(guī)模不是決定性因素，高質(zhì)量數(shù)據(jù)更為重要。

站長之家（ChinaZ.com）9月18日消息:微軟研究人員最近在一篇論文中提出了一個新的語言模型Phi-1.5，該模型的參數(shù)量僅有13億。研究人員主要關(guān)注Phi-1.5在常識推理方面的表現(xiàn)，因?yàn)檫@是對語言模型能力的重要考驗(yàn)。

論文地址:https://arxiv.org/abs/2309.05463

項(xiàng)目地址:https://huggingface.co/microsoft/phi-1_5

結(jié)果表明，Phi-1.5在多個常識推理基準(zhǔn)測試數(shù)據(jù)集上都取得了與參數(shù)量是其10倍以上的模型相當(dāng)或更好的結(jié)果。例如在WinoGrande、ARC-Easy、ARC-Challenge、BoolQ和SIQA等數(shù)據(jù)集上的表現(xiàn)，都與Llama2-7B、Falcon-7B和Vicuna-13B相當(dāng)甚至更好。

這說明模型的參數(shù)規(guī)模不是決定性因素，采用高質(zhì)量合成數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練可能更為關(guān)鍵。研究中，Phi-1.5使用了微軟之前提出的Phi-1模型的訓(xùn)練數(shù)據(jù)，以及新增的“教科書級”合成數(shù)據(jù)進(jìn)行訓(xùn)練。

結(jié)果表明，Phi-1.5不僅展現(xiàn)出許多大模型所具有的語言理解和推理能力，在控制有害內(nèi)容生成方面也具有一定優(yōu)勢，這對研究大型語言模型的社會影響意義重大。本研究表明，相比單純追求模型規(guī)模，如何獲取高質(zhì)量訓(xùn)練數(shù)據(jù)可能更為重要，這為未來語言模型研究提供了新的思路。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

薦微軟發(fā)布Phi-4，最強(qiáng)小模型！參數(shù)極小、超GPT-4o

微軟研究院發(fā)布了最強(qiáng)小參數(shù)模型——Phi-4。Phi系列模型自今已經(jīng)發(fā)布了5代，Phi-4也延續(xù)了之前的小參數(shù)模式只有140億。值得一提的是，微軟AI副總裁、phi系列模型的靈魂人物之一SébastienBubeck已經(jīng)離開了微軟加入了OpenAI。

?Phi-4模型 ?微軟研究院 ?小參數(shù)模型
薦重磅！微軟開源最強(qiáng)小模型Phi-4，超GPT-4o、可商用

微軟研究院開源了目前最強(qiáng)小參數(shù)模型——phi-4。去年12月12日，微軟首次展示了phi-4，參數(shù)只有140億性能卻極強(qiáng)，在GPQA研究生水平、MATH數(shù)學(xué)基準(zhǔn)測試中，超過了OpenAI的GPT-4o，也超過了同類頂級開源模型Qwen2.5-14B和Llama-3.3-70B。在與其他類似規(guī)模和更大規(guī)模的模型比較中，phi-4在12個基準(zhǔn)測試中的9個上優(yōu)于同類開源模型Qwen-2.5-14B-Instruct。

?微軟研究院 ?phi-4模型 ?人工智能
馬斯克宣布Grok 3即將推出：已完成預(yù)訓(xùn)練計(jì)算量超Grok 2十倍

馬斯克在社交平臺宣布：Grok3即將推出，已完成預(yù)訓(xùn)練，其計(jì)算量比Grok2高10倍。作為馬斯克麾下社交媒體平臺X的強(qiáng)大后盾，Grok系列模型一直以其卓越的生成式人工智能技術(shù)引領(lǐng)潮流。Grok3的推出將進(jìn)一步強(qiáng)化X平臺的搜索功能、賬戶簡介優(yōu)化、帖子深度分析及智能回復(fù)等核心服務(wù)，為用戶帶來更加智能化、個性化的社交體驗(yàn)。

?馬斯克 ?Grok ?3
薦AI日報(bào)：“即創(chuàng)”正式版上線；2024胡潤中國AI企業(yè)50強(qiáng)榜單；通義萬相推2.1視頻模型；微軟開源超強(qiáng)小模型Phi-4

歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、巨量引擎旗下AIGC工具“即創(chuàng)”正式版上線巨量引擎的AIGC工具“即創(chuàng)”正式上線，提供多種內(nèi)容生成方式，包括AI腳本生成、智能成片和數(shù)字人等。用戶反饋新版本在圖像質(zhì)量和細(xì)節(jié)處理上顯著下降，導(dǎo)致微軟搜索部門負(fù)責(zé)人JordiRibas承認(rèn)并采取措施恢復(fù)舊版。

?人工智能 ?AIGC工具 ?內(nèi)容生成
薦Ilya向全世界宣布：預(yù)訓(xùn)練結(jié)束了！全球AI數(shù)據(jù)耗盡，超級智能才是未來

【新智元導(dǎo)讀】全球頂會NeurIPS2024中，Ilya登場演講，向全世界宣告:預(yù)訓(xùn)練結(jié)束了!數(shù)據(jù)如同化石燃料般難以再生，未來，AI的發(fā)展方向就是具備自我意識的超級智能。Ilya現(xiàn)身NeurIPS2024，宣布:預(yù)訓(xùn)練從此將徹底終結(jié)。畢竟預(yù)測未來是不可能的，任何事情都有可能發(fā)生。

?NeurIPS2024 ?預(yù)訓(xùn)練 ?AI發(fā)展
薦微軟Phi-4封神，14B小模型數(shù)學(xué)擊敗GPT-4o，合成數(shù)據(jù)占比40%，36頁技術(shù)報(bào)告出爐

微軟下一代14B小模型Phi-4出世了!僅用了40%合成數(shù)據(jù)，在數(shù)學(xué)性能上擊敗了GPT-4o，最新36頁技術(shù)報(bào)告出爐。140億參數(shù)，40%合成數(shù)據(jù)，年度SLM之王誕生!最近，微軟下一代小模型Phi-4正式亮相。還真有點(diǎn)期待，下一個Phi系列小模型的發(fā)布了。

?微軟Phi-4 ?數(shù)學(xué)基準(zhǔn) ?GPT-4o
規(guī)模世界第一！我國在運(yùn)和核準(zhǔn)在建核電機(jī)組裝機(jī)約1.13億千瓦

據(jù)報(bào)道，截至2024年，我國在運(yùn)和核準(zhǔn)在建核電機(jī)組裝機(jī)約1.13億千瓦，規(guī)模升至世界第一。2025年，我國將核準(zhǔn)開工一批條件成熟的沿海核電項(xiàng)目，穩(wěn)步推進(jìn)在建核電工程建設(shè)，到2025年底在運(yùn)核電裝機(jī)達(dá)到6500萬千瓦左右。截至2024年，全國充電基礎(chǔ)設(shè)施總量已超過1200萬臺，95%以上的高速公路服務(wù)區(qū)均具備了充電能力，為新能源汽車的普及與發(fā)展提供了有力支撐。

?核電機(jī)組 ?能源安全 ?綠色發(fā)展
薦OpenAI科學(xué)家：現(xiàn)有模型+后訓(xùn)練足以產(chǎn)生黎曼猜想的新證明

一個全新的模型能力衡量指標(biāo)誕生了?!OpenAI科學(xué)家塞巴斯蒂安?布貝克表示:看到AGI時間這個新概念，網(wǎng)友們也是立即就展開了熱烈的討論。如果模型可以達(dá)到人類需要數(shù)周或數(shù)月才能完成的任務(wù)，也就代表它可以將長期推理和計(jì)劃結(jié)合起來，也就和真正的AGI差不多了:不過也有人表示這個說法有點(diǎn)模糊，人腦也很難機(jī)械地把任務(wù)完成時間限定為幾個月、幾年:反方辯手湯姆·麥考?

?OpenAI ?黎曼猜想 ?后訓(xùn)練
薦AI日報(bào)：支付寶推AI創(chuàng)意生成平臺；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中間幀；OpenAI準(zhǔn)備o3推理模型

歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、谷歌發(fā)布王炸推理模型Gemini2.0FlashThinking，挑戰(zhàn)OpenAIo1谷歌近期推出的Gemini2.0FlashThinking模型在多模態(tài)推理領(lǐng)域展現(xiàn)出強(qiáng)大的能力，支持32，000個輸入標(biāo)記和8，000個輸出標(biāo)記，極大提升了處理復(fù)雜問題的效率。與前代產(chǎn)品相比，F(xiàn)alcon3的訓(xùn)練規(guī)模翻倍，展現(xiàn)出強(qiáng)勁的競爭力，尤其是在與其他主流開源模型的基準(zhǔn)測試中表現(xiàn)優(yōu)異。

?AI技術(shù) ?人工智能 ?機(jī)器學(xué)習(xí)
可靈AI推出可圖1.5模型畫面質(zhì)量、人像美感躍升新高度

12 月 27 日，快手可靈AI宣布面向全球上線可圖1. 5 圖像模型，AI圖片的畫面質(zhì)量和人像美感再上新臺階；同時推出全新的“AI模特”功能，可精準(zhǔn)生成高質(zhì)量AI模特。此外，可靈AI還發(fā)布了基于可靈 1.5 模型的尾幀生成能力，對口型功能也上新更多音色?？蓤D1. 5 模型升級畫面質(zhì)感美學(xué)表現(xiàn)達(dá)到新高度AI圖片方面，本次可圖1. 5 圖像模型帶來了畫面質(zhì)量及美感大幅提升。更加細(xì)膩真?

?快手可靈AI ?可圖1.5模型 ?AI模特功能

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

微軟推出全新預(yù)訓(xùn)練模型phi-1.5 僅13億參數(shù)常識推理碾壓Llama2

薦微軟發(fā)布Phi-4，最強(qiáng)小模型！參數(shù)極小、超GPT-4o

薦重磅！微軟開源最強(qiáng)小模型Phi-4，超GPT-4o、可商用

馬斯克宣布Grok 3即將推出：已完成預(yù)訓(xùn)練計(jì)算量超Grok 2十倍

薦AI日報(bào)：“即創(chuàng)”正式版上線；2024胡潤中國AI企業(yè)50強(qiáng)榜單；通義萬相推2.1視頻模型；微軟開源超強(qiáng)小模型Phi-4

薦Ilya向全世界宣布：預(yù)訓(xùn)練結(jié)束了！全球AI數(shù)據(jù)耗盡，超級智能才是未來

薦微軟Phi-4封神，14B小模型數(shù)學(xué)擊敗GPT-4o，合成數(shù)據(jù)占比40%，36頁技術(shù)報(bào)告出爐

規(guī)模世界第一！我國在運(yùn)和核準(zhǔn)在建核電機(jī)組裝機(jī)約1.13億千瓦

薦OpenAI科學(xué)家：現(xiàn)有模型+后訓(xùn)練足以產(chǎn)生黎曼猜想的新證明

薦AI日報(bào)：支付寶推AI創(chuàng)意生成平臺；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中間幀；OpenAI準(zhǔn)備o3推理模型

可靈AI推出可圖1.5模型畫面質(zhì)量、人像美感躍升新高度

熱文

西藏地震有人不當(dāng)利用AI生成災(zāi)害場景抖音：嚴(yán)格處罰！

Nvidia 的 AI 帝國：看看它投資的頂級初創(chuàng)企業(yè)

蘋果公司披露高管薪酬和股東提案細(xì)節(jié) 庫克2024年收入7461萬美元

小米YU7冬測！雷軍、盧偉冰現(xiàn)身黑河：一起放加特林煙花

蘋果董事會力挺DEI計(jì)劃，駁斥廢除提議

馬斯克宣布：2025年Neuralink為20至30例患者植入腦機(jī)設(shè)備

英偉達(dá)擴(kuò)張車企朋友圈劍指2026智能駕駛50億美元營收

地震被壓廢墟下戴帽小孩系A(chǔ)I生成：請注意甄別

12306三天內(nèi)第二次崩了官方致歉：故障已基本緩解

馬云“臘八之約”透露：接下來10年變化可能超出想象

賈躍亭全新品牌FX官宣！首款MPV車型諜照正式發(fā)布

西藏地震有人不當(dāng)利用AI生成災(zāi)害場景抖音：嚴(yán)格處罰！

鴻蒙原生版微信正式上架華為應(yīng)用市場！支持群聊、支付

馬斯克稱今年將制造數(shù)千臺人形機(jī)器人以后或每年翻10倍

天貓與銀聯(lián)合作接入云閃付，簡化政府補(bǔ)貼領(lǐng)取流程

淘寶官宣“送禮物”功能上線：送禮教程公布

段永平公開表示購買騰訊與茅臺，回應(yīng)市場調(diào)整與回購戰(zhàn)略

站長商機(jī)