萬卡訓練史上參數(shù)模型！百度文心大模型4.0最快下周見

2023-10-09 15:25 · 稿源：快科技

快科技10月9日消息，日前有媒體報道稱，百度正加緊訓練文心大模型4.0，已經(jīng)接近可發(fā)布狀態(tài)，這將是文心大模型3.5版本后，又一個重磅版本。

消息稱，文心大模型4.0進展比預期快很多，將是基礎模型的大升級，理解、生成、邏輯、記憶核心能力都將提升，特別是在邏輯推理、代碼和數(shù)學等方面提升最明顯。

根據(jù)我們獲得的最新消息，上述消息基本屬實。目前了解到，文心大模型4.0實際上已經(jīng)在小流量測試。

根據(jù)我們拿到的消息，文心大模型4.0的參數(shù)規(guī)模要大于目前所有公開發(fā)布參數(shù)的LLM，也是國內首次使用萬卡集群訓練的大模型。這意味著文心大模型4.0的參數(shù)規(guī)模預計能突破萬億級別。

萬卡集群什么概念？國內之前只有華為、阿里透露已建成萬卡AI集群，但我們都沒看到基于它推出的具體模型。萬卡集群就不容易建了，如果用起來發(fā)揮最大化作用則更難了。

據(jù)分析，正是因為飛槳的深度聯(lián)合，才能高效地基于萬卡集群訓練起如此規(guī)模的模型。

不僅訓練成本在增加，文心4.0的推理成本比3.5增加很多，我們還沒拿到具體每千token的推理成本，但據(jù)傳大概是此前的8-10倍，這還是在高利用率（MFU）的情況下。如果利用率更低，估計成本還會繼續(xù)增加。

不得不說，大模型真的很費錢?？梢?，打造領先的底層基礎打模型，就是一場巨頭的游戲。

根據(jù)IDC發(fā)布的首個大模型評估報告《AI大模型技術能力評估報告，2023》，百度文心大模型3.5拿下12項指標的7個滿分，綜合評分第一，算法模型第一，行業(yè)覆蓋第一，綜合能力在眾多國產(chǎn)大模型中遙遙領先。

經(jīng)過全面升級后，文心大模型4.0的訓練速度、推理速度等將進一步提升，能否與GPT-4一戰(zhàn)甚至超越后者的表現(xiàn)，我們拭目以待。

（舉報）

相關推薦

關鍵詞：

百度文心大模型4.0正加緊訓練已接近可發(fā)布狀態(tài)

百度正在加速訓練文心大模型4.0，并預計在10月17日的百度世界大會上發(fā)布。這個新版本的大模型是繼文心大模型3.5之后的又一重要升級，將著重在基礎模型上實現(xiàn)大提升。自全面開放以來，文心一言的App下載量猛增，甚至一度登上蘋果AppStore免費應用榜的榜首，成為首個登頂應用商店榜首的中文AI原生應用。
消息稱百度文心大模型4.0正加緊訓練四大核心能力將提升

鳳凰網(wǎng)科技訊10月8日，據(jù)《科創(chuàng)板日報》援引消息人士消息，百度正在加緊訓練文心大模型4.0，或將在10月17日百度世界大會上發(fā)布。文心大模型4.0的進展比預期快很多，將是基礎模型的大升級，理解、生成、邏輯、記憶四大核心能力都將提升，尤其在邏輯推理、代碼和數(shù)學等方面提升最明顯。在百度披露的一張測試圖中，prompt為:“如果一個公司想要在他們的產(chǎn)品線中添加新的手表，以應對市場中的新趨勢和客戶的新需求，那么他們如何利用已有的數(shù)據(jù)和工具進行有效的商業(yè)分析，以確定這個新產(chǎn)品的商業(yè)潛力呢?”文心一言從市場調研、數(shù)據(jù)分析、目標客戶分析、預測分析等方面給出了操作建議。
百度放大招！消息稱文心大模型4.0即將發(fā)布：理解、邏輯大提升

目前，國內有多家科技大廠陸續(xù)發(fā)布自家大模型，被業(yè)內看作為AI大模型百模”大戰(zhàn)已經(jīng)打響。百度正加緊訓練文心大模型4.0，預計將在10月17日的百度世界大會上發(fā)布，這將是文心大模型3.5版本后，又一個重磅版本。文心一言全面開放后App下載量猛增，一度登上蘋果AppStore免費應用榜排行第一，成為首個登頂應用商店榜首的中文AI原生應用。
國內首個“產(chǎn)業(yè)級”醫(yī)療大模型！百度“靈醫(yī)”發(fā)布：文心大模型加持

目前，國內已有多家科技大廠扎堆發(fā)布自家大模型，被業(yè)內看作為AI大模型百?！贝髴?zhàn)已經(jīng)打響。在各家大戰(zhàn)的同時，百度日前正式發(fā)布了國內首個產(chǎn)業(yè)級”醫(yī)療大模型靈醫(yī)大模型，這也是國內首個實現(xiàn)商業(yè)化落地的醫(yī)療大模型。技術底座方面，根據(jù)IDC發(fā)布《AI大模型技術能力評估報告，2023》，靈醫(yī)大模型的技術底座百度文心大模型3.5拿下12項指標的7個滿分，綜合評分第一，算法模型第一，行業(yè)覆蓋第一。
百度發(fā)布醫(yī)療大模型“靈醫(yī)大模型”

9月19日，百度正式發(fā)布國內首個“產(chǎn)業(yè)級”醫(yī)療大模型——靈醫(yī)大模型。百度正式宣布面向大健康上下游產(chǎn)業(yè)開放靈醫(yī)大模型測評、試用，推動醫(yī)療行業(yè)的數(shù)字化和智能化進程。在輔助診療方面，靈醫(yī)大模型可實現(xiàn)通過多輪對話了解病人病情，實時輔助醫(yī)生確診疾病，推薦治療方案，提升就診全流程的效率和體驗，并成為患者的24小時“健康管家”，提供智能客服服務。
百度文心一言軟件著作權獲批

中國版權保護中心顯示，9月13日，北京百度網(wǎng)訊科技有限公司“文心一言軟件”著作權獲登記批準，當前版本號為V1.0.0。8月31日，百度「文心一言APP」宣布向全社會全面開放。廣大用戶可以在應用商店下載“文心一言APP”或登陸“文心一言官網(wǎng)”體驗。
百度CIO李瑩接棒小度大模型或助力小度增長

百度宣布百度集團副總裁、CIO李瑩博士出任小度科技CEO。李瑩于2004年加入百度，在多個核心業(yè)務IntegerField上獲得豐富經(jīng)驗，任百度CIO期間，她運用AI優(yōu)化內部流程。小度可望借助百度在AI方面的技術優(yōu)勢，在大模型加持下獲得進一步發(fā)展。
華為發(fā)布全新昇騰AI計算集群支持超萬億參數(shù)大模型訓練

華為在全聯(lián)接大會2023期間發(fā)布了全新架構的昇騰AI計算集群Atlas900SuperCluster，該集群可支持超萬億參數(shù)的大模型訓練。該集群采用了全新的華為星河AI智算交換機CloudEngineXH16800，并使用了創(chuàng)新的超節(jié)點架構，大大提升了大模型訓練能力。該集群還通過提升系統(tǒng)可靠性，將大模型訓練的穩(wěn)定性從天級提升到月級。
薦AI視野：文心大模型4.0將發(fā)布;Stability AI發(fā)布移動端語言模型Stable LM3B;OpenAI舉辦ChatGPT應用開發(fā)大賽；視覺中國、華為云攜手打造視覺大模型

百度正在加速訓練文心大模型4.0，并計劃在10月17日的百度世界大會上發(fā)布。這一新版本將是文心大模型3.5的重要升級，重點提升基礎模型能力，尤其在邏輯推理、代碼和數(shù)學等方面取得顯著進展。GoogleDeepMind提出DRaFT算法以高效優(yōu)化擴散模型GoogleDeepMind最新提出的DRaFT算法用于高效優(yōu)化擴散模型，提高了文本到圖像生成等實際應用的效率和性能，成為機器學習領域的有價值工具?

?文心大模型
萬興科技發(fā)布百億級參數(shù)多媒體大模型 “天幕”

在近日的2023世界計算大會上，萬興科技宣布將發(fā)布國內首個以視頻創(chuàng)意應用為核心的百億級參數(shù)多媒體大模型“天幕”?！疤炷弧倍嗝襟w大模型將以視頻、繪圖、文檔等數(shù)字創(chuàng)意軟件業(yè)務場景為依托，為創(chuàng)作者提供更專業(yè)化的AI創(chuàng)新解決方案。這些產(chǎn)品通過集成大模型能力，實現(xiàn)了數(shù)字創(chuàng)意軟件的升級和智能化。

熱文

3 天
7天

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

萬卡訓練史上參數(shù)模型！百度文心大模型4.0最快下周見

百度文心大模型4.0正加緊訓練已接近可發(fā)布狀態(tài)

消息稱百度文心大模型4.0正加緊訓練四大核心能力將提升

百度放大招！消息稱文心大模型4.0即將發(fā)布：理解、邏輯大提升

國內首個“產(chǎn)業(yè)級”醫(yī)療大模型！百度“靈醫(yī)”發(fā)布：文心大模型加持

百度發(fā)布醫(yī)療大模型“靈醫(yī)大模型”

百度文心一言軟件著作權獲批

百度CIO李瑩接棒小度大模型或助力小度增長

華為發(fā)布全新昇騰AI計算集群支持超萬億參數(shù)大模型訓練

薦AI視野：文心大模型4.0將發(fā)布;Stability AI發(fā)布移動端語言模型Stable LM3B;OpenAI舉辦ChatGPT應用開發(fā)大賽；視覺中國、華為云攜手打造視覺大模型

萬興科技發(fā)布百億級參數(shù)多媒體大模型 “天幕”

熱文

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

京東發(fā)布年終獎通知部分員工年前可收到年終獎

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車續(xù)航之王

央視曝光未成年人繞開防沉迷只需4元：通過租用游戲賬號規(guī)避

消息稱OpenAI新模型GPT-5研發(fā)未達到預期：成本高昂效果欠佳

李斌回應螢火蟲外觀設計：看過實車的人都喜歡這個設計

沒網(wǎng)也能聯(lián)絡！小米15系列星辰無網(wǎng)通12月底升級6km級通話范圍

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

FF再獲3000萬美元新一輪融資加速第二品牌FX戰(zhàn)略推進

美團：冬至期間將針對餃子等應時食品訂單提供“超時保護”

英偉達AI芯片最大買家揭曉！微軟力壓同行霸榜

微信朋友圈崩了上熱搜騰訊客服：請嘗試這幾種方法

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

小紅書封號上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內容

京東發(fā)布年終獎通知部分員工年前可收到年終獎

極越員工萬字怒懟ceo：公關總監(jiān)徐繼業(yè)怒罵員工蒼蠅

馬斯克將推出X Mail電子郵箱服務

未成年人成部分博主流量密碼抖音治理涉“網(wǎng)紅兒童”違規(guī)內容

極越員工善后方案已出爐：員工獲“N+1”賠償由百度吉利出資

螞蟻集團否認借殼上市：目前沒有上市計劃

站長商機

萬卡訓練史上參數(shù)模型！百度文心大模型4.0最快下周見

熱文

站長商機

萬卡訓練史上參數(shù)模型！百度文心大模型4.0最快下周見