剛剛，OpenAI發(fā)布sCM提升50倍效率，擴散模型重大技術(shù)突破！

2024-10-24 08:42 · 稿源： ? AIGC開放社區(qū)公眾號

聲明：本文來自于微信公眾號AIGC開放社區(qū)，授權(quán)站長之家轉(zhuǎn)載發(fā)布。

今天凌晨，OpenAI發(fā)布了全新擴散模型方法sCM，僅需2步就能生成高質(zhì)量圖片、3D模型等實現(xiàn)50倍時鐘加速，尤其是在高分辨率任務(wù)上相當出色。

例如，通過sCM訓練了一個15億參數(shù)的模型，在單個A100GPU上無需任何推理優(yōu)化0.11秒內(nèi)就能生成內(nèi)容。

目前，擴散模型生成圖片最快的是Stability AI開源的SD快速版本，4步就能生成高質(zhì)量圖片。而Scm在保證質(zhì)量的前提下又將推理效率提升了1倍，同時簡化了連續(xù)時間一致性模型的理論公式，允許模型在更大數(shù)據(jù)集上進行穩(wěn)定的訓練和擴展。

sCM的核心原理是基于一致性模型思路，通過直接將噪聲轉(zhuǎn)換為無噪聲樣本來生成數(shù)據(jù)。在傳統(tǒng)擴散模型中，數(shù)據(jù)生成過程被視作一條從噪聲到數(shù)據(jù)的漸進路徑，每一步都通過去噪來逐漸恢復(fù)數(shù)據(jù)的清晰度。

一致性模型則恰恰相反，可找到一條更直接的路徑，在單步或少數(shù)幾步內(nèi)直接從噪聲狀態(tài)跳躍到數(shù)據(jù)狀態(tài)。

sCM采用了連續(xù)時間框架，使得模型在理論上可以在連續(xù)的時間軸上進行操作，從而避免了離散時間模型中的離散化誤差。在連續(xù)時間于一致性模型中，模型的參數(shù)化、擴散過程和訓練目標都被重新定義，以適應(yīng)連續(xù)時間的設(shè)置。

例如，模型的參數(shù)化不再依賴于離散的時間步，而是直接依賴于時間本身。這種連續(xù)時間的參數(shù)化方式使得模型能夠更精確地捕捉數(shù)據(jù)生成過程中的動態(tài)變化。

在網(wǎng)絡(luò)架構(gòu)方面，sCM引入了改進的時間條件、自適應(yīng)組歸一化、新的激活函數(shù)和自適應(yīng)權(quán)重，以提高模型的訓練穩(wěn)定性和生成質(zhì)量。改進的時間條件使得模型能夠更準確地感知時間t的變化，從而在生成過程中做出更合理的決策。

自適應(yīng)組歸一化則有助于模型在訓練過程中保持內(nèi)部特征的穩(wěn)定性，減少訓練過程中的噪聲干擾。新的激活函數(shù)被引入以增強模型的非線性表達能力，使得模型能夠更好地學習復(fù)雜的數(shù)據(jù)分布。

而自適應(yīng)權(quán)重的引入允許模型根據(jù)訓練數(shù)據(jù)的分布動態(tài)調(diào)整損失函數(shù)中的權(quán)重，從而減少了不同時間步長之間的損失方差。

為了評估sCM的性能，研究人員在CIFAR-10、ImageNet64×64和ImageNet512×512多個數(shù)據(jù)集上進行了綜合評測。結(jié)果顯示，sCM成為目前最高效的擴散生成方法。

例如，在ImageNet512×512數(shù)據(jù)集上，sCM的模型達到了1.88FID，同時使用的算力更少、更高效。

有網(wǎng)友表示，如果把這個方法用在視頻領(lǐng)域，那實時視頻可能很快會到來。Sora的推理負擔也會降低很多。

很高興又看到OpenAI分享技術(shù)論文了。

如果把這個技術(shù)用在Sora，它應(yīng)該快公測了吧?

這種簡化的模型非常適合需要快速結(jié)果而不影響質(zhì)量的應(yīng)用!

這個模型相當有前途啊。

2步就能生成內(nèi)容，這會再一次改變游戲規(guī)則啊。

把這個技術(shù)用在Sora，應(yīng)該就快來了吧?

目前，OpenAI已經(jīng)分享了該論文方法，是由兩位華人提出來的。

論文地址:https://arxiv.org/abs/2410.11081

（舉報）

相關(guān)推薦
大家在看

關(guān)鍵詞：

【騰訊云】11.11云上盛惠！云服務(wù)器首年1.8折起，買1年送3個月！

11.11云上盛惠！海量產(chǎn)品 · 輕松上云！云服務(wù)器首年1.8折起，買1年送3個月！超值優(yōu)惠，性能穩(wěn)定，讓您的云端之旅更加暢享。快來騰訊云選購吧！

Docker容器鏡像
去看看

Docker容器鏡像 60元/15天

爆款產(chǎn)品組合購
去看看

爆款產(chǎn)品組合購低至1元

騰訊云x NVIDIA加速計劃
去看看

騰訊云x NVIDIA加速計劃最高獲贈10萬元扶持基金

2核2G云服務(wù)器
去看看

2核2G云服務(wù)器 112元/1年

查看更多相關(guān)信息>>

騰訊云 12-20

廣告
AI日報：王炸！ElevenLabs推聲音設(shè)計功能；全能型圖像生成模型OmniGen問世；快50倍！OpenAI推全新模型sCM

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、ElevenLabs推出AI語音生成工具VoiceDesignElevenLabs最新推出的AI語音生成工具VoiceDesign開創(chuàng)了AI配音領(lǐng)域的新紀元，通過簡單的文本描述即可創(chuàng)建個性化語音，為用戶提供了直觀的文本提?

?ElevenLabs ?OmniGen
薦剛剛，OpenAI開源SimpleQA！輕松檢測、校準大模型能力

OpenAI開源了最新基準測試集SimpleQA，可以幫助開發(fā)者輕松檢測、校準大模型的真實性能力。很多大模型會出現(xiàn)一本正經(jīng)胡說八道的問題，例如，你提問NBA歷史上得分最多的是誰，它回答是邁克爾喬丹，實際上是勒布朗詹姆斯。通過測量模型的校準情況，發(fā)現(xiàn)模型雖然有一定的信心概念，但普遍存在高估自己信心的問題，模型的信心水平與實際回答的準確性之間存在差距。

?OpenAI ?SimpleQA ?大模型
薦OpenAI科學家震驚TED大會：讓AI模型思考20秒，提升10萬倍性能！

知名科技媒體Venturebeat消息，OpenAI高級研究科學家、德?lián)銩I之父NoamBrown，在美國舊金山舉辦的TEDAI大會上提出了一個震驚的理論——讓AI模型思考20秒所帶來的性能提升，相當于將模型擴大100，000倍并訓練100，000倍的時間。Brown也被這個結(jié)果嚇到了寫了多篇論文來驗證其真實性。Brown是OpenAI的高級研究科學家主要方向是超復(fù)雜推理、AIAgent以及自我對弈。

?OpenAI
薦比GPT-4強100倍！OpenAI將在12月發(fā)布新模型—獵戶座

知名科技媒體theverge消息，OpenAI將在ChatGPT發(fā)布兩周年之際12月左右，推出傳說中的大模型——Orion。Orion會使用o1模型生成的合成數(shù)據(jù)進行預(yù)訓練會使用一些其他類型的模型混合在一起使用，性能比GPT-4強100倍非常接近AGI。情緒價值在這一刻猶如洪水猛獸，變得一發(fā)不可收拾。

?OpenAI ?ChatGPT ?Orion大模型
因算力瓶頸難產(chǎn)！OpenAI：今年將不會發(fā)布GPT-5

據(jù)報道，OpenAI的首席執(zhí)行官SamAltman近期透露，公司的創(chuàng)新能力正面臨計算能力瓶頸的挑戰(zhàn)，這一限制導(dǎo)致新產(chǎn)品推出的節(jié)奏未能如預(yù)期般迅速。針對市場廣泛關(guān)注的下一代大型AI模型GPT-5，Altman已明確表態(tài)，OpenAI今年將不會推出該模型，但計劃在年內(nèi)稍后時間帶來一些極為出色的新版本”，以緩解外界的期待。即便是對GPT-5等未來大型AI模型持樂觀態(tài)度的觀察家，也對其核心推理能力能否實現(xiàn)質(zhì)的飛躍抱有謹慎態(tài)度，認為這仍是一個待解的未知數(shù)。

?OpenAI ?計算能力 ?GPT-5
薦剛剛，OpenAI開放ChatGPT Windows版本，可像Office那樣使用了

今天凌晨OpenAI宣布向所有ChatGPTPlus、Enterprise、Team和Edu用戶，提供Windows桌面應(yīng)用早期版本。用戶可在微軟的應(yīng)用商店中下載，安裝完成后通過AltSpace快捷鍵就能迅速啟用，提供文件分析、搜索對話、文本生成等功能，使用體驗相當絲滑和Office一樣。系統(tǒng)要求Windows1017763.0以上版本。

?ChatGPT
一句廢話就把OpenAI o1干崩了？大模型的推理能力還真挺脆弱的。

就在一個月前，OpenAI悄悄發(fā)布了o1，o1的推理能力是有目共睹的。我當時用了幾個很難很難的測試樣例去試驗了一下，很多模型見了都會犯怵，開始胡說八道。

?OpenAI ?OpenAIo1
ChatGPT幕后大佬、o1推理模型作者官宣離職！OpenAI大洗牌，后訓練團隊換將

【新智元導(dǎo)讀】離職已成為OpenAI常態(tài)。o1推理模型貢獻者之一剛剛宣布離職創(chuàng)業(yè)。在他GoogleScholar所有研究中，被引次數(shù)最高的一篇論文，是本科畢業(yè)發(fā)表的關(guān)于CNN的無監(jiān)督學習表示。

?OpenAI ?離職 ?o1模型
薦突發(fā)！OpenAI正式發(fā)布ChatGPT網(wǎng)絡(luò)搜索，徹底顛覆谷歌！

今天凌晨1點，OpenAI正式發(fā)布了ChatGPT網(wǎng)絡(luò)搜索功能，能實時、快速獲取附帶相關(guān)網(wǎng)頁來源鏈接的答案。用戶通過自然語言就能獲取各種網(wǎng)絡(luò)信息，例如，幫我看看今天華爾街日報的頭條新聞是什么;雅虎體育板塊中的NBA熱門新聞有哪些;CNBC的熱門財經(jīng)新聞報道了哪些內(nèi)容，ChatGPT都能快速幫你找到這些并附帶原始鏈接。ChatGPTPlus和Team用戶已經(jīng)可以使用，未來搜索功能會開放給免費?

?OpenAI ?ChatGPT
薦豪擲千億美元布局AI，微軟不止有OpenAI

微軟和OpenAI無疑是大洋彼岸最具看點的一對商業(yè)組合。人們在一年前暢想的AGI、SuperApp并未如期出現(xiàn)訓練所需的資金基本都來自于大廠輸血。但退一步講，這個答案或許并不重要。

?微軟 ?OpenAI

InkSight:手寫筆記數(shù)字化模型，無需專業(yè)設(shè)備

InkSight是一個由Google Research開發(fā)的模型，旨在將手寫筆記的照片轉(zhuǎn)換成數(shù)字格式，精確還原書寫筆跡，無需任何專業(yè)設(shè)備。這項技術(shù)的重要性在于它能夠?qū)鹘y(tǒng)的手寫筆記轉(zhuǎn)換為可編輯、可索引的數(shù)字形式，同時保留了手寫的風格和感覺。InkSight通過學習“閱讀”和“寫作”來構(gòu)建對書寫的理解，使其能夠在多種場景下，包括光線條件不佳、遮擋等情況下，都能良好地工作。這種技術(shù)的主要優(yōu)點是它的通用性和對用戶友好性，因為它不需要額外的硬件支持，降低了用戶的入門門檻和成本。

手寫識別數(shù)字化教育工具

NVIDIA Video Search and Summarization:構(gòu)建視頻搜索和摘要代理，提取視頻洞察

NVIDIA Video Search and Summarization 是一個利用深度學習和人工智能技術(shù)，能夠處理大量實時或存檔視頻，并從中提取信息以進行摘要和交互式問答的模型。該產(chǎn)品代表了視頻內(nèi)容分析和處理技術(shù)的最新進展，它通過生成式AI和視頻到文本的技術(shù)，為用戶提供了一種全新的視頻內(nèi)容管理和檢索方式。NVIDIA Video Search and Summarization 的主要優(yōu)點包括高效的視頻內(nèi)容分析、準確的摘要生成和交互式問答能力，這些功能對于需要處理大量視頻數(shù)據(jù)的企業(yè)來說至關(guān)重要。產(chǎn)品背景信息顯示，NVIDIA 致力于通過其先進的AI模型，推動視頻內(nèi)容的智能化處理和分析。

視頻分析人工智能深度學習

Analytics Model:即時、可操作的洞察力分析平臺

Analytics Model是一個AI驅(qū)動的分析平臺，它使每個人都能生成個性化的洞察力，從而實現(xiàn)明智的決策和可操作的結(jié)果。該平臺通過將復(fù)雜數(shù)據(jù)轉(zhuǎn)換為強大的洞察力，賦予企業(yè)和利益相關(guān)者迅速有效地做出戰(zhàn)略決策的能力。它代表了數(shù)據(jù)分析領(lǐng)域的先進技術(shù)，以其快速、直觀和強大的數(shù)據(jù)處理能力而著稱，對于需要從大數(shù)據(jù)中快速獲得有價值信息的企業(yè)和專業(yè)人士來說至關(guān)重要。

AI分析數(shù)據(jù)可視化商業(yè)智能

Geniai:AI助力的智能日程安排工具

Geniai是一個由Teqnological Asia開發(fā)的AI驅(qū)動的日程安排工具，旨在通過智能算法優(yōu)化用戶的時間管理，提高工作效率。它通過與多個參與者協(xié)調(diào)時間，并根據(jù)用戶的時間表提供定制的時間建議，使得安排會議變得更加簡單和高效。Geniai的核心優(yōu)勢在于其能夠減少安排會議時的時間和努力，同時提供個性化的時間建議，幫助用戶更好地管理時間。

AI 日程安排時間管理

Crisp 4:全新的站點搜索體驗，提升客戶服務(wù)效率。

Crisp 4是一個以異步通信為核心的客戶服務(wù)平臺，提供了全新的Inbox、設(shè)計、分析、AI功能和覆蓋搜索小部件。它通過集成AI技術(shù)，優(yōu)化了客戶互動的每一個環(huán)節(jié)，幫助團隊更清晰、高效地提供客戶服務(wù)。Crisp 4的背景是隨著在線業(yè)務(wù)的增長，企業(yè)需要更智能、更自動化的方式來處理客戶咨詢和支持請求，Crisp 4正是為了滿足這一需求而設(shè)計的。產(chǎn)品定位于中大型企業(yè)，提供14天免費試用，之后為付費服務(wù)。

客戶服務(wù) AI CRM

MyBaby.help:即時育兒助手，免費試用。

MyBaby.help是一個基于人工智能的在線育兒助手，提供即時、個性化的育兒指導(dǎo)和建議。它通過用戶共享的信息和寶寶的發(fā)展階段，為用戶提供針對性的答案，幫助解決日常育兒中的疑問和挑戰(zhàn)。產(chǎn)品的主要優(yōu)點包括即時響應(yīng)、個性化服務(wù)、科學依據(jù)的信息提供，以及多語言支持。MyBaby.help適合忙碌的現(xiàn)代父母，特別是首次育兒的家庭，幫助他們更自信、更科學地育兒。產(chǎn)品提供免費試用，并且有不同級別的付費計劃，滿足不同用戶的需求。

育兒嬰兒成長里程碑

Face Sticker AI:使用AI將您的面部照片變成面部貼紙

Face Sticker AI是一個AI驅(qū)動的面部貼紙工具，它通過添加文本提示將用戶的面部圖像轉(zhuǎn)換成奇妙的面部貼紙圖像。該產(chǎn)品利用先進的面部識別技術(shù)和自然語言處理技術(shù)，確保生成的貼紙與原始圖像高度相似，同時保持高清圖像質(zhì)量。Face Sticker AI不僅支持真人照片，還支持動畫角色照片，滿足用戶個性化表達和創(chuàng)造的需求。產(chǎn)品背景信息顯示，F(xiàn)ace Sticker AI旨在提供一個簡單易用的平臺，讓用戶能夠以前所未有的方式探索和創(chuàng)造面部貼紙，釋放創(chuàng)造力。產(chǎn)品定價分為Base、Standard和Pro三個等級，用戶可以根據(jù)自己的需求選擇合適的計劃購買積分。

AI 面部識別圖像處理

Magentic-One:多智能體系統(tǒng)，解決復(fù)雜任務(wù)

Magentic-One是由微軟研究團隊開發(fā)的一個通用多智能體系統(tǒng)，旨在解決開放性網(wǎng)絡(luò)和文件任務(wù)。該系統(tǒng)代表了人工智能領(lǐng)域向代理系統(tǒng)發(fā)展的重要一步，這些系統(tǒng)能夠完成人們在工作和生活中遇到的復(fù)雜多步驟任務(wù)。Magentic-One采用了一個名為Orchestrator的主智能體，負責規(guī)劃、跟蹤進度和在需要時重新規(guī)劃，同時指導(dǎo)其他專門智能體執(zhí)行任務(wù)，如操作網(wǎng)絡(luò)瀏覽器、導(dǎo)航本地文件或編寫和執(zhí)行Python代碼。Magentic-One在多個挑戰(zhàn)性的代理基準測試中表現(xiàn)出與最新技術(shù)相媲美的性能，且無需對其核心能力或架構(gòu)進行修改。

人工智能多智能體系統(tǒng) 自動化

Confi AI:Slack和Confluence的AI助手，簡化內(nèi)部文檔管理。

Confi AI是一個專為Slack和Confluence設(shè)計的AI助手，旨在簡化內(nèi)部文檔管理。它通過AI技術(shù)，讓用戶能夠直接從Slack獲取文檔信息，提高工作效率。產(chǎn)品背景信息顯示，Confi AI由Lamona Technology開發(fā)，支持無代碼快速設(shè)置，提供14天免費試用，并有年付優(yōu)惠。價格方面，提供每月49美元的高級計劃，包括無限文檔、Slack消息和API調(diào)用，每日增量更新等。

AI Slack Confluence

askrepo:利用LLM讀取源代碼并提供問題解答

askrepo是一個基于LLM（大型語言模型）的源代碼閱讀工具，它能夠讀取Git管理的文本文件內(nèi)容，發(fā)送至Google Gemini API，并根據(jù)指定的提示提供問題的答案。該產(chǎn)品代表了自然語言處理和機器學習技術(shù)在代碼分析領(lǐng)域的應(yīng)用，其主要優(yōu)點包括能夠理解和解釋代碼的功能，幫助開發(fā)者快速理解新項目或復(fù)雜代碼庫。產(chǎn)品背景信息顯示，askrepo適用于需要深入理解代碼的場景，尤其是在代碼審查和維護階段。該產(chǎn)品是開源的，可以免費使用。

代碼分析 LLM Google Gemini API

Alta.ai:您的強大寫作伙伴

Alta是一個強大的寫作輔助工具，提供友好易用的用戶界面和基于人工智能的寫作支持。它通過AltaChat聊天機器人幫助用戶克服寫作障礙，將想法轉(zhuǎn)化為內(nèi)容。AltaCopy提供跨平臺內(nèi)容創(chuàng)作的模板和提示，而品牌聲音功能則確保內(nèi)容與用戶的品牌調(diào)性一致。AltaDetect則用于檢查內(nèi)容的原創(chuàng)性和人性化程度。Alta以其易用性、實惠性、高級支持、防抄襲、定制化、模型庫和100%加密等特點，成為專業(yè)人士和領(lǐng)先公司信賴的寫作伙伴。

寫作輔助內(nèi)容創(chuàng)作人工智能

MindOne.app:構(gòu)建AI原生應(yīng)用的平臺

MindOne是一個AI原生應(yīng)用構(gòu)建平臺，它允許用戶通過簡單的提示和手動編輯來創(chuàng)建交互式應(yīng)用。該平臺提供了一個組件庫和內(nèi)置的設(shè)計系統(tǒng)，支持實時預(yù)覽和預(yù)構(gòu)建模塊，以加速產(chǎn)品開發(fā)。MindOne支持與GitHub、Linear、Jira、Salesforce等多種工具集成，實現(xiàn)API、AI和UI的無縫對接。此外，MindOne還提供了白標服務(wù)和基于令牌的設(shè)計系統(tǒng)，以實現(xiàn)完全定制化。

AI 應(yīng)用構(gòu)建集成工具

GameGen-X:生成和交互控制開放世界游戲視頻的擴散變換模型

GameGen-X是專為生成和交互控制開放世界游戲視頻而設(shè)計的擴散變換模型。該模型通過模擬游戲引擎的多種特性，如創(chuàng)新角色、動態(tài)環(huán)境、復(fù)雜動作和多樣事件，實現(xiàn)了高質(zhì)量、開放領(lǐng)域的視頻生成。此外，它還提供了交互控制能力，能夠根據(jù)當前視頻片段預(yù)測和改變未來內(nèi)容，從而實現(xiàn)游戲玩法模擬。為了實現(xiàn)這一愿景，我們首先從零開始收集并構(gòu)建了一個開放世界視頻游戲數(shù)據(jù)集（OGameData），這是第一個也是最大的開放世界游戲視頻生成和控制數(shù)據(jù)集，包含超過150款游戲的100多萬個多樣化游戲視頻片段，這些片段都配有GPT-4o的信息性字幕。GameGen-X經(jīng)歷了兩階段的訓練過程，包括基礎(chǔ)模型預(yù)訓練和指令調(diào)優(yōu)。首先，模型通過文本到視頻生成和視頻續(xù)集進行預(yù)訓練，賦予了其長序列、高質(zhì)量開放領(lǐng)域游戲視頻生成的能力。進一步，為了實現(xiàn)交互控制能力，我們設(shè)計了InstructNet來整合與游戲相關(guān)的多模態(tài)控制信號專家。這使得模型能夠根據(jù)用戶輸入調(diào)整潛在表示，首次在視頻生成中統(tǒng)一角色交互和場景內(nèi)容控制。在指令調(diào)優(yōu)期間，只有InstructNet被更新，而預(yù)訓練的基礎(chǔ)模型被凍結(jié)，使得交互控制能力的整合不會損失生成視頻內(nèi)容的多樣性和質(zhì)量。GameGen-X代表了使用生成模型進行開放世界視頻游戲設(shè)計的一次重大飛躍。它展示了生成模型作為傳統(tǒng)渲染技術(shù)的輔助工具的潛力，有效地將創(chuàng)造性生成與交互能力結(jié)合起來。

AI 游戲生成交互控制

MobileLLM-1B:Meta 開發(fā)的子十億參數(shù)語言模型，適用于設(shè)備端應(yīng)用。

Meta 開發(fā)的自回歸語言模型，采用優(yōu)化架構(gòu)，適合資源受限設(shè)備。優(yōu)點多，如集成多種技術(shù)，支持零樣本推理等，價格免費，面向自然語言處理研究人員和開發(fā)者。

語言模型 Transformer 設(shè)備端應(yīng)用

LLaMA-O1:大型推理模型框架，支持PyTorch和HuggingFace。

LLaMA-O1是一個大型推理模型框架，它結(jié)合了蒙特卡洛樹搜索（MCTS）、自我強化學習、PPO等技術(shù)，并借鑒了AlphaGo Zero的雙重策略范式以及大型語言模型。該模型主要針對奧林匹克級別的數(shù)學推理問題，提供了一個開放的平臺用于訓練、推理和評估。產(chǎn)品背景信息顯示，這是一個個人實驗項目，與任何第三方組織或機構(gòu)無關(guān)。

大型推理模型蒙特卡洛樹搜索自我強化學習

MobileLLM-600M:高效優(yōu)化的600M參數(shù)語言模型，專為設(shè)備端應(yīng)用設(shè)計。

MobileLLM-600M是由Meta開發(fā)的自回歸語言模型，采用了優(yōu)化的Transformer架構(gòu)，專為資源受限的設(shè)備端應(yīng)用而設(shè)計。該模型集成了SwiGLU激活函數(shù)、深度薄架構(gòu)、嵌入共享和分組查詢注意力等關(guān)鍵技術(shù)。MobileLLM-600M在零樣本常識推理任務(wù)上取得了顯著的性能提升，與之前的125M/350M SoTA模型相比，分別提高了2.7%/4.3%的準確率。該模型的設(shè)計理念可擴展至更大模型，如MobileLLM-1B/1.5B，均取得了SoTA結(jié)果。

語言模型 Transformer 設(shè)備端應(yīng)用

今日大家都在搜的詞：

熱文

3 天
7天

站長商機

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

剛剛，OpenAI發(fā)布sCM提升50倍效率，擴散模型重大技術(shù)突破！

今日大家都在搜的詞：

熱文

站長商機

剛剛，OpenAI發(fā)布sCM提升50倍效率，擴散模型重大技術(shù)突破！