幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關(guān)鍵詞  > 正文

阿里云全面升級GPU云服務(wù):AI大模型推理性能可提升

2024-07-19 17:28 · 稿源: 快科技

阿里云正式推出其全面升級的 GPU 云服務(wù),針對 GPU 計算最常用的容器技術(shù),推出了 ACK 云原生 AI 套件。

為了解決單 GPU 難以滿足推理應(yīng)用需求的問題,阿里云通過優(yōu)化底層 AI 通信加速庫 DeepNCCL,提升了 GPU 云服務(wù)的推理場景性能。在同等硬件環(huán)境下,Token 輸出吞吐提升至少 14%,首 Token 時延降低 15%。

深入優(yōu)化后,推理加速性能顯著提升,Token 處理能力提高了 100%,使用 Kubernetes 容器集群技術(shù)調(diào)用 GPU 算力已成為運行 AI 大模型任務(wù)的普遍選擇。

ACK 容器服務(wù)提供自動化編排、高效 GPU 管理和調(diào)度,簡化了模型部署和擴展。ACK 云原生 AI 套件進一步提升了 AI 應(yīng)用運維效率,在關(guān)鍵領(lǐng)域增強了 Kubernetes 的能力,例如 GPU 調(diào)度、細粒度共享、AI 任務(wù)調(diào)度、訓(xùn)練數(shù)據(jù)加載和大模型推理服務(wù)啟動。

國產(chǎn) AI 繪畫工具海藝 AI 已采用 ACK 調(diào)用阿里云 GPU 云服務(wù),實現(xiàn)了模型切換完全無感,推理耗時降低至 3.95 秒,整體性能提升超過 50%。

在 Forrester 全球 AI 基礎(chǔ)設(shè)施解決方案研究報告中,阿里云綜合產(chǎn)品能力位居全球第二,已成為中國 AI 大模型的公共底座。

舉報

  • 相關(guān)推薦
  • AI大模型時代,人才的需求已經(jīng)變了

    什么是AI發(fā)展的第一驅(qū)動力?最近,全球科技大廠都在用行動告訴我們:人才。谷歌NotebookLM的核心團隊共同宣布離職創(chuàng)業(yè),他們新公司的網(wǎng)站已經(jīng)進入了「建設(shè)中」的狀態(tài)。但要真正解決AI人才短缺的問題需要更多企業(yè)、高校和社會各界的共同努力。

  • 思必馳智能語音攜手茅臺,打造“國酒級”AI大模型智能會議方案

    茅臺集團是中國乃至全球知名的白酒企業(yè),自 1951 年成立以來,始終堅守傳統(tǒng)工藝與創(chuàng)新精神的融合之道。 1996 年,茅臺酒的釀造工藝被正式確認為國家機密,受到嚴格保護。 2001 年,這一傳統(tǒng)工藝榮獲國家級首批物質(zhì)文化遺產(chǎn)的殊榮。思必馳是國內(nèi)專業(yè)的大模型對話式人工智能平臺型企業(yè)。公司以“溝通萬物、打理萬事”為使命,基于公司自主研發(fā)的全鏈路智能對話系統(tǒng)定?

  • 業(yè)界首次!中國聯(lián)通AI大模型存算分離技術(shù)新突破

    快科技12月8日消息,中國聯(lián)通宣布,中國聯(lián)通研究院日前與浙江聯(lián)通、聯(lián)通服裝制造軍團協(xié)同攻關(guān),針對AI敏感數(shù)據(jù)的本地存儲異地訓(xùn)練需求提出了創(chuàng)新的業(yè)務(wù)模式,并成功在杭州與金華兩地間實施了業(yè)界首次30TB樣本數(shù)據(jù)的跨200公里存算分離拉遠訓(xùn)練。經(jīng)過實際測算,訓(xùn)練效率高達97%以上。中國聯(lián)通表示,上述業(yè)務(wù)模式為業(yè)界首例,實現(xiàn)了AI大模型存算分離技術(shù)的突破。通過測試,充分驗證了存算分離技術(shù)的安全性、可行性和高效性,為未來AI技術(shù)的發(fā)展提供了新的思路和方向。據(jù)介紹,存算分離技術(shù)是指將存儲數(shù)據(jù)的倉庫和對數(shù)據(jù)進行計算的加工廠獨立?

  • iPad將全面升級OLED:蘋果要淘汰LCD

    據(jù)市場研究公司Omdia爆料,蘋果iPad產(chǎn)品線將全面轉(zhuǎn)向OLED屏。Omdia稱,iPadmini最快會在2026年升級OLED屏,11英寸和13英寸iPadAir最快會在2027年升級OLED。此前iPadPro使用的是MiniLED,后來轉(zhuǎn)向了OLED,明年上半年要發(fā)布的iPhoneSE4也將會升級OLED,種種跡象表明,蘋果將要淘汰LCD屏幕。

  • AI日報:微信公眾號支持AI配圖;阿里云通義萬相新圖像編輯模型ACE;快手可靈AI推「AI試衣」功能

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、微信公眾號可以AI配圖了:還支持調(diào)整風格和比例微信公眾號最近推出了“AI配圖”新功能,旨在幫助內(nèi)容創(chuàng)作者更高效地選擇和插入圖片。公司在硅谷融資60億美元,并計劃繼續(xù)擴展資金,以支持發(fā)展。

  • 蘋果與華為手機AI大戰(zhàn)正式打響:史上最強Mate AI功能全面升級

    華為在近期的發(fā)布會上正式推出了備受期待的Mate70系列手機,該系列被余承東稱為“史上最強Mate”。華為Mate70系列的宣傳視頻強調(diào)了“Mate有真AI”的標簽,突出了鴻蒙AI的特性。在AI手機賽道上,哪家手機廠商能率先跑通,征服用戶有待市場檢驗。

  • 曝蘋果跟百度合作:iPhone國行版加入百度AI大模型

    蘋果與百度合作,為國行版iPhone接入百度AI大模型。蘋果向百度支付了AI大模型的使用費用,這次iPhone接入的是百度最先進的AI大模型Ernie4.0,以便讓iPhone擁有更好的AI體驗。在蘋果之前,百度AI已經(jīng)與三星、榮耀等智能硬件展開合作,三星最新旗艦手機GalaxyS24系列集成文心大模型多項能力,文心大模型也已接入了榮耀MagicOS百模生態(tài)計劃。

  • 可靈1.6模型發(fā)布:文本響應(yīng)度、運動合理性明顯提升

    快科技12月20日消息,近日快手可靈AI宣布基座模型再升級,視頻生成推出可靈1.6模型。據(jù)快手官方介紹,1.6模型在文本響應(yīng)度、畫面美感及運動合理性上均有明顯提升,畫面更穩(wěn)定更生動,對運動、時序類動作、運鏡等文字描述響應(yīng)更好。并且動態(tài)質(zhì)量進一步增強,運動更加合理,人物表情更自然;同時1.6模型畫面質(zhì)量也再次進化,色彩、光影、細節(jié)表現(xiàn)均明顯提升,提供支持標準和高品質(zhì)模式,圖生視頻效果提升同樣顯著。此前在今年9月份,可靈AI 1.5模型上線,當時就已經(jīng)支持高品質(zhì)模式,與可靈1.0模型只能生成最高720P的視頻不同,可靈1.5模型則

  • 每日互動營銷數(shù)盤全面升級 賦能品牌主域增長

    又到一年“烏鎮(zhèn)時間”,今年世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會邁入第 11 個年頭,峰會的老朋友每日互動(個推)再次亮相。作為專業(yè)的數(shù)據(jù)智能服務(wù)商,每日互動已在互聯(lián)網(wǎng)運營、品牌營銷、數(shù)智政務(wù)、數(shù)智交通等領(lǐng)域積累了多年的行業(yè)服務(wù)經(jīng)驗。今年每日互動面向品牌廣告主推出的明星產(chǎn)品營銷數(shù)盤還榮獲了互聯(lián)網(wǎng)大會“新光”產(chǎn)品獎,并在“新產(chǎn)品新技術(shù)發(fā)布”現(xiàn)場進行了重磅?

  • 李開復(fù)周志華縱論AI大模型,萬字梳理MEET'25大咖激辯,320萬觀眾同見證

    「ScalingLaw」和「打臉時刻」,絕對是2024年科技智能領(lǐng)域的年度關(guān)鍵詞。這是20余位工業(yè)界、學(xué)術(shù)界乃至投資界的頂流大咖,在量子位MEET2025智能未來大會上反復(fù)提及、探討的話題。后續(xù)還將有大會嘉賓更詳細版內(nèi)容分享,敬請關(guān)注!

熱文

  • 3 天
  • 7天