幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關鍵詞  > 中國聯(lián)通最新資訊  > 正文

昇騰AI平臺訓練推理!中國聯(lián)通元景文生圖大模型開源:真正懂中文

2024-12-26 20:08 · 稿源: 快科技

中國聯(lián)通宣布,聯(lián)通數(shù)據(jù)智能公司打造、首個完全在國產昇騰AI軟硬件平臺上實現(xiàn)訓練和推理的中文原生文生圖模型聯(lián)通元景文生圖模型”,正式開源。

該模型實現(xiàn)了多項自主創(chuàng)新突破:

首先是在架構上,通過在SDXL架構中融合復合語言編碼模塊,實現(xiàn)了對中文長文本、多屬性對應和中文特色詞匯的精確語義理解,對應圖像的生成效果得到了極大提升。

其次是在昇騰AI大規(guī)模算力集群上,實現(xiàn)了中文原生文生圖模型的訓練和推理,并將模型和代碼對業(yè)界開源,以推動文生圖領域的國產化進程。

據(jù)悉,原始SDXL的語言編碼器僅使用英文CLIP模型,智能支持英文文本輸入,輸入長度也不能超過77個token。

對此,聯(lián)通元景文生圖模型一方面將英文CLIP模型替換成中文CLIP,并引入復合語言編碼架構,使用基于encoder-decoder架構的語言模型,突破文本長度限制。

昇騰AI平臺訓練推理!中國聯(lián)通元景文生圖大模型開源:真正懂中文

通過引入復合語言編碼模塊,元景文生圖模型實現(xiàn)了原生中文語義理解,避免了利用翻譯插件等作為中介調用英文文生圖模型造成的中文信息損失。

同時,通過引入海量中文圖文對數(shù)據(jù)進行預訓練,模型對中文專屬名詞,如鼠標-老鼠、仙鶴-吊車等英文模型易混淆的對象,以及中文菜譜等英文模型無法理解的名詞,都能夠準確理解并生成對應的高質量圖片。

昇騰AI平臺訓練推理!中國聯(lián)通元景文生圖大模型開源:真正懂中文(在英文中均翻譯成crane,易混淆)

昇騰AI平臺訓練推理!中國聯(lián)通元景文生圖大模型開源:真正懂中文(中文特色詞匯)

中國聯(lián)通在國產昇騰AI基礎軟硬件平臺上實現(xiàn)了元景文生圖模型從微調訓練到推理的一體化適配。

在微調訓練方面,用戶可使用自定義數(shù)據(jù)集,實現(xiàn)從其它平臺至昇騰的平滑切換;

在模型推理方面,接口與Diffusers對齊,簡單易用,支持單卡和多卡,單卡推理支持UNet Cache加速。

該模型已在聯(lián)通的多個內外部項目中服務于文創(chuàng)、服裝、工業(yè)設計等諸多領域,支撐了中華器靈、服裝大模型等數(shù)十個案例。

昇騰AI平臺訓練推理!中國聯(lián)通元景文生圖大模型開源:真正懂中文聯(lián)通元景文生圖模型賦能服裝設計

昇騰AI平臺訓練推理!中國聯(lián)通元景文生圖大模型開源:真正懂中文聯(lián)通元景文生圖模型賦能文物活化

目前,元景文生圖模型已在GitHub、Hugging Face、魔搭、始智等社區(qū)全面開源,地址如下:

GitHub:

https://github.com/UnicomAI/UniT2IXL.git

HuggingFace:

https://huggingface.co/UnicomAI/UniT2IXL

魔搭:

https://www.modelscope.cn/UnicomAI/UniT2IXL.git

始智:

https://wisemodel.cn/models/UnicomAI/UniT2IXL

昇騰AI平臺訓練推理!中國聯(lián)通元景文生圖大模型開源:真正懂中文聯(lián)通元景文生圖模型在全球數(shù)字經濟大會上獲獎

舉報

  • 相關推薦
  • 業(yè)界首次!中國聯(lián)通AI大模型存算分離技術新突破

    快科技12月8日消息,中國聯(lián)通宣布,中國聯(lián)通研究院日前與浙江聯(lián)通、聯(lián)通服裝制造軍團協(xié)同攻關,針對AI敏感數(shù)據(jù)的本地存儲異地訓練需求提出了創(chuàng)新的業(yè)務模式,并成功在杭州與金華兩地間實施了業(yè)界首次30TB樣本數(shù)據(jù)的跨200公里存算分離拉遠訓練。經過實際測算,訓練效率高達97%以上。中國聯(lián)通表示,上述業(yè)務模式為業(yè)界首例,實現(xiàn)了AI大模型存算分離技術的突破。通過測試,充分驗證了存算分離技術的安全性、可行性和高效性,為未來AI技術的發(fā)展提供了新的思路和方向。據(jù)介紹,存算分離技術是指將存儲數(shù)據(jù)的倉庫和對數(shù)據(jù)進行計算的加工廠獨立?

  • 中國聯(lián)通組織“魅力亞冬,與智慧同行” 主題采訪活動

    12月19日-20日,哈爾濱銀裝素裹,美麗的冰城哈爾濱,正沉浸在籌備迎接2025年第九屆亞冬會的熱烈氛圍中,作為本屆亞冬會的“官方通信及云服務合作伙伴”,中國聯(lián)通組織了“魅力亞冬,與智慧同行”,邀請媒體見證中國聯(lián)通為亞冬會部署的黑科技,共同成為新質生產力賦能國際賽事的見證者、參與者和推動者。哈爾濱市人大常委會副主任、亞冬會組委會副秘書長、執(zhí)委會副主任王鐵立,中國聯(lián)通亞冬辦主任,黑龍江聯(lián)通黨委書記、總經理王傳寶,中國聯(lián)通黨組辦公室副主任張海濤等出席活動。在亞布力雪場,大家看到首個極寒場景下基于5G-A通感一體技術的低空安防、低空經濟一體應用,感受到了5G-A賦能智慧亞冬的魅力,聯(lián)通維護小哥接到了無人機“投喂”的奶茶后,直呼“太暖心了!”在哈爾濱第九屆亞冬會中國聯(lián)通亞布力運行分指揮中心,可以看到比賽雪道的實時監(jiān)控畫面,確保亞冬會比賽期間支撐有效、保障到位。

  • iPhone詐騙頻發(fā)!中國聯(lián)通成功開發(fā)FaceTime詐騙識別:與蘋果聯(lián)動處置

    今年以來,iPhone手機經常出現(xiàn)FaceTime詐騙的案件。因為FaceTime顯示的昵稱是用戶Apple賬戶設置的名字,可以隨意編輯,很多詐騙分子會把昵稱改成某某公安局,或者某某反詐中心。再次提醒大家,一般官方不會通過FaceTime來聯(lián)系個人,如果不經常使用還是建議關閉該功能,要使用的話注意不要接聽陌生FaceTime來電。

  • AI日報:阿里通義開源多模態(tài)推理模型QVQ-72B;OpenAI考慮自研人形機器人;QQ音樂上線首個AI大模型音效

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、阿里發(fā)布多模態(tài)推理模型QVQ-72B!視覺、語言能力雙提升阿里巴巴最近推出的QVQ-72B多模態(tài)推理模型在語言和視覺能力上實現(xiàn)了顯著提升,能夠處理復雜的推理和分析任務,尤其在多步推理和數(shù)學推理方面表現(xiàn)突出。盡管o1-preview在某些方面表現(xiàn)優(yōu)秀,但在實際應用中仍面臨高成本和不切實際的測試建議等問題。

  • 迄今最大視頻開源模型!騰訊混元文生視頻上線:一句話生成視頻

    今日,騰訊混元大模型宣布文生視頻功能上線,一句話就能生成視頻。此次開源的視頻生成大模型,參數(shù)量130億,是當前最大的視頻開源模型。通過先進的圖像視頻混合VAE,讓模型在細節(jié)表現(xiàn)有明顯提升,特別是小人臉、高速鏡頭等場景。

  • AI日報:階躍星辰內測視頻大模型Step-Video;即夢AI片2.1模型支持生成文字;騰訊發(fā)布混元視頻生成大模型

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開啟內測可在躍問視頻申請階躍星辰的Step-Video模型正式開啟內測,用戶可以通過躍問視頻官網(wǎng)申請資格。用戶可在最新版本的WPSOffice中輕松找到?

  • AI大模型時代,人才的需求已經變了

    什么是AI發(fā)展的第一驅動力?最近,全球科技大廠都在用行動告訴我們:人才。谷歌NotebookLM的核心團隊共同宣布離職創(chuàng)業(yè),他們新公司的網(wǎng)站已經進入了「建設中」的狀態(tài)。但要真正解決AI人才短缺的問題需要更多企業(yè)、高校和社會各界的共同努力。

  • AI日報:支付寶推AI創(chuàng)意生成平臺;谷歌王炸推理模型Gemini2.0 Flash Thinking;Runway支持插入中間幀;OpenAI準備o3推理模型

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、谷歌發(fā)布王炸推理模型Gemini2.0FlashThinking,挑戰(zhàn)OpenAIo1谷歌近期推出的Gemini2.0FlashThinking模型在多模態(tài)推理領域展現(xiàn)出強大的能力,支持32,000個輸入標記和8,000個輸出標記,極大提升了處理復雜問題的效率。與前代產品相比,F(xiàn)alcon3的訓練規(guī)模翻倍,展現(xiàn)出強勁的競爭力,尤其是在與其他主流開源模型的基準測試中表現(xiàn)優(yōu)異。

  • AI日報:百川智能金融大模型發(fā)布;ChatGPT新增跨對話記憶功能;DeepSeek大模型一開發(fā)者將加盟小米;OpenAI最強推理模型o3

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、OpenAI發(fā)布o3:AI推理能力的重大突破,得分高達87.5%OpenAI最近推出了其最新的o-Model推理系列模型o3,標志著在數(shù)學和科學推理領域的重大進展。閃極還推出了一個吸引人的促銷活動,用戶在300天內打卡200天可獲得全額退款。

  • 豆包說要「普惠」,于是大模型處理片按「厘」計價了

    OpenAI宣告連續(xù)12輪轟炸,讓2024年底的大模型領域熱鬧起來了。但堅持每個凌晨看直播的話會發(fā)現(xiàn),越到后面的發(fā)布越平淡,內心的波動也越少了。豆包大模型還有哪些驚喜?值得每一個人期待。

熱文

  • 3 天
  • 7天