幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 傳媒 > 關(guān)鍵詞  > 工程師文化最新資訊  > 正文

獲取AI時(shí)代的工程師文化和技術(shù)領(lǐng)導(dǎo)力——CCF CED 2024中國計(jì)算機(jī)學(xué)會工程師文化日9月27至28日開幕!

2024-09-26 16:58 · 稿源: 站長之家用戶

隨著科技的飛速發(fā)展,工程師們在推動(dòng)社會進(jìn)步和創(chuàng)新中扮演著越來越重要的角色。由中國計(jì)算機(jī)學(xué)會(CCF)、杭州市余杭區(qū)人民政府主辦,CCF TF、麥思博(msup)有限公司、阿里巴巴數(shù)字生態(tài)創(chuàng)新園承辦,CCF杭州分部、CCF寧波分部、杭州諧云科技有限公司協(xié)辦的CCF CED2024 中國計(jì)算機(jī)學(xué)會工程師文化日將于 9 月 27 日至 28 日在杭州阿里巴巴數(shù)字生態(tài)創(chuàng)新園召開。

本次會議以“工程師文化驅(qū)動(dòng)組織創(chuàng)新”為核心主題,攜手螞蟻集團(tuán)副總裁陽振坤、快手集團(tuán)技術(shù)副總裁李偉博等 40 位行業(yè)佼佼者探索技術(shù)創(chuàng)新背后的工程實(shí)踐。圍繞技術(shù)創(chuàng)新、AI賦能、技術(shù)領(lǐng)導(dǎo)力、工程師文化等 7 個(gè)選題共現(xiàn)場參會者交流探討。

主論壇:技術(shù)前沿與創(chuàng)新洞見

在主論壇,幾位大咖將從技術(shù)產(chǎn)品創(chuàng)新、大模型訓(xùn)練等角度分享其深刻洞見。

企業(yè)與社會的持續(xù)發(fā)展離不開創(chuàng)新,然而創(chuàng)新過程中,產(chǎn)品、市場、技術(shù)、人員及組織等方面都存在不確定性,風(fēng)險(xiǎn)較高,成功率相對較低。CCF會士、螞蟻集團(tuán)副總裁、OceanBase創(chuàng)始人兼首席科學(xué)家陽振坤將分享《從OceanBase看創(chuàng)新項(xiàng)目的選題和研制》,介紹OceanBase研發(fā)過程中的一些思考和體會。

人工智能引領(lǐng)新一輪工業(yè)革命,大模型技術(shù)是驅(qū)動(dòng)本輪人工智能浪潮的關(guān)鍵支撐。大模型訓(xùn)練是超算應(yīng)用,超算系統(tǒng)設(shè)計(jì)需要考慮計(jì)算、訪存、高速互連等協(xié)同設(shè)計(jì),避免出現(xiàn)木桶短板,從而為大模型訓(xùn)練提供有效的算力支撐。CCF副理事長、北京并行科技股份有限公司董事長陳健將分享《大模型訓(xùn)練和推理的選型和性能優(yōu)化》,從超算架構(gòu)算力平臺出發(fā),介紹如何提升大模型訓(xùn)練和推理性能。

CED大咖說:產(chǎn)業(yè)洞見與團(tuán)隊(duì)智慧

在CED大咖說環(huán)節(jié),幾位專家將從人工智能時(shí)代的團(tuán)隊(duì)建設(shè)角度分享其思考。

康威定律告訴我們,什么樣的組織就有什么樣的溝通方式。在自己的組織內(nèi)實(shí)現(xiàn)專業(yè)分工,有效協(xié)同是管理者的重要目標(biāo)。彩食鮮副總裁兼CTO喬新亮將分享《打造世界知名的高績效研發(fā)團(tuán)隊(duì)》。他首先會帶我們分析夢寐以求的偉大組織、卓越團(tuán)隊(duì)的五個(gè)特征,然后介紹具體落地舉措,最后分享一些可以幫助大家輕松打造偉大團(tuán)隊(duì)的管理工具。

在人類發(fā)展歷史上,人工智能,與蒸汽機(jī)、電力、計(jì)算機(jī)、半導(dǎo)體和互聯(lián)網(wǎng)一樣,都是通用目的技術(shù),是經(jīng)濟(jì)增長的引擎。與其他通用目的技術(shù)只是從機(jī)械化增強(qiáng)角度提升了人類與環(huán)境的互動(dòng)能力不同,人工智能的出現(xiàn)挑戰(zhàn)了人類的根本,它深刻改變了人類與環(huán)境互動(dòng)的能力和角色。浙江大學(xué)人工智能研究所所長吳飛將分享《從人工智能到人工智能+:知識、能力與素養(yǎng)》,從“至小有內(nèi)、至大無外”角度介紹高等教育和基礎(chǔ)教育中人工智能知識點(diǎn)區(qū)別,思考了解人工智能、使用人工智能和創(chuàng)新人工智能能力的形成,指出具備包含知識、理解、技能和價(jià)值觀等要素的“人工智能素養(yǎng)”——這已成為邁進(jìn)人工智能時(shí)代的基本語法。

工程師脫口秀:幽默中的洞察與成長

工程師脫口秀一直是CCF CED的保留環(huán)節(jié)。工程師并不僅僅是木訥的極客,也不是空洞的格子衫,工程師還是幽默風(fēng)趣、熱愛生活、藝術(shù)氣息的多面體。在這一環(huán)節(jié),幾位專家將以放松、調(diào)侃、戲謔的方式呈現(xiàn)工程師的另一面,展示工程師文化的多樣性。

工程師是工作環(huán)境的順應(yīng)者,也是工作環(huán)境的塑造者。當(dāng)工作環(huán)境對于工程師個(gè)人和軟件行業(yè)的可持續(xù)發(fā)展并不利時(shí),我們希望工程師成為新工作環(huán)境的塑造者,而非成為舊工作環(huán)境的受害者。致效企業(yè)管理咨詢創(chuàng)始人、《全面效能》作者李云會講講《那些令人擔(dān)憂的大廠亂象》。

技術(shù)從業(yè)者往往被貼上“不善表達(dá)、不愛社交”的刻板印象。這種形象在增長時(shí)代或許還能奏效,但在如今的存量競爭時(shí)代,個(gè)人品牌和影響力已經(jīng)成為不可或缺的能力,甚至是一種重要資產(chǎn)。津津樂道播客網(wǎng)絡(luò)創(chuàng)始人朱峰會跟我們聊聊《行業(yè)專家該如何樹立個(gè)人品牌》。他將結(jié)合在幫助領(lǐng)域內(nèi)專家打造個(gè)人品牌并實(shí)現(xiàn)私域變現(xiàn)方面的豐富經(jīng)驗(yàn),為技術(shù)從業(yè)者提供一些實(shí)用的建議和支持。

隨著AI的發(fā)展,使用AI解決問題變得越來越容易,然而AI卻不善于定義問題。高質(zhì)量的答案回答不了錯(cuò)誤的問題,我們比之前以往都更要關(guān)注問題,而非答案。Thoughtworks亞太區(qū)Excellence Program Director徐昊屆時(shí)會聊一聊《當(dāng)問題比答案重要》。

此外,本次大會還將增設(shè)五大分論壇,涵蓋AI時(shí)代的工程師團(tuán)隊(duì)管理、創(chuàng)新視野拓展坊、AI時(shí)代的技術(shù)領(lǐng)導(dǎo)力、生產(chǎn)力革新的AI工具、打造屬于你的AI Agent領(lǐng)域,也希望給參會者帶來更為豐富多面的前沿話題分享。

28 日《工程師之旅》線路安排

既有產(chǎn)業(yè)遠(yuǎn)見的院士、領(lǐng)導(dǎo),也有深度的案例研討、工作坊,還有獨(dú)特的阿里味兒食堂,目前正在面向技術(shù)副總裁、技術(shù)帶頭人接受報(bào)名,期待共同邁向AI創(chuàng)新無限可能。這不僅是一次技術(shù)創(chuàng)新案例分享,更是一次技術(shù)領(lǐng)導(dǎo)力的學(xué)習(xí)。CCF CED2024 中國計(jì)算機(jī)學(xué)會工程師文化日期待與你共同見證工程師文化的轉(zhuǎn)型,探索技術(shù)創(chuàng)新的無限可能,攜手開啟智能時(shí)代的新篇章。

CCF CED2024 官網(wǎng):https://ccf.org.cn/CED2024YH

推廣

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù),對本頁面內(nèi)容所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任,相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。任何單位或個(gè)人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),可及時(shí)向站長之家提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明(點(diǎn)擊查看反饋聯(lián)系地址)。本網(wǎng)站在收到上述法律文件后,將會依法依規(guī)核實(shí)信息,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

  • 相關(guān)推薦
  • 大家在看
  • Sona:用AI記錄會議并總結(jié),提升工作效率。

    Sona是一款能夠記錄、轉(zhuǎn)錄、總結(jié)和聊天的應(yīng)用程序,它通過捕捉對話并提供最重要的見解來提升用戶的工作效率。Sona可以在多種設(shè)備上使用,包括Apple Watch、iPhone和桌面客戶端,支持99種語言,讓用戶無論在何種語言環(huán)境下都能進(jìn)行對話記錄和總結(jié)。產(chǎn)品的主要優(yōu)點(diǎn)包括無縫捕捉對話、智能總結(jié)、繼續(xù)對話、多語言支持以及在后臺工作,不干擾會議。Sona的定位是幫助用戶在會議和日常對話中捕捉重要信息,避免遺漏關(guān)鍵細(xì)節(jié)。

  • fast-graphrag:智能適應(yīng)用例、數(shù)據(jù)和查詢的RAG框架

    Fast GraphRAG是一個(gè)為可解釋、高精度、代理驅(qū)動(dòng)的檢索工作流程而設(shè)計(jì)的流線型和可提示的框架。它通過構(gòu)建圖譜來提供人類可導(dǎo)航的知識視圖,支持查詢、可視化和更新。該框架旨在大規(guī)模運(yùn)行,無需沉重的資源或成本要求,自動(dòng)生成和優(yōu)化圖譜以適應(yīng)特定領(lǐng)域和本體需求,并支持實(shí)時(shí)更新。Fast GraphRAG利用PageRank基于圖的探索,增強(qiáng)了準(zhǔn)確性和可靠性,并且完全異步,提供完整的類型支持,以實(shí)現(xiàn)健壯和可預(yù)測的工作流程。

  • PopPop AI Vocal Remover:在線AI人聲分離器,輕松提取歌曲中的人聲和伴奏。

    PopPop AI Vocal Remover是一款在線工具,利用先進(jìn)的AI技術(shù),能夠從任何歌曲中分離出人聲和伴奏。這項(xiàng)技術(shù)的重要性在于它為音樂制作、卡拉OK、音頻編輯等領(lǐng)域提供了極大的便利。用戶無需下載任何軟件,直接在網(wǎng)頁上操作,即可實(shí)現(xiàn)高質(zhì)量的音頻分離。產(chǎn)品完全免費(fèi),無需注冊登錄,支持多種文件格式和大文件處理,為用戶提供了極大的便利。

  • Video Ocean:,讓每個(gè)人都能輕松制作高質(zhì)量視頻。

    Video Ocean是一個(gè)基于人工智能模型技術(shù)的視頻制作平臺,提供文本生成、圖像生成、音視頻生成等功能。用戶可以輸入描述性文本、圖片、音頻和視頻,獲得定制化的AI生成文本、圖片、音頻和視頻。該平臺致力于簡化視頻生成的復(fù)雜性,通過提供先進(jìn)的工具和詳細(xì)的資源,使高質(zhì)量的視頻制作變得易于訪問和不費(fèi)力。Video Ocean的主要優(yōu)點(diǎn)包括開放源代碼、易于使用、高效生產(chǎn)和創(chuàng)新性。它通過提供100個(gè)免費(fèi)幣來吸引用戶試用,推動(dòng)內(nèi)容創(chuàng)作的民主化,鼓勵(lì)創(chuàng)新、創(chuàng)造力和包容性。

  • browser-use:開源的網(wǎng)頁自動(dòng)化庫,支持任何大型語言模型(LLM)

    browser-use是一個(gè)開源的網(wǎng)頁自動(dòng)化庫,允許大型語言模型(LLM)與網(wǎng)站進(jìn)行交互,通過簡單的接口實(shí)現(xiàn)復(fù)雜的網(wǎng)頁操作。該技術(shù)的主要優(yōu)點(diǎn)包括對多種語言模型的通用支持、交互元素自動(dòng)檢測、多標(biāo)簽頁管理、XPath提取、視覺模型支持等。它解決了傳統(tǒng)網(wǎng)頁自動(dòng)化中的一些痛點(diǎn),如動(dòng)態(tài)內(nèi)容處理、長任務(wù)解決等。browser-use以其靈活性和易用性,為開發(fā)者提供了一個(gè)強(qiáng)大的工具,以構(gòu)建更加智能和自動(dòng)化的網(wǎng)頁交互體驗(yàn)。

  • The Cognity:為自閉癥個(gè)體設(shè)計(jì)的社交技能學(xué)習(xí)AI平臺

    The Cognity是一個(gè)全自動(dòng)化的AI平臺,專為自閉癥個(gè)體設(shè)計(jì),以學(xué)習(xí)社交技能。該平臺通過提供專家設(shè)計(jì)的練習(xí),改善溝通和整體福祉,使溝通和理解達(dá)到新水平,打破障礙,對他人展現(xiàn)同情心。它提供了一個(gè)集成的解決方案,允許在家庭和治療會話中輕松整合社交技能練習(xí),并通過先進(jìn)的技術(shù)提供自動(dòng)化反饋,分析聲音、面部表情、詞語、對情境的反應(yīng)等,為自閉癥個(gè)體提供個(gè)性化和有效的學(xué)習(xí)體驗(yàn)。

  • Panto AI:代碼審查助手,確保代碼無缺陷。

    Panto AI 是一個(gè)編程輔助工具,通過代碼審查來預(yù)防缺陷代碼進(jìn)入生產(chǎn)環(huán)境。它通過全天候運(yùn)作,暴露代碼中的漏洞并建議修復(fù)措施,確保只有無缺陷的代碼被推送到生產(chǎn)環(huán)境。Panto AI 不僅檢查錯(cuò)誤,還理解代碼背后的意圖,并與知識庫無縫集成,提供更智能的洞察。產(chǎn)品背景信息顯示,Panto AI 已經(jīng)開源其代碼,并在GitHub上獲得社區(qū)支持。

  • X-Portrait 2:高度表現(xiàn)力的肖像動(dòng)畫技術(shù)

    字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)推出最新單圖視頻驅(qū)動(dòng)技術(shù) X-Portrait 2。X-Portrait 2是一種肖像動(dòng)畫技術(shù),它通過用戶提供的靜態(tài)肖像圖像和驅(qū)動(dòng)表演視頻,能夠生成具有高度表現(xiàn)力和真實(shí)感的角色動(dòng)畫和視頻片段。這項(xiàng)技術(shù)顯著降低了現(xiàn)有的動(dòng)作捕捉、角色動(dòng)畫和內(nèi)容創(chuàng)作流程的復(fù)雜性。X-Portrait 2通過構(gòu)建一個(gè)最先進(jìn)的表情編碼器模型,隱式編碼輸入中的每一個(gè)微小表情,并通過大規(guī)模數(shù)據(jù)集進(jìn)行訓(xùn)練。然后,該編碼器與強(qiáng)大的生成擴(kuò)散模型結(jié)合,生成流暢且富有表現(xiàn)力的視頻。X-Portrait 2能夠傳遞微妙和微小的面部表情,包括撅嘴、吐舌、臉頰充氣和皺眉等具有挑戰(zhàn)性的表情,并在生成的視頻中實(shí)現(xiàn)高保真的情感傳遞。

  • SellRaze:在線庫存銷售與管理的一體化工具

    SellRaze是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的在線銷售工具,它可以幫助用戶快速創(chuàng)建商品列表,并在多個(gè)電商平臺上跟蹤庫存,一站式管理銷售。產(chǎn)品通過AI技術(shù)提高銷售速度,支持一鍵集成多個(gè)頂級市場,提供移動(dòng)便利性和無縫管理,增加商品的可見性,簡化運(yùn)輸流程,并允許用戶從單一應(yīng)用管理所有買家。SellRaze的主要優(yōu)點(diǎn)包括提高銷售效率、簡化庫存管理、增加商品曝光度以及便捷的運(yùn)輸和物流服務(wù)。產(chǎn)品背景信息顯示,SellRaze被5000多名用戶信賴,其用戶群體包括新晉在線賣家、定期轉(zhuǎn)售者、兼職eBay賣家等,價(jià)格方面,SellRaze提供免費(fèi)試用,具體定價(jià)信息需進(jìn)一步查看其定價(jià)頁面。

  • Nifty:一站式項(xiàng)目管理操作系統(tǒng)

    Nifty是一款集成了多種項(xiàng)目管理工具的操作系統(tǒng),旨在通過統(tǒng)一的平臺減少團(tuán)隊(duì)在不同工具間的切換,提高工作效率。它提供了路線圖、任務(wù)管理、討論、文檔管理、表單創(chuàng)建、報(bào)告自動(dòng)化以及人工智能輔助等功能,適合各種工作流程和團(tuán)隊(duì)使用。Nifty以其用戶友好的界面和強(qiáng)大的功能獲得了用戶的高度評價(jià),并且提供免費(fèi)版本,無需信用卡信息即可注冊使用。

  • Mochi in ComfyUI:ComfyUI中集成的最新視頻生成模型

    Mochi是Genmo最新推出的開源視頻生成模型,它在ComfyUI中經(jīng)過優(yōu)化,即使使用消費(fèi)級GPU也能實(shí)現(xiàn)。Mochi以其高保真度動(dòng)作和卓越的提示遵循性而著稱,為ComfyUI社區(qū)帶來了最先進(jìn)的視頻生成能力。Mochi模型在Apache 2.0許可下發(fā)布,這意味著開發(fā)者和創(chuàng)作者可以自由使用、修改和集成Mochi,而不受限制性許可的阻礙。Mochi能夠在消費(fèi)級GPU上運(yùn)行,如4090,且在ComfyUI中支持多種注意力后端,使其能夠適應(yīng)小于24GB的VRAM。

  • DET練習(xí):Duolingo English Test在線練習(xí)平臺

    DET練習(xí)是一個(gè)專為Duolingo English Test設(shè)計(jì)的在線練習(xí)平臺,提供廣泛的題庫、模擬考試、AI評分和課程學(xué)習(xí)等功能,幫助用戶提高英語水平并準(zhǔn)備Duolingo English Test。平臺以其智能性能跟蹤、實(shí)時(shí)反饋和個(gè)性化學(xué)習(xí)計(jì)劃為主要優(yōu)點(diǎn),滿足了不同水平英語學(xué)習(xí)者的需求,特別適合那些尋求提高Duolingo English Test成績的學(xué)習(xí)者。

  • AdvancedLivePortrait-WebUI:基于Gradio的實(shí)時(shí)人像動(dòng)畫Web界面

    AdvancedLivePortrait-WebUI是一個(gè)基于Gradio框架開發(fā)的Web界面,用于實(shí)時(shí)人像動(dòng)畫編輯。該技術(shù)允許用戶通過上傳圖片來編輯人物的面部表情,實(shí)現(xiàn)了高效的肖像動(dòng)畫制作。它基于LivePortrait算法,利用深度學(xué)習(xí)技術(shù)進(jìn)行面部特征的捕捉和動(dòng)畫制作,具有操作簡便、效果逼真的優(yōu)點(diǎn)。產(chǎn)品背景信息顯示,它是由jhj0517開發(fā)的開源項(xiàng)目,適用于需要進(jìn)行人像動(dòng)畫制作的專業(yè)人士和愛好者。目前該項(xiàng)目是免費(fèi)的,并且開源,用戶可以自由使用和修改。

  • ImagePrompt.org:將創(chuàng)意轉(zhuǎn)化為AI藝術(shù)的平臺

    ImagePrompt.org是一個(gè)專注于利用AI技術(shù)將用戶的創(chuàng)意轉(zhuǎn)化為藝術(shù)作品的平臺。它提供圖片提示詞生成工具,幫助用戶優(yōu)化圖片提示詞,創(chuàng)作出符合個(gè)人想法的圖片。該平臺通過AI技術(shù)簡化設(shè)計(jì)過程,增強(qiáng)創(chuàng)造力,讓用戶能夠輕松地將想象力轉(zhuǎn)化為數(shù)字藝術(shù)。產(chǎn)品背景信息顯示,ImagePrompt.org致力于縮小想象力和視覺創(chuàng)作之間的差距,讓用戶通過AI生成的藝術(shù)作品將他們的想法變?yōu)楝F(xiàn)實(shí)。價(jià)格方面,由于圖片生成服務(wù)的高成本,平臺為每個(gè)用戶提供10次圖片生成的試用,而提示詞生成工具則完全免費(fèi)使用。

  • Integuru:通過逆向工程構(gòu)建第三方集成的AI代理。

    Integuru是一個(gè)AI代理,能夠通過逆向工程技術(shù)生成第三方平臺的集成代碼。它通過分析瀏覽器的網(wǎng)絡(luò)請求和用戶的操作,自動(dòng)生成能夠觸發(fā)特定動(dòng)作的Python代碼。這項(xiàng)技術(shù)的重要性在于,它可以幫助開發(fā)者無需深入了解第三方平臺的內(nèi)部API,即可快速構(gòu)建集成解決方案,提高開發(fā)效率并降低技術(shù)門檻。Integuru由Integuru.ai開發(fā),是一個(gè)開源項(xiàng)目,支持自定義請求和額外功能的開發(fā)。

  • PaperVision:自定義OpenCV算法的用戶友好節(jié)點(diǎn)編輯器

    PaperVision是一個(gè)受Blender和Unreal Engine藍(lán)圖啟發(fā)的用戶友好的節(jié)點(diǎn)編輯器,用于創(chuàng)建自定義OpenCV算法。它允許用戶快速原型設(shè)計(jì)視覺算法,并在編輯時(shí)提供實(shí)時(shí)預(yù)覽。PaperVision旨在與EOCV-Sim集成,作為后端引擎,允許在節(jié)點(diǎn)編輯器中實(shí)時(shí)可視化處理流程。

  • Resticker.ai:使用AI技術(shù)快速創(chuàng)建個(gè)性化貼紙。

    Free AI Sticker Generator是一個(gè)在線平臺,利用人工智能技術(shù)幫助用戶無需設(shè)計(jì)技能即可快速創(chuàng)建個(gè)性化貼紙。用戶只需輸入描述或上傳圖片,AI即可生成多種風(fēng)格的貼紙。這個(gè)工具適合設(shè)計(jì)師、個(gè)人、營銷人員、小型企業(yè)和初創(chuàng)公司使用。產(chǎn)品的主要優(yōu)點(diǎn)包括無需設(shè)計(jì)技能、快速創(chuàng)建、完全定制和高分辨率輸出。

  • OuteTTS:一個(gè)實(shí)驗(yàn)性的文本到語音模型

    OuteTTS是一個(gè)使用純語言建模方法生成語音的實(shí)驗(yàn)性文本到語音模型。它的重要性在于能夠通過先進(jìn)的語言模型技術(shù),將文本轉(zhuǎn)換為自然聽起來的語音,這對于語音合成、語音助手和自動(dòng)配音等領(lǐng)域具有重要意義。該模型由OuteAI開發(fā),提供了Hugging Face模型和GGUF模型的支持,并且可以通過接口進(jìn)行語音克隆等高級功能。

  • GenXD:生成任何3D和4D場景的先進(jìn)框架

    GenXD是一個(gè)專注于3D和4D場景生成的框架,它利用日常生活中常見的相機(jī)和物體運(yùn)動(dòng)來聯(lián)合研究一般的3D和4D生成。由于社區(qū)缺乏大規(guī)模的4D數(shù)據(jù),GenXD首先提出了一個(gè)數(shù)據(jù)策劃流程,從視頻中獲取相機(jī)姿態(tài)和物體運(yùn)動(dòng)強(qiáng)度?;诖肆鞒?,GenXD引入了一個(gè)大規(guī)模的現(xiàn)實(shí)世界4D場景數(shù)據(jù)集:CamVid-30K。通過利用所有3D和4D數(shù)據(jù),GenXD框架能夠生成任何3D或4D場景。它提出了多視圖-時(shí)間模塊,這些模塊分離相機(jī)和物體運(yùn)動(dòng),無縫地從3D和4D數(shù)據(jù)中學(xué)習(xí)。此外,GenXD還采用了掩碼潛在條件,以支持多種條件視圖。GenXD能夠生成遵循相機(jī)軌跡的視頻以及可以提升到3D表示的一致3D視圖。它在各種現(xiàn)實(shí)世界和合成數(shù)據(jù)集上進(jìn)行了廣泛的評估,展示了GenXD在3D和4D生成方面與以前方法相比的有效性和多功能性。

  • FLUX.1-dev LoRA Outfit Generator:基于文本生成服裝圖像的AI模型

    FLUX.1-dev LoRA Outfit Generator是一個(gè)文本到圖像的AI模型,能夠根據(jù)用戶詳細(xì)描述的顏色、圖案、合身度、風(fēng)格、材質(zhì)和類型來生成服裝。該模型使用了H&M Fashion Captions Dataset數(shù)據(jù)集進(jìn)行訓(xùn)練,并基于Ostris的AI Toolkit進(jìn)行開發(fā)。它的重要性在于能夠輔助設(shè)計(jì)師快速實(shí)現(xiàn)設(shè)計(jì)想法,加速服裝行業(yè)的創(chuàng)新和生產(chǎn)流程。

今日大家都在搜的詞:

熱文

  • 3 天
  • 7天