幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 傳媒 > 關鍵詞  > 云棲大會最新資訊  > 正文

2024云棲大會|網易伏羲AI技術負責人睿風:AOP技術如何引領游戲AI創(chuàng)新跨越?

2024-09-20 09:22 · 稿源: 站長之家用戶

今日, 2024 云棲大會在杭州云棲小鎮(zhèn)國際會展中心正式拉開帷幕。網易伏羲作為阿里云云上最 佳實踐合作伙伴,應邀攜旗下系列創(chuàng)新產品亮相大會,向參會觀眾展示AI時代前沿科技成果與應用案例。下午,網易伏羲AI技術負責人睿風博士應邀出席“通義社媒文娛數(shù)字互動分論壇”并發(fā)表主題演講。

該分論壇聚焦于技術趨勢交流與探索,以及行業(yè)案例的探索。圍繞論壇主旨,睿風以《云上最 佳實踐:網易伏羲AOP技術引領游戲AI創(chuàng)新跨越》為題,分享了網易伏羲在游戲領域的多項AI創(chuàng)新應用。

睿風向現(xiàn)場聽眾介紹,網易伏羲是網易旗下的人工智能研究機構,致力于利用前沿人工智能技術釋放勞動者的生產力,探索人機協(xié)作的全新時代。網易伏羲實驗室自成立以來,始終堅持“創(chuàng)建人工智能與游戲交叉領域的世界知名實驗室”的宗旨,在探索前沿技術發(fā)展過程中不斷推陳出新,實現(xiàn)了游戲AI領域的多項創(chuàng)新技術突破,推出了基于照片、文字的AI捏臉、智能NPC、劇組模式、語音交互式捏臉和語音AI隊友等多個行業(yè)首創(chuàng)的AI應用。通過將AI技術融入游戲系統(tǒng)的各個層面,網易伏羲成功助力《逆水寒》手游、《永劫無間》手游等游戲打造多項創(chuàng)新玩法,極大地提升了玩家的游戲體驗。

在演講中,睿風重點展示了網易伏羲AOP技術應用實踐——《永劫無間》手游游戲Co pilot。他強調,基于AOP框架打造的多模態(tài)實時交互的語音AI隊友Agent,集成了語音識別、語義理解、人設對話大模型、語音生成、強化學習、模仿學習等多項智能體能力,可以根據不同的游戲場景和玩家偏好進行靈活調整,無論是在尋找可靠的隊友還是希望得到及時的教學幫助,游戲Co pilot都能滿足玩家的需求。通過與游戲AI深度融合的這一應用實踐,AOP框架不僅成功在游戲AI領域實現(xiàn)了創(chuàng)新跨越,體現(xiàn)了云上最 佳實踐,還展示了自身擴展至工程機械、家用機器人等多個領域的巨大潛力。

值得一提的是,在《永劫無間》手游中,網易伏羲攜手阿里云展開合作,為游戲提供了全面的云+AI技術支持,共同制定算力和鏡像管控的整體方案,確保游戲能夠在多個區(qū)域穩(wěn)定運行。在雙方的緊密合作下,不僅有效提升了游戲的性能表現(xiàn),也進一步推動了游戲行業(yè)的技術創(chuàng)新和發(fā)展。

2024 云棲大會不僅是一次展示前沿科技的盛會,更是促進跨行業(yè)交流合作的重要平臺。此次參會,網易伏羲展示了自身在AI領域的領先地位,也進一步堅定了未來持續(xù)探索技術發(fā)展的信心。隨著云計算與AI技術的不斷融合與發(fā)展,網易伏羲將繼續(xù)深耕前沿技術創(chuàng)新,專注大模型與AI應用的持續(xù)探索,攜手阿里云等合作伙伴打造更多超越期待的AI產品應用與服務,共同迎接AI時代的無限可能。

推廣

特別聲明:以上內容(如有圖片或視頻亦包括在內)均為站長傳媒平臺用戶上傳并發(fā)布,本平臺僅提供信息存儲服務,對本頁面內容所引致的錯誤、不確或遺漏,概不負任何法律責任,相關信息僅供參考。站長之家將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。任何單位或個人認為本頁面內容可能涉嫌侵犯其知識產權或存在不實內容時,可及時向站長之家提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明(點擊查看反饋聯(lián)系地址)。本網站在收到上述法律文件后,將會依法依規(guī)核實信息,溝通刪除相關內容或斷開相關鏈接。

  • 相關推薦
  • 大家在看
  • Grounding with Google Search:利用Google搜索提升AI模型的準確性和信息新鮮度

    Gemini API和Google AI Studio現(xiàn)在提供與Google Search結合的Grounding功能,使開發(fā)者能夠獲得更準確、更新的響應,這些響應由Google搜索輔助的Gemini模型提供。此功能不僅可以提供更準確的響應,還能返回支持鏈接和搜索建議,引導用戶找到與響應相對應的搜索結果。這一技術的應用,可以減少AI應用的虛構信息,提供最新的信息,增強AI應用的可信度,并且通過提供支持鏈接,增加發(fā)布者網站的流量。

  • Fish Agent V0.1 3B:高精度環(huán)境音頻信息捕捉與生成的語音轉語音模型

    Fish Agent V0.1 3B是一個開創(chuàng)性的語音轉語音模型,能夠以前所未有的精確度捕捉和生成環(huán)境音頻信息。該模型采用了無語義標記架構,消除了傳統(tǒng)語義編碼器/解碼器的需求。此外,它還是一個尖端的文本到語音(TTS)模型,訓練數(shù)據涵蓋了700,000小時的多語言音頻內容。作為Qwen-2.5-3B-Instruct的繼續(xù)預訓練版本,它在200B語音和文本標記上進行了訓練。該模型支持包括英語、中文在內的8種語言,每種語言的訓練數(shù)據量不同,其中英語和中文各約300,000小時,其他語言各約20,000小時。

  • Wonder Animation:Autodesk推出的AI解決方案,將視頻轉換為3D場景的動畫制作工具。

    Wonder Animation是Autodesk旗下的一款創(chuàng)新產品,它利用尖端的視頻到3D場景技術,將任何視頻序列轉換成3D動畫場景,加速動畫電影制作流程。這項技術能夠處理包含多個剪輯和不同鏡頭(廣角、中景、特寫)的影片和編輯序列,然后使用AI在3D空間中重建場景,并匹配每個攝像機與角色和環(huán)境的位置和動作關系。Wonder Animation的主要優(yōu)點在于它能夠為藝術家提供完全的創(chuàng)意控制權,與市場上其他依賴自動化輸出的生成性AI工具不同,它賦予藝術家塑造自己愿景的能力。

  • cofounder:AI生成的應用,全棧+生成式UI

    cofounder是一個全棧AI生成的應用,它結合了后臺、數(shù)據庫和有狀態(tài)的web應用。它基于應用架構的生成式UI,擁有AI引導的草圖設計和模塊化設計系統(tǒng)。這個項目還處于早期alpha階段,但已經展現(xiàn)出強大的潛力,尤其是在快速原型設計和開發(fā)方面。它的目標是提供一個完整的本地、基于瀏覽器的開發(fā)環(huán)境,支持多種框架,并且通過集成的AI插件提供生成式設計系統(tǒng)。

  • LaunchGun:AI驅動的分析平臺,優(yōu)化產品在Product Hunt上的發(fā)布。

    LaunchGun是一個AI驅動的分析平臺,旨在幫助獨立制作者通過數(shù)據驅動的洞察和聚類分析來優(yōu)化他們在Product Hunt上的發(fā)布。該平臺通過聚合和分析Product Hunt上的公共數(shù)據,為用戶在產品發(fā)布領域提供宏觀視角。LaunchGun的主要優(yōu)點包括聚類基礎的產品分析、數(shù)據可視化、成功率跟蹤、性能指標跟蹤和時間序列分析,幫助用戶識別趨勢和最佳發(fā)布時機。產品背景信息顯示,LaunchGun由一群對數(shù)據和產品發(fā)布充滿熱情的開發(fā)者創(chuàng)建,旨在通過最新的實時數(shù)據提供深入的分析和見解。

  • MeetingMind:AI會議記錄分析應用

    MeetingMind是一個AI驅動的會議助理,幫助用戶輕松捕捉、分析和執(zhí)行會議洞察。該項目使用Langflow、Next.js和基于Groq的快速轉錄服務來分析會議并生成洞察。產品背景信息顯示,MeetingMind旨在提高會議效率,通過自動化提取會議中的關鍵信息,如任務、決策、問題等,減少人工記錄和后續(xù)整理的時間。產品的主要優(yōu)點包括AI轉錄、關鍵信息自動提取和易于使用的界面。目前,該產品在GitHub上開源,用戶可以免費使用。

  • Kiwi Fitness:AI驅動的個性化健身訓練APP

    Kiwi Fitness是一款結合AI技術和健身訓練的應用程序,它通過個性化的健身計劃和游戲化元素,幫助用戶提高體能和健康。產品背景信息顯示,Kiwi Fitness利用研究支持的訓練方法和引人入勝的內容,創(chuàng)建能夠有效提升力量、耐力、靈活性和整體健康的健身程序。此外,它還提供了一個社交網絡,讓用戶可以分享健身成果,跟隨朋友的進步,并在支持性的社區(qū)中慶祝成就。Kiwi Fitness的價格定位是免費試用,用戶可以通過應用商店下載體驗。

  • MobileLLM:優(yōu)化的小型語言模型,適用于移動設備

    MobileLLM是一種針對移動設備優(yōu)化的小型語言模型,專注于設計少于十億參數(shù)的高質量LLMs,以適應移動部署的實用性。與傳統(tǒng)觀念不同,該研究強調了模型架構在小型LLMs中的重要性。通過深度和薄型架構,結合嵌入共享和分組查詢注意力機制,MobileLLM在準確性上取得了顯著提升,并提出了一種不增加模型大小且延遲開銷小的塊級權重共享方法。此外,MobileLLM模型家族在聊天基準測試中顯示出與之前小型模型相比的顯著改進,并在API調用任務中接近LLaMA-v2 7B的正確性,突出了小型模型在普通設備用例中的能力。

  • Note This Down:AI智能轉錄手寫筆記應用

    Note This Down是一款利用人工智能技術將手寫筆記數(shù)字化的應用,它通過連接用戶的Notion賬戶,上傳手寫筆記的照片,自動將手寫文字轉換成電子文本,并保存到Notion的新頁面中。這款應用的主要優(yōu)點包括高準確率的轉錄、直接與Notion集成、無限上傳和轉錄、以及7天免費試用。Note This Down的背景信息顯示,它旨在幫助那些喜歡手寫筆記但又需要數(shù)字組織便利的用戶。產品價格分為月付和年付兩種,月付16美元,年付79美元,均提供7天免費試用。

  • KlipLab:AI名人語音生成器,創(chuàng)建逼真的配音和視頻。

    KlipLab是一個利用人工智能技術的平臺,允許用戶使用名人、公眾人物和虛構角色的聲音來創(chuàng)建配音和唇形同步視頻。用戶只需選擇一個聲音,輸入文本,KlipLab就能生成一個唇形同步的視頻。這個技術的重要性在于它能夠為視頻內容創(chuàng)作者提供一種快速、高效的方式來制作高質量的視頻內容,同時增加視頻的吸引力和互動性。KlipLab提供了多種聲音選擇,并且支持高清視頻輸出,適合社交媒體和內容創(chuàng)作者使用。

  • Data Formulator:AI驅動的數(shù)據可視化工具

    Data Formulator 是微軟研究團隊開發(fā)的一款AI驅動的數(shù)據可視化工具,它通過結合用戶界面交互和自然語言輸入,幫助用戶快速創(chuàng)建豐富的數(shù)據可視化圖表。該工具可以自動處理數(shù)據轉換,使用戶能夠專注于圖表設計。Data Formulator 支持通過Python安裝并本地運行,也可以在GitHub Codespaces中快速啟動。它代表了數(shù)據分析和可視化領域的技術進步,通過AI技術提高了數(shù)據可視化的效率和易用性。

  • Syrnyk:一個擁有食譜生成器的美食博客。

    Syrnyk是一個美食博客網站,它不僅提供各種美食食譜,還擁有自己的食譜生成器應用。用戶可以通過這個平臺找到各種風格的食譜,包括早餐、午餐、晚餐和甜點等,滿足不同用戶的烹飪需求。Syrnyk的食譜生成器可以幫助用戶根據口味和烹飪時間快速生成個性化食譜,創(chuàng)造自己的烹飪書。這個平臺以其豐富的食譜內容和便捷的食譜生成功能,為用戶提供了一個有趣的烹飪體驗。

  • Zefi AI:將用戶反饋轉化為價值

    Zefi AI是一個商業(yè)產品,專注于將用戶反饋集中化、分析并提取洞察,以指導更好的產品決策。它通過集成多種工具,提供一個統(tǒng)一的反饋概覽,幫助企業(yè)理解用戶反饋背后的原因和趨勢,從而推動業(yè)務增長。Zefi AI以其企業(yè)級安全性、自動化反饋收集和標記、以及基于數(shù)據的產品決策支持而受到客戶信賴。

  • D-FINE:重新定義DETRs中的回歸任務為細粒度分布細化。

    D-FINE是一個強大的實時目標檢測模型,它通過將DETRs中的邊界框回歸任務重新定義為細粒度分布細化(FDR),并引入全局最優(yōu)定位自蒸餾(GO-LSD),在不增加額外推理和訓練成本的情況下,實現(xiàn)了出色的性能。該模型由中國科學院的研究人員開發(fā),旨在提高目標檢測的精度和效率。

  • Font Guesser:字體識別游戲,挑戰(zhàn)你的字體知識

    Font Guesser是一個在線互動游戲,旨在通過趣味的方式測試和提升用戶對不同字體的識別能力。用戶需要根據展示的字體樣本猜測其類型,包括Display、Serif、Sans-Serif、Monospace、Handwriting和Decorative等。這個游戲不僅增加了用戶對字體的認識,還能提升設計感和審美能力。產品背景信息顯示,該游戲由Nitin設計并制作,旨在以趣味的方式教育用戶識別和了解不同的字體。目前該游戲是免費的,適合所有對字體設計感興趣的用戶。

  • Personas:個性化音樂創(chuàng)作平臺

    Suno是一個音樂創(chuàng)作平臺,通過其最新功能Personas,用戶可以捕捉并保存任何曲目的獨特氛圍,賦予其生命。Personas允許用戶保存歌曲的本質——其人聲、風格和氛圍,并在新的創(chuàng)作中重新想象它。這就像是給曲目一個獨特的身份,隨時準備激發(fā)你的創(chuàng)造力。Personas讓用戶以音樂的本質為基礎,創(chuàng)造新的音樂聲音,這些聲音承載著他們最喜歡的曲目的靈魂。通過公開Personas,不僅是關于你的音樂——它是一個邀請他人加入和協(xié)作的邀請。

  • MLX-Auto-Subtitled-Video-Generator:基于 Apple MLX 框架的視頻字幕生成工具

    一款基于 Apple MLX 框架構建的開源字幕生成工具,針對蘋果硅芯片 Mac 優(yōu)化,高效且成本效益高。

  • Blendbox:AI藝術創(chuàng)作平臺,讓創(chuàng)意不受限制。

    Blendbox是一個基于AI的藝術創(chuàng)作平臺,它通過提供非破壞性編輯、層級編輯和重組等功能,增強用戶的創(chuàng)造力。用戶可以輕松地對作品的各個層進行編輯和調整,實現(xiàn)前所未有的創(chuàng)作自由度。Blendbox的背景信息顯示,它是由Blockade Labs開發(fā)的,旨在推動AI技術在藝術創(chuàng)作領域的應用。產品定位于專業(yè)設計師和藝術創(chuàng)作者,價格方面提供試用,具體定價未在頁面中明確。

  • MimicTalk:快速生成個性化和富有表現(xiàn)力的3D會說話面部模型

    MimicTalk是一種基于神經輻射場(NeRF)的個性化三維說話面部生成技術,它能夠在幾分鐘內模仿特定身份的靜態(tài)外觀和動態(tài)說話風格。這項技術的主要優(yōu)點包括高效率、高質量的視頻生成以及對目標人物說話風格的精確模仿。MimicTalk通過一個通用的3D面部生成模型作為基礎,并通過靜態(tài)-動態(tài)混合適應流程來學習個性化的靜態(tài)外觀和面部動態(tài),同時提出了一種上下文風格化的音頻到運動(ICS-A2M)模型,以生成與目標人物說話風格相匹配的面部運動。MimicTalk的技術背景是基于深度學習和計算機視覺領域的最新進展,特別是在人臉合成和動畫生成方面。目前,該技術是免費提供給研究和開發(fā)社區(qū)的。

  • Agent S::一個開放的代理框架,讓計算機像人類一樣使用計算機。

    Agent S是一個開放的代理框架,旨在通過圖形用戶界面(GUI)實現(xiàn)與計算機的自主交互,通過自動化復雜多步驟任務來轉變人機交互。它引入了經驗增強的分層規(guī)劃方法,利用在線網絡知識和敘事記憶,從過去的交互中提取高級經驗,將復雜任務分解為可管理的子任務,并使用情景記憶進行逐步指導,Agent S不斷優(yōu)化其行動并從經驗中學習,實現(xiàn)適應性強且有效的任務規(guī)劃。Agent S在OSWorld基準測試中的表現(xiàn)超過了基線9.37%的成功率(相對提高了83.6%),并在WindowsAgentArena基準測試中展示了廣泛的通用性。

今日大家都在搜的詞: