幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 傳媒 > 關(guān)鍵詞  > 手游最新資訊  > 正文

網(wǎng)易伏羲受邀出席「2024驍龍游戲技術(shù)賞」,分享游戲AI技術(shù)實(shí)踐

2024-07-26 15:51 · 稿源: 站長之家用戶

7月25日,備受期待的《永劫無間手游正式開啟公測,該手游預(yù)下載階段便榮登App Store免費(fèi)總榜TOP1!游戲中全新引入的語音AI隊(duì)友功能,迅速吸引了廣大玩家的關(guān)注和好評。

這一創(chuàng)新玩法由網(wǎng)易24工作室聯(lián)合網(wǎng)易伏羲AI實(shí)驗(yàn)室共同研發(fā),作為全球首 款游戲Co pilot隊(duì)友,該功能依托于最前沿的AI大模型推理技術(shù),成功塑造了與真人玩家體驗(yàn)相媲美的AI隊(duì)友。AI隊(duì)友不僅能夠自主執(zhí)行跑圖、搜索物資、參與戰(zhàn)斗、跑圈等戰(zhàn)術(shù)動作,更能在戰(zhàn)斗中提供輔助和救援,通過自然語音與玩家進(jìn)行雙向無縫溝通。

《永劫無間》手游上線當(dāng)日,網(wǎng)易伏羲AI技術(shù)負(fù)責(zé)人睿風(fēng)應(yīng)邀在「2024驍龍游戲技術(shù)賞」上發(fā)表演講,首 次公開分享《永劫無間》手游中語音AI隊(duì)友的技術(shù)探索和應(yīng)用成果。該活動為高通公司循例在ChinaJoy前夕舉辦的年度盛會,今年,高通公司攜手網(wǎng)易伏羲等產(chǎn)業(yè)合作伙伴,共同探討移動技術(shù)創(chuàng)新如何賦能前沿數(shù)字娛樂體驗(yàn)。

因演講當(dāng)日恰逢《永劫無間》手游公測上線,睿風(fēng)無法到達(dá)現(xiàn)場,所以通過連線方式進(jìn)行分享。以下是他的演講實(shí)錄:

大家好,我是來自網(wǎng)易伏羲的睿風(fēng),很高興能夠參加「驍龍游戲技術(shù)賞」。

(網(wǎng)易伏羲AI技術(shù)負(fù)責(zé)人睿風(fēng)現(xiàn)場連線分享畫面)

網(wǎng)易伏羲成立于2017年9月份,是國內(nèi)第 一個面向游戲行業(yè)進(jìn)行AI研究的人工智能實(shí)驗(yàn)室,我們以“創(chuàng)建人工智能與游戲交叉領(lǐng)域的世界知名實(shí)驗(yàn)室”為宗旨,運(yùn)用人工智能尖 端技術(shù)為玩家營造新世代的游戲體驗(yàn),同時也借助游戲平臺的海量數(shù)據(jù)和仿真環(huán)境,推動人工智能技術(shù)的發(fā)展。

自2017年成立至今,網(wǎng)易伏羲已經(jīng)在多款游戲中落地大量的AI玩法。例如我們在《逆水寒》端游中首創(chuàng)AI照片捏臉玩法和智能養(yǎng)育系統(tǒng),在《永劫無間》端游中,我們上線了基于強(qiáng)化學(xué)習(xí)技術(shù)的噩夢人機(jī)玩法,利用AI反外掛技術(shù)定位和處罰違規(guī)玩家確保公平游戲環(huán)境。去年我們在現(xiàn)象級游戲《逆水寒》手游中落地了大量創(chuàng)新的AI應(yīng)用,包括智能NPC、文字捏臉、大宋頭條、UGC劇組模式等等,打造了全球首 款A(yù)I游戲,也獲得了玩家們的高度認(rèn)可和歡迎。

今年,我們在今天正式上線的《永劫無間》手游中,率先發(fā)布了全球首創(chuàng)的語音AI隊(duì)友玩法。在這個玩法中,玩家可以邀請智能AI隊(duì)友進(jìn)行一場完整的游戲體驗(yàn)。玩家可以通過語音交互的方式,直接跟AI進(jìn)行交流。這個AI隊(duì)友首先能聽懂指揮,搜裝送裝、團(tuán)戰(zhàn)配合樣樣精通;其次能實(shí)時觀察戰(zhàn)況,匯報關(guān)鍵信息并答疑解惑;此外AI隊(duì)友還具備強(qiáng)大的戰(zhàn)斗能力,博弈強(qiáng)、配合好;最后該AI隊(duì)友還能自由交流,給予玩家較高的情緒價值。

為了能實(shí)現(xiàn)這個能聽、能說還能做的AI隊(duì)友,網(wǎng)易伏羲基于多年的技術(shù)積累,結(jié)合語音識別、語義理解、文本生成、語音合成、強(qiáng)化學(xué)習(xí)、模仿學(xué)習(xí)等多項(xiàng)AI技術(shù),解決了大量的技術(shù)難題。為了實(shí)現(xiàn)跟真人隊(duì)友幾乎無異的語音交互體驗(yàn),我們給這個玩法設(shè)定了幾個技術(shù)指標(biāo)。

首先相比于喚醒詞或手動按鈕觸發(fā)的交互方式,全開麥的實(shí)時語音交互對我們提出了更多的技術(shù)挑戰(zhàn),其中最核心的就是噪音檢測和非交互內(nèi)容識別的能力,為了盡可能降低誤觸率,我們使用網(wǎng)易伏羲的有靈眾包平臺,在開發(fā)期就采用自動數(shù)據(jù)閉環(huán)方式,通過持續(xù)采集各種機(jī)型和項(xiàng)目成員們的真實(shí)體驗(yàn)數(shù)據(jù),不斷優(yōu)化模型效果。

其次,為了讓AI能夠比較準(zhǔn)確識別玩家指令并做出最合理的行為決策,我們不僅引入了自然語言理解技術(shù)來提升指令識別能力,而且采用了基于指令的強(qiáng)化學(xué)習(xí)技術(shù),讓模型能夠根據(jù)指令和實(shí)時的戰(zhàn)場狀態(tài),做出最合理的行為決策,實(shí)現(xiàn)了盡可能遵循玩家指令的基礎(chǔ)上,又保持較高強(qiáng)度的游戲能力。

最后,為了達(dá)到極低的交互體驗(yàn)速度,我們做了大量的工程優(yōu)化工作。當(dāng)前線上的實(shí)時響應(yīng)時長最短可以實(shí)現(xiàn)300ms內(nèi)的語音和行為響應(yīng),最長響應(yīng)時長也能控制1s左右,從而實(shí)現(xiàn)了讓交流不延遲,讓配合更及時。

正如前面提到的,這個語音AI隊(duì)友玩法對于時延非常敏感,為了給用戶帶來更極 致的交互體驗(yàn),伏羲跟高通進(jìn)行了深入合作,將部分AI推理從云端GPU遷移到第三代驍龍8移動平臺的NPU上。

為什么我們要去做端側(cè)推理?首先就是低時延,相比于基于云的推理,端側(cè)推理可以節(jié)省網(wǎng)絡(luò)傳輸帶來的時間延遲,特別是對于一些網(wǎng)絡(luò)條件不太好的地區(qū)的玩家,這部分的時延降低帶來的收益是非常可觀的,從而給這部分玩家?guī)砀玫挠螒蝮w驗(yàn)。其次從公司層面來說,AI推理從云端遷移到端側(cè),可以充分利用玩家的終端算力,降低服務(wù)運(yùn)行成本。我們知道目前云端的GPU服務(wù)都是比較貴的,為了控制成本,很多AI服務(wù)都會對應(yīng)用做一些使用限制或讓玩家采用付費(fèi)使用的方式,而端側(cè)推理可以讓這部分玩家自由地體驗(yàn)AI玩法。

當(dāng)前在《永劫無間》手游的AI隊(duì)友玩法中,網(wǎng)易伏羲跟高通已經(jīng)遷移了部分AI能力到端側(cè),目前正在做更多深入合作。我們期望未來可以將更多AI能力,包括大語言模型(LLM),語音合成(TTS)等技術(shù)適配到手機(jī)終端,給玩家們帶來更好的游戲體驗(yàn)。

推廣

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù),對本頁面內(nèi)容所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任,相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。任何單位或個人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,可及時向站長之家提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明(點(diǎn)擊查看反饋聯(lián)系地址)。本網(wǎng)站在收到上述法律文件后,將會依法依規(guī)核實(shí)信息,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

  • 相關(guān)推薦
  • 大家在看
  • Editor Usage:監(jiān)控和管理您的Cursor編輯器使用情況

    Editor Usage 是一款為macOS設(shè)計的菜單欄應(yīng)用程序,旨在幫助用戶監(jiān)控和管理他們的Cursor編輯器使用情況。該應(yīng)用程序能夠追蹤高級、普通和特殊請求的使用情況,并在接近使用限制時提供警告。它允許用戶從菜單欄快速查看剩余的請求次數(shù),從而確保用戶始終了解他們的使用情況,并避免因超出限制而受到影響。這款應(yīng)用的主要優(yōu)點(diǎn)包括詳細(xì)的使用監(jiān)控、可定制的警告設(shè)置以及快速便捷的訪問方式。它適合需要管理多個項(xiàng)目或希望實(shí)時監(jiān)控請求使用情況的用戶。

  • Yepic Studio:在線視頻制作平臺,提供AI虛擬形象和視頻制作服務(wù)。

    Yepic Studio是一個在線視頻制作平臺,它通過使用人工智能技術(shù),允許用戶創(chuàng)建和編輯視頻內(nèi)容,包括制作會說話的照片視頻、專業(yè)視頻以及AI虛擬形象。該平臺的主要優(yōu)點(diǎn)在于能夠快速生成高質(zhì)量的視頻內(nèi)容,同時提供個性化的AI虛擬形象,滿足不同商業(yè)需求。產(chǎn)品背景信息顯示,Yepic Studio旨在為內(nèi)容創(chuàng)作者和企業(yè)提供一個簡單易用的在線視頻制作工具,以提高內(nèi)容生產(chǎn)的效率和質(zhì)量。關(guān)于價格,頁面顯示用戶為'Guest'且'Credits'為0,暗示可能有免費(fèi)試用或基礎(chǔ)免費(fèi)服務(wù),具體定價需進(jìn)一步查看。

  • Jumper:是一個強(qiáng)大的AI視頻搜索工具,幫助編輯者快速找到視頻素材。

    Jumper是一個專為視頻編輯者設(shè)計的AI搜索工具,它能夠讓用戶在眨眼間搜索自己的視頻素材。Jumper集成到了用戶的非線性編輯器(NLE)中,無需離開編輯工作流程即可找到所需素材。Jumper支持多語言搜索,能夠快速定位特定詞匯或短語在視頻中的位置,支持多機(jī)位和同步剪輯,并且完全在設(shè)備上運(yùn)行,保護(hù)用戶隱私,無需上傳素材至云端。Jumper的主要優(yōu)點(diǎn)包括快速搜索、完全離線工作、保護(hù)隱私和兼容性強(qiáng)。產(chǎn)品背景信息顯示,Jumper由Witchcraft Software AB開發(fā),旨在通過AI技術(shù)提高視頻編輯的效率和創(chuàng)造力。

  • CogVideoX1.5-5B-SAT:開源視頻生成模型,支持10秒視頻和更高分辨率。

    CogVideoX1.5-5B-SAT是由清華大學(xué)知識工程與數(shù)據(jù)挖掘團(tuán)隊(duì)開發(fā)的開源視頻生成模型,是CogVideoX模型的升級版。該模型支持生成10秒視頻,并支持更高分辨率的視頻生成。模型包含Transformer、VAE和Text Encoder等模塊,能夠根據(jù)文本描述生成視頻內(nèi)容。CogVideoX1.5-5B-SAT模型以其強(qiáng)大的視頻生成能力和高分辨率支持,為視頻內(nèi)容創(chuàng)作者提供了一個強(qiáng)大的工具,尤其在教育、娛樂和商業(yè)領(lǐng)域有著廣泛的應(yīng)用前景。

  • Ask The Post AI:華盛頓郵報的AI問答產(chǎn)品

    Ask The Post AI是華盛頓郵報推出的一款基于人工智能的產(chǎn)品,它允許讀者就自2016年以來發(fā)布的所有報道提出問題。該產(chǎn)品利用生成式AI技術(shù)和對話格式,依托華盛頓郵報長期以來基于事實(shí)、深入報道的新聞傳統(tǒng),以新的方式取悅并通知讀者。Ask The Post AI通過機(jī)器學(xué)習(xí)團(tuán)隊(duì)對Climate Answers工具的數(shù)據(jù)進(jìn)行提煉,優(yōu)化了如何檢索和匹配自2016年以來新聞室發(fā)布的所有報道中與用戶查詢相關(guān)的相關(guān)文章。

  • Mistral Moderation API:AI內(nèi)容審核服務(wù),保護(hù)下游部署安全。

    Mistral Moderation API是Mistral AI推出的內(nèi)容審核服務(wù),旨在幫助用戶檢測和過濾不受歡迎的文本內(nèi)容。該API是Le Chat中使用的審核服務(wù)的同一技術(shù),現(xiàn)在對外開放,以便用戶可以根據(jù)特定的應(yīng)用和安全標(biāo)準(zhǔn)定制和使用這一工具。該模型是一個基于LLM(大型語言模型)的分類器,能夠?qū)⑽谋据斎敕诸惖?個預(yù)定義的類別中。Mistral AI的這一API支持原生多語言,特別針對阿拉伯語、中文、英語、法語、德語、意大利語、日語、韓語、葡萄牙語、俄語和西班牙語進(jìn)行了訓(xùn)練。該API的主要優(yōu)點(diǎn)包括提高審核的可擴(kuò)展性和魯棒性,以及通過技術(shù)文檔提供的詳細(xì)政策定義和啟動指南,幫助用戶有效實(shí)施系統(tǒng)級的安全防護(hù)。

  • Medio AI:AI編輯工具,助力企業(yè)視頻營銷本地化。

    Medio AI是一個為企業(yè)提供AI編輯工具的平臺,專注于視頻翻譯和視頻配音,幫助企業(yè)無畏全球擴(kuò)張,實(shí)現(xiàn)視頻營銷的本地化。產(chǎn)品背景信息顯示,Medio AI旨在幫助企業(yè)探索更多海外市場,通過AI技術(shù)提升視頻編輯效率,增強(qiáng)產(chǎn)品在國際市場上的競爭力。產(chǎn)品的主要優(yōu)點(diǎn)包括無需下載、在線使用、一鍵去除視頻水印、產(chǎn)品翻譯、視頻配音等。價格方面,Medio AI提供免費(fèi)試用,并根據(jù)不同的功能需求提供不同的付費(fèi)版本。

  • PodExtra AI:釋放播客的力量,用AI提升播客收聽體驗(yàn)

    PodExtra AI是一款先進(jìn)的AI工具,專為播客收聽和知識獲取設(shè)計。它通過生成播客內(nèi)容的摘要、思維導(dǎo)圖、大綱、亮點(diǎn)和要點(diǎn),幫助用戶快速把握播客的核心內(nèi)容。產(chǎn)品背景信息顯示,播客愛好者平均每周消費(fèi)超過8集,全球有超過400萬的節(jié)目可供選擇。PodExtra AI通過AI技術(shù),使得用戶能夠快速瀏覽內(nèi)容,節(jié)省時間,提高效率。產(chǎn)品定位于幫助用戶從海量播客內(nèi)容中快速獲取有價值的信息,特別適合時間緊張但希望從播客中獲取知識的人群。

  • 語鯨:,智能語言處理平臺

    語鯨是一個專注于語言處理的平臺,它利用先進(jìn)的自然語言處理技術(shù),為用戶提供文本分析、翻譯、校對等服務(wù)。產(chǎn)品背景信息顯示,語鯨旨在幫助用戶提高寫作效率和質(zhì)量,特別是在多語言環(huán)境中。語鯨的價格定位尚未明確,但考慮到其提供的服務(wù),可能會有免費(fèi)試用和付費(fèi)版本。

  • CR-Mentor:AI驅(qū)動的代碼審查導(dǎo)師,提升代碼質(zhì)量和審查效率。

    CR-Mentor AI CodeReview Mentor是一個基于人工智能的代碼審查工具,它通過積累的最佳實(shí)踐知識庫和大型語言模型(LLM)分析,為主流編程語言提供智能代碼審查。該產(chǎn)品支持自定義的代碼審查標(biāo)準(zhǔn),能夠?yàn)閱蝹€文件代碼變更提供專業(yè)評分和改進(jìn)建議,并通過LLM生成全面的審查報告,包括代碼走查、變更描述和時序圖。它與GitHub工作流程深度集成,實(shí)現(xiàn)自動化代碼審查,支持多語言反饋,幫助整個團(tuán)隊(duì)提升代碼質(zhì)量和審查效率。

  • Srcbook:開源、自托管、AI驅(qū)動的應(yīng)用構(gòu)建器。

    Srcbook是一個開源、自托管的AI驅(qū)動應(yīng)用構(gòu)建器,它允許用戶快速構(gòu)建和部署各種應(yīng)用程序。產(chǎn)品背景信息顯示,Srcbook旨在提供一個平臺,讓開發(fā)者和非技術(shù)用戶都能夠輕松地構(gòu)建應(yīng)用程序,從而提高生產(chǎn)力和創(chuàng)新能力。它支持多種應(yīng)用場景,如項(xiàng)目管理工具、音樂發(fā)現(xiàn)頁面、技術(shù)文檔網(wǎng)站等。Srcbook的主要優(yōu)點(diǎn)包括開源性、靈活性和易用性,用戶可以根據(jù)自己的需求定制和擴(kuò)展功能。

  • ReCapture:用戶視頻的生成性視頻攝像機(jī)控制

    ReCapture是一種從單一用戶提供的視頻生成新視頻和新穎攝像機(jī)軌跡的方法。該技術(shù)允許我們從完全不同的角度重新生成源視頻,并帶有電影級別的攝像機(jī)運(yùn)動。ReCapture通過使用多視圖擴(kuò)散模型或基于深度的點(diǎn)云渲染生成帶有新攝像機(jī)軌跡的嘈雜錨視頻,然后通過我們提出的掩蔽視頻微調(diào)技術(shù)將錨視頻重新生成為干凈且時間上一致的重新角度視頻。這種技術(shù)的重要性在于它能夠利用視頻模型的強(qiáng)大先驗(yàn),將近似的視頻重新生成為時間上一致且美觀的視頻。

  • AI Tattoo Generator.net:快速創(chuàng)建個性化紋身設(shè)計

    AI Tattoo Generator是一個利用人工智能技術(shù)幫助用戶快速創(chuàng)建個性化紋身設(shè)計的在線平臺。該平臺使用先進(jìn)的機(jī)器學(xué)習(xí)算法,根據(jù)用戶輸入生成具有各種風(fēng)格的現(xiàn)實(shí)感紋身概念圖,確保用戶的想法以視覺上引人入勝的方式呈現(xiàn)。它不僅能夠提供即時的設(shè)計結(jié)果,還能讓用戶根據(jù)自己的偏好進(jìn)一步定制和細(xì)化設(shè)計,滿足個性化需求。

  • Unfaked:AI生成的逼真圖片庫

    Unfaked是一個提供由人工智能生成的逼真圖片的網(wǎng)站,這些圖片幾乎可以以假亂真。用戶可以免費(fèi)下載并自由使用這些圖片。每周都會更新更多的圖片。這個平臺的重要性在于它為設(shè)計師、內(nèi)容創(chuàng)作者和營銷人員提供了一個免費(fèi)的資源庫,他們可以在這里找到高質(zhì)量的圖片資源,而無需擔(dān)心版權(quán)問題。

  • ComfyUI-GIMM-VFI:基于GIMM-VFI的ComfyUI幀插值工具

    ComfyUI-GIMM-VFI是一個基于GIMM-VFI算法的幀插值工具,使用戶能夠在圖像和視頻處理中實(shí)現(xiàn)高質(zhì)量的幀插值效果。該技術(shù)通過在連續(xù)幀之間插入新的幀來提高視頻的幀率,從而使得動作看起來更加流暢。這對于視頻游戲、電影后期制作和其他需要高幀率視頻的應(yīng)用場景尤為重要。產(chǎn)品背景信息顯示,它是基于Python開發(fā)的,并且依賴于CuPy庫,特別適用于需要進(jìn)行高性能計算的場景。

  • 5ire:簡單易用,釋放AI的強(qiáng)大力量

    5ire是一個以簡潔和用戶友好為核心的AI產(chǎn)品,旨在讓即使是初學(xué)者也能輕松利用大型語言模型。它支持多種文檔格式的解析和向量化,具備本地知識庫、使用分析、提示庫、書簽和快速關(guān)鍵詞搜索等功能。作為一個開源項(xiàng)目,5ire提供免費(fèi)下載,并且提供了按需付費(fèi)的大型語言模型API服務(wù)。

  • AI Hear:一款在您電腦本地運(yùn)行的私有軟件,提供多語種實(shí)時翻譯。

    AI Hear是一款在電腦本地運(yùn)行的私有軟件,它通過一鍵開啟多語種實(shí)時翻譯功能,幫助用戶管理音頻、譯文和時間軸。產(chǎn)品不收集數(shù)據(jù),保護(hù)用戶隱私。它適用于多種場景,如線上會議、網(wǎng)課播客、游戲直播等,并且完全本地運(yùn)行,相比市面上的實(shí)時翻譯產(chǎn)品更具性價比。

  • SD Image:使用最新的Stable Diffusion 3.5模型生成高質(zhì)量圖像。

    SD Image的Stable Diffusion 3.5 Image Generator是一個在線圖像生成器,它利用最新的Stable Diffusion 3.5模型,包括Medium, Large, Large Turbo,來生成高質(zhì)量的圖像。這項(xiàng)技術(shù)的重要性在于它能夠通過文本提示(prompt)快速生成圖像,為設(shè)計師、藝術(shù)家和創(chuàng)意工作者提供靈感和便利。產(chǎn)品背景信息顯示,SD Image是一個在線平臺,用戶可以通過它找到靈感、生成圖像、探索不同的prompt和模型。目前,該產(chǎn)品提供免費(fèi)試用,適合需要快速生成圖像的用戶。

  • AI Homeworkify:下一代AI作業(yè)助手,免費(fèi)獲取作業(yè)答案

    AI Homeworkify是一個基于人工智能的在線問答平臺,旨在幫助學(xué)生通過提供詳細(xì)的答案和解題步驟來學(xué)習(xí)和理解各種學(xué)術(shù)問題。該平臺不涉及版權(quán)侵犯,注重教育平等,提供免費(fèi)、即時的作業(yè)幫助,支持多種學(xué)科和語言。AI Homeworkify的主要優(yōu)點(diǎn)包括完全免費(fèi)、無需注冊、即時答案、全天候服務(wù)、多設(shè)備兼容、隱私保護(hù)和逐步解決方案。產(chǎn)品背景信息顯示,AI Homeworkify致力于通過技術(shù)手段減少教育不平等,為全球?qū)W生提供免費(fèi)的優(yōu)質(zhì)學(xué)習(xí)輔助服務(wù)。

  • AI Voice Lab:在線將文字轉(zhuǎn)換為逼真的語音

    AI Voice Lab免費(fèi) AI 文字轉(zhuǎn)語音神器是一個利用最新的類GPT AI語音模型技術(shù),提供超級逼真的配音結(jié)果,支持20+種語言和100+種聲音,每天提供免費(fèi)使用次數(shù),適用于視頻、音頻制作等多種場景,提高內(nèi)容吸引力。

今日大家都在搜的詞: