日前,騰訊開悟”平臺(tái)宣布正式開放王者榮耀AI開放研究環(huán)境”申請(qǐng),邁出全面開放的第一步。面向非商業(yè)用途的機(jī)器學(xué)習(xí)算法研究,開悟”平臺(tái)將提供業(yè)界獨(dú)有的高復(fù)雜度MOBA訓(xùn)練環(huán)境,助力相關(guān)學(xué)術(shù)領(lǐng)域的前沿探索。
最新開放申請(qǐng)的王者榮耀AI開放研究環(huán)境”,包含了王者榮耀1v1對(duì)戰(zhàn)環(huán)境與baseline算法模型,當(dāng)前支持20位英雄的鏡像對(duì)戰(zhàn)任務(wù)以及非鏡像類對(duì)戰(zhàn)任務(wù),尤其適合研究競(jìng)爭(zhēng)性強(qiáng)化學(xué)習(xí)中的泛化性與通用性問題。
現(xiàn)在,研究者只需在騰訊開悟平臺(tái)官網(wǎng)注冊(cè)賬號(hào)、提交資料并通過平臺(tái)審核,即可免費(fèi)下載王者榮耀1v1測(cè)試環(huán)境gamecore,在本地進(jìn)行AI相關(guān)研究測(cè)試。
騰訊介紹稱,在《王者榮耀》對(duì)戰(zhàn)中,雙方玩家互為競(jìng)爭(zhēng)關(guān)系,需要收集資源的同時(shí)干擾對(duì)方,以達(dá)到贏得游戲的目的。作為一個(gè)具備多英雄、多玩法的復(fù)雜對(duì)抗游戲,王者榮耀的狀態(tài)、動(dòng)作空間復(fù)雜度比圍棋等游戲高很多,是學(xué)術(shù)屆研究復(fù)雜控制類問題的優(yōu)質(zhì)環(huán)境。
本次最新開放申請(qǐng)的王者榮耀AI開放研究環(huán)境”在只考慮雙方英雄選擇條件下,支持400種對(duì)戰(zhàn)子任務(wù),如果算上召喚師技能,將會(huì)有40000種子任務(wù),這對(duì)模型的泛化性有很大挑戰(zhàn),所以尤其適合研究競(jìng)爭(zhēng)性強(qiáng)化學(xué)習(xí)中的泛化性與通用性問題。
2021年起,開悟”先后與北大、清華、中科大等19所國(guó)內(nèi)頭部高校教師團(tuán)隊(duì)聯(lián)合發(fā)起創(chuàng)新課程合作項(xiàng)目,已于多所高校陸續(xù)落地多智能體強(qiáng)化學(xué)習(xí)實(shí)踐課程,幫助學(xué)生通過更有趣的方式掌握機(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、多智能體決策等關(guān)鍵知識(shí)點(diǎn)。
(舉報(bào))