中科院和汪軍團隊發(fā)布大模型玩星際爭霸秀到起飛

2023-12-29 09:17 · 稿源：站長之家

要點:
1、中國科學院自動化研究所與倫敦大學學院合作，將最近興起的LLMAgent技術(shù)應(yīng)用于星際爭霸II的AI研究。
2、團隊通過LLM理解與分析能力來提高星際AI的長期戰(zhàn)略規(guī)劃與可解釋性決策。
3、在測試中，LLMagent涌現(xiàn)出了超越AlphaStar的危險預(yù)測和兵種轉(zhuǎn)型能力，以及前期快攻、前期偵察等類人策略。

站長之家(ChinaZ.com) 12月29日消息:面對星際爭霸II這一巨大挑戰(zhàn)，團隊開發(fā)了TextStarCraftII——一個全新的交互環(huán)境。TextStarCraftII基于python-sc2框架，將游戲中的狀態(tài)信息和動作空間映射到文本空間。宏觀戰(zhàn)略動作被轉(zhuǎn)化為LLMAgent能夠理解并執(zhí)行的具體語義動作，而微觀操作則交由一套固定的規(guī)則式方法處理。LLMagent能夠在全新的戰(zhàn)場上與游戲內(nèi)置的AI展開較量。

論文地址:https://arxiv.org/pdf/2312.11865.pdf

項目地址:https://github.com/histmeisah/Large-Language-Models-play-StarCraftII

在星際爭霸II的戰(zhàn)場上，進行有效決策需要及時處理大量復(fù)雜信息，進行合理的戰(zhàn)略分析與長期規(guī)劃，最終制定宏觀戰(zhàn)略決策。團隊創(chuàng)新性地提出了「ChainofSummarization」方法。

該方法通過單幀總結(jié)和多幀總結(jié)，提高了LLM在復(fù)雜環(huán)境中的理解和決策能力。在驗證ChainofSummarization方法的有效性方面，團隊選擇了GPT-3.5-turbo-16k作為LLM。結(jié)果表明:ChainofSummarization不僅將LLM與游戲端的交互速度提升了十倍，還顯著增強了模型對游戲情境的理解及決策能力。

團隊精心設(shè)計了一套復(fù)雜的提示詞系統(tǒng)，包括游戲狀態(tài)總結(jié)，狀態(tài)分析，策略建議，最終決策。模型能夠全面理解游戲的當前局勢，分析敵我雙方的策略，并提出具有戰(zhàn)略深度的建議，最終做出多步的合理決策。這極大地提高了LLM的實時決策能力和長期規(guī)劃能力，也極大提升了決策的可解釋性。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

大模型

薦一手實測豆包新發(fā)布的視覺理解大模型，他們真的卷起飛了。

人在字節(jié)火山發(fā)布會現(xiàn)場。眼睜睜看著他們發(fā)了一大堆的模型升級，眼花繚亂，有一種要一股腦把字節(jié)系的AI底牌往桌上亮的感覺。這可能才是，最酷的事吧。

?豆包
薦大模型拿單江湖

11月29日，智譜AgentOpenDay會后，現(xiàn)場有記者問了CEO張鵬一個問題:“ToB進展如何?”“還行吧”，至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當中，其同臺競爭對手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

?智譜Agent ?大模型 ?AI公司
薦OpenAI發(fā)布強化微調(diào)API，能深度定制超復(fù)雜大模型了

今天凌晨兩點，OpenAI開啟了12天技術(shù)分享直播，發(fā)布了最新“強化微調(diào)”計劃。與傳統(tǒng)的微調(diào)相比，強化微調(diào)可以讓開發(fā)者使用經(jīng)過微調(diào)的更強專家大模型，來開發(fā)適用于金融、法律、醫(yī)療、科研等不同領(lǐng)域的AI助手。通過這些反饋訓(xùn)練一個獎勵模型，該模型能夠?qū)φZ言模型的輸出進行打分，以反映其質(zhì)量或符合人類期望。

?OpenAI ?強化微調(diào) ?AI助手
薦大模型，在內(nèi)卷中尋找出口

2024年，大模型進展不斷。從年初的Sora到最新的o3，更新更好的模型不斷被推出，“內(nèi)卷”到底有沒有發(fā)生?我們要先確定“內(nèi)卷”的定義，指某一類產(chǎn)業(yè)模式，發(fā)展到一種確定形式后，陷入“高水平均衡陷阱”，出現(xiàn)“沒有發(fā)展的增長”，這種局面一直無法被打破，那就會走向停滯和危機。大模型要取得商業(yè)成功，前提是用戶和開發(fā)者的業(yè)務(wù)能否成功，這是為什么完善的商業(yè)基

?大模型進展 ?內(nèi)卷現(xiàn)象 ?scaling
智象多模態(tài)生成大模型3.0發(fā)布離幻覺更遠與離落地更近

12月28日，智象未來科技有限公司在安徽人工智能產(chǎn)業(yè)先導(dǎo)區(qū)啟動儀式中，正式發(fā)布智象多模態(tài)生成大模型3.0版。啟動儀式上，智象未來創(chuàng)始人兼首席執(zhí)行官梅濤總結(jié)了2024年人工領(lǐng)域技術(shù)發(fā)展的五個標志性事件，分別是以Sora為代表的視覺生成物理世界模擬器、以ChatGPT4o為代表的多模態(tài)模型、以GPT-o1為代表的從預(yù)訓(xùn)練到后訓(xùn)練推理優(yōu)化、多模態(tài)大模型賦能具身智能實現(xiàn)軟硬件結(jié)合，以及人工智能學者榮獲諾貝爾化學獎表明AI賦能科研范式變革。本次活動現(xiàn)場，智象未來與人民網(wǎng)、上海電影集團、彩訊科技、捷成華視網(wǎng)聚、安徽聯(lián)通、中國移動咪咕音樂等12家生態(tài)伙伴企業(yè)代表簽約，共同打造集技術(shù)研發(fā)、產(chǎn)業(yè)化應(yīng)用、市場推廣于一體的生態(tài)體系。

?人工智能 ?多模態(tài)大模型 ?技術(shù)發(fā)展
重磅！OpenAI發(fā)布滿血o1、無限使用，最強大模型來了

今天凌晨兩點，OpenAI正式開啟了12天技術(shù)分享直播，并發(fā)布了最新產(chǎn)品ChatGPTPro。ChatGPTPro可以無限使用完整版o1和Pro模式，同時可以使用高級語音和圖片上傳功能。這只是OpenAI的連續(xù)12天分享技術(shù)的第一天，后續(xù)「AIGC開放社區(qū)」將會繼續(xù)為大家介紹。

?OpenAI ?ChatGPT ?Pro
谷歌史上最強大模型！Gemini 2.0正式發(fā)布

今天凌晨，谷歌正式發(fā)布了為新智能體時代構(gòu)建的下一代模型Gemini2.0。這是谷歌迄今為止功能最強的AI模型，帶來了更強的性能、更多的多模態(tài)表現(xiàn)和新的原生工具應(yīng)用。Gemini2.0還會擴展到更多Google產(chǎn)品中。

?谷歌 ?Gemini ?2.0
薦AI大模型時代，人才的需求已經(jīng)變了

什么是AI發(fā)展的第一驅(qū)動力?最近，全球科技大廠都在用行動告訴我們:人才。谷歌NotebookLM的核心團隊共同宣布離職創(chuàng)業(yè)，他們新公司的網(wǎng)站已經(jīng)進入了「建設(shè)中」的狀態(tài)。但要真正解決AI人才短缺的問題需要更多企業(yè)、高校和社會各界的共同努力。

?大模型
薦谷歌“狙擊”O(jiān)penAI，發(fā)布新一代大模型，主打Agent+多模態(tài)

繼量子芯片之后，谷歌又來搶“OpenAI雙12直播”的流量了!就在剛剛，谷歌新一代大模型Gemini2.0突然登場，再次由谷歌CEO皮猜親自官宣。新一代模型專為AIAgent打造，谷歌表示目前已經(jīng)將2.0版本提供給了一些開發(fā)者內(nèi)測，正在迅速將其集成在Gemini和搜索等產(chǎn)品線中。從OpenAI跳槽到谷歌的LoganKilpatrick表示，他們在GoogleAIStudio中創(chuàng)建了一個全新體驗，展示了Gemini2.0視頻理解、原生工具?

?谷歌 ?Gemini ?2.0
豆包說要「普惠」，于是大模型處理圖片按「厘」計價了

OpenAI宣告連續(xù)12輪轟炸，讓2024年底的大模型領(lǐng)域熱鬧起來了。但堅持每個凌晨看直播的話會發(fā)現(xiàn)，越到后面的發(fā)布越平淡，內(nèi)心的波動也越少了。豆包大模型還有哪些驚喜?值得每一個人期待。

?大模型 ?OpenAI ?豆包視覺理解

熱文

3 天
7天

站長商機

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

中科院和汪軍團隊發(fā)布大模型玩星際爭霸秀到起飛

薦一手實測豆包新發(fā)布的視覺理解大模型，他們真的卷起飛了。

薦大模型拿單江湖

薦OpenAI發(fā)布強化微調(diào)API，能深度定制超復(fù)雜大模型了

薦大模型，在內(nèi)卷中尋找出口

智象多模態(tài)生成大模型3.0發(fā)布離幻覺更遠與離落地更近

重磅！OpenAI發(fā)布滿血o1、無限使用，最強大模型來了

谷歌史上最強大模型！Gemini 2.0正式發(fā)布

薦AI大模型時代，人才的需求已經(jīng)變了

薦谷歌“狙擊”O(jiān)penAI，發(fā)布新一代大模型，主打Agent+多模態(tài)

豆包說要「普惠」，于是大模型處理圖片按「厘」計價了

熱文

蘋果市值一夜蒸發(fā)7248億此前官網(wǎng)已開啟降價活動

雷軍親自出面海底撈正式入駐小米科技園全體員工88折

辛巴要花15億開超市：號稱將改變大家消費習慣

周鴻祎：打工不可能賺大錢創(chuàng)業(yè)才能財富自由

法拉第未來股價一夜暴漲超50% 第二品牌FX原型車即將亮相

胖東來正式規(guī)定員工不得收付彩禮、依靠父母買房買車

1999元全球首款媽祖平安智能手表發(fā)布：搭載華為智能機芯

抖音宣布將加強內(nèi)容推薦多樣性破除“信息繭房”

周鴻祎：我也要送車什么車大家算了算

格力申請董瓷、明珠瓷和格力好老公等商標

雷軍辟謠只招聘35歲以下員工：僅針對未來之星項目

雷軍曬健身房照片：此前設(shè)定100次健身打卡目標

雷軍感謝網(wǎng)友祝他年入百萬：愿大家夢想成真今晚8點跨年直播

阿里巴巴AI“生意管家”: 400萬商家的秘密武器

蘋果市值一夜蒸發(fā)7248億此前官網(wǎng)已開啟降價活動

拼手氣分紅包！支付寶宣布2025年集五福1月20日開啟

抖音副總裁回應(yīng)吳柳芳同名賬號被封：仿冒當事人

董明珠曾喊話雷軍給股民分多少錢！格力：擬分紅超55億

俞敏洪稱東方甄選是火藥桶：未來一定會更加美好

蘋果官網(wǎng)突然降價客服回應(yīng)能否退差價

站長商機

中科院和汪軍團隊發(fā)布 大模型玩星際爭霸秀到起飛

熱文

站長商機

中科院和汪軍團隊發(fā)布大模型玩星際爭霸秀到起飛