幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關(guān)鍵詞  > 大模型最新資訊  > 正文

中科院和汪軍團隊發(fā)布 大模型玩星際爭霸秀到起飛

2023-12-29 09:17 · 稿源:站長之家

要點:

1、中國科學院自動化研究所與倫敦大學學院合作,將最近興起的LLMAgent技術(shù)應(yīng)用于星際爭霸II的AI研究。

2、團隊通過LLM理解與分析能力來提高星際AI的長期戰(zhàn)略規(guī)劃與可解釋性決策。

3、在測試中,LLMagent涌現(xiàn)出了超越AlphaStar的危險預(yù)測和兵種轉(zhuǎn)型能力,以及前期快攻、前期偵察等類人策略。

站長之家(ChinaZ.com) 12月29日 消息:面對星際爭霸II這一巨大挑戰(zhàn),團隊開發(fā)了TextStarCraftII——一個全新的交互環(huán)境。TextStarCraftII基于python-sc2框架,將游戲中的狀態(tài)信息和動作空間映射到文本空間。宏觀戰(zhàn)略動作被轉(zhuǎn)化為LLMAgent能夠理解并執(zhí)行的具體語義動作,而微觀操作則交由一套固定的規(guī)則式方法處理。LLMagent能夠在全新的戰(zhàn)場上與游戲內(nèi)置的AI展開較量。

image.png

論文地址:https://arxiv.org/pdf/2312.11865.pdf

項目地址:https://github.com/histmeisah/Large-Language-Models-play-StarCraftII

在星際爭霸II的戰(zhàn)場上,進行有效決策需要及時處理大量復(fù)雜信息,進行合理的戰(zhàn)略分析與長期規(guī)劃,最終制定宏觀戰(zhàn)略決策。團隊創(chuàng)新性地提出了「ChainofSummarization」方法。

該方法通過單幀總結(jié)和多幀總結(jié),提高了LLM在復(fù)雜環(huán)境中的理解和決策能力。在驗證ChainofSummarization方法的有效性方面,團隊選擇了GPT-3.5-turbo-16k作為LLM。結(jié)果表明:ChainofSummarization不僅將LLM與游戲端的交互速度提升了十倍,還顯著增強了模型對游戲情境的理解及決策能力。

團隊精心設(shè)計了一套復(fù)雜的提示詞系統(tǒng),包括游戲狀態(tài)總結(jié),狀態(tài)分析,策略建議,最終決策。模型能夠全面理解游戲的當前局勢,分析敵我雙方的策略,并提出具有戰(zhàn)略深度的建議,最終做出多步的合理決策。這極大地提高了LLM的實時決策能力和長期規(guī)劃能力,也極大提升了決策的可解釋性。

舉報

  • 相關(guān)推薦
  • 一手實測豆包新發(fā)布的視覺理解大模型,他們真的卷起飛了。

    人在字節(jié)火山發(fā)布會現(xiàn)場。眼睜睜看著他們發(fā)了一大堆的模型升級,眼花繚亂,有一種要一股腦把字節(jié)系的AI底牌往桌上亮的感覺。這可能才是,最酷的事吧。

  • 大模型拿單江湖

    11月29日,智譜AgentOpenDay會后,現(xiàn)場有記者問了CEO張鵬一個問題:“ToB進展如何?”“還行吧”,至此張鵬沒有再多說一句。這家明星AI公司深度參與到大模型的廝殺當中,其同臺競爭對手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見底了。

  • OpenAI發(fā)布強化微調(diào)API,能深度定制超復(fù)雜大模型

    今天凌晨兩點,OpenAI開啟了12天技術(shù)分享直播,發(fā)布了最新“強化微調(diào)”計劃。與傳統(tǒng)的微調(diào)相比,強化微調(diào)可以讓開發(fā)者使用經(jīng)過微調(diào)的更強專家大模型,來開發(fā)適用于金融、法律、醫(yī)療、科研等不同領(lǐng)域的AI助手。通過這些反饋訓(xùn)練一個獎勵模型,該模型能夠?qū)φZ言模型的輸出進行打分,以反映其質(zhì)量或符合人類期望。

  • 大模型,在內(nèi)卷中尋找出口

    2024年,大模型進展不斷。從年初的Sora到最新的o3,更新更好的模型不斷被推出,“內(nèi)卷”到底有沒有發(fā)生?我們要先確定“內(nèi)卷”的定義,指某一類產(chǎn)業(yè)模式,發(fā)展到一種確定形式后,陷入“高水平均衡陷阱”,出現(xiàn)“沒有發(fā)展的增長”,這種局面一直無法被打破,那就會走向停滯和危機。大模型要取得商業(yè)成功,前提是用戶和開發(fā)者的業(yè)務(wù)能否成功,這是為什么完善的商業(yè)基

  • 智象多模態(tài)生成大模型3.0發(fā)布 離幻覺更遠與離落地更近

    12月28日,智象未來科技有限公司在安徽人工智能產(chǎn)業(yè)先導(dǎo)區(qū)啟動儀式中,正式發(fā)布智象多模態(tài)生成大模型3.0版。啟動儀式上,智象未來創(chuàng)始人兼首席執(zhí)行官梅濤總結(jié)了2024年人工領(lǐng)域技術(shù)發(fā)展的五個標志性事件,分別是以Sora為代表的視覺生成物理世界模擬器、以ChatGPT4o為代表的多模態(tài)模型、以GPT-o1為代表的從預(yù)訓(xùn)練到后訓(xùn)練推理優(yōu)化、多模態(tài)大模型賦能具身智能實現(xiàn)軟硬件結(jié)合,以及人工智能學者榮獲諾貝爾化學獎表明AI賦能科研范式變革。本次活動現(xiàn)場,智象未來與人民網(wǎng)、上海電影集團、彩訊科技、捷成華視網(wǎng)聚、安徽聯(lián)通、中國移動咪咕音樂等12家生態(tài)伙伴企業(yè)代表簽約,共同打造集技術(shù)研發(fā)、產(chǎn)業(yè)化應(yīng)用、市場推廣于一體的生態(tài)體系。

  • 重磅!OpenAI發(fā)布滿血o1、無限使用,最強大模型來了

    今天凌晨兩點,OpenAI正式開啟了12天技術(shù)分享直播,并發(fā)布了最新產(chǎn)品ChatGPTPro。ChatGPTPro可以無限使用完整版o1和Pro模式,同時可以使用高級語音和圖片上傳功能。這只是OpenAI的連續(xù)12天分享技術(shù)的第一天,后續(xù)「AIGC開放社區(qū)」將會繼續(xù)為大家介紹。

  • 谷歌史上最強大模型!Gemini 2.0正式發(fā)布

    今天凌晨,谷歌正式發(fā)布了為新智能體時代構(gòu)建的下一代模型Gemini2.0。這是谷歌迄今為止功能最強的AI模型,帶來了更強的性能、更多的多模態(tài)表現(xiàn)和新的原生工具應(yīng)用。Gemini2.0還會擴展到更多Google產(chǎn)品中。

  • AI大模型時代,人才的需求已經(jīng)變了

    什么是AI發(fā)展的第一驅(qū)動力?最近,全球科技大廠都在用行動告訴我們:人才。谷歌NotebookLM的核心團隊共同宣布離職創(chuàng)業(yè),他們新公司的網(wǎng)站已經(jīng)進入了「建設(shè)中」的狀態(tài)。但要真正解決AI人才短缺的問題需要更多企業(yè)、高校和社會各界的共同努力。

  • 谷歌“狙擊”O(jiān)penAI,發(fā)布新一代大模型,主打Agent+多模態(tài)

    繼量子芯片之后,谷歌又來搶“OpenAI雙12直播”的流量了!就在剛剛,谷歌新一代大模型Gemini2.0突然登場,再次由谷歌CEO皮猜親自官宣。新一代模型專為AIAgent打造,谷歌表示目前已經(jīng)將2.0版本提供給了一些開發(fā)者內(nèi)測,正在迅速將其集成在Gemini和搜索等產(chǎn)品線中。從OpenAI跳槽到谷歌的LoganKilpatrick表示,他們在GoogleAIStudio中創(chuàng)建了一個全新體驗,展示了Gemini2.0視頻理解、原生工具?

  • 豆包說要「普惠」,于是大模型處理圖片按「厘」計價了

    OpenAI宣告連續(xù)12輪轟炸,讓2024年底的大模型領(lǐng)域熱鬧起來了。但堅持每個凌晨看直播的話會發(fā)現(xiàn),越到后面的發(fā)布越平淡,內(nèi)心的波動也越少了。豆包大模型還有哪些驚喜?值得每一個人期待。

熱文