LLM Agents

LLM NPC System 本文试图设计一个游戏中的 NPC 系统,目标是让游戏环境更加真实,丰满,有趣。为了达到这个目标,我们试图实现一个在开放世界场景下的大量 NPC 驱动系统。它具有以下特点: 大量的 NPC 数量 丰富的 NPC 种类 真实的 NPC 行为 有趣的 NPC 互动 我们希望引入 LLM 的能力来增强 NPC 驱动系统。一个完整的 NPC 驱动系统应该包括以下几...

2023-12-14 · 3 min · Ian

Reinforcement Learning - An Introduction 读书笔记 习题尝试

Reinforcement Learning An Introduction 读书笔记 & 习题 作者图书主页:链接 自己python实现的代码:github链接

2020-07-06 · 1 min · Ian

Dota2BotStepByStep 代码阅读

Dota2BotStepByStep总结 项目地址为github链接

2019-04-10 · 1 min · Ian

TorchCraftAI 代码阅读

Building Placer流程 入口函数为./tutorials/building-placer/train-rl.cpp 主要逻辑流程如下图: trainer loop中每回合使用replay buffer中的episode样本policy gradient方式更新当前模型 交互thread loop中每个线程用当前...

2019-02-15 · 5 min · Ian

DeepMind AlphaStar 简介

简介 2019.01.25 deepmind公布了最新StarCraftII Agent AlphaStar,对职业选手Mana和TLO的战绩为10胜1负。目前Agent只支持使用Protoss族,但是架构支持所有种族无限制对战 训练过程 Agent训练基于PySC2接口 对单元采用transformer torso + LSTM + auto-regressive policy head...

2019-01-25 · 2 min · Ian

TorchCraftAI 架构和实验

本文主要参考(翻译)了TorchCraftAI项目的官方文档Tutorials并加入了自己在阅读和实验中的一些坑和理解 模块抽象 Player Player类调用事先连接到server上的TorchCraft client并推进游戏主循环:接收游戏state update,bot内部循环,并向ser...

2019-01-04 · 11 min · Ian

DeepMind pysc2 简介和部署记录

pysc2简介 DeepMind于2017年8月公布的SC2LE (StarCraft II Learning Environment)的python部分,将SC II的机器学习官方API包括一个匿名游戏replay数据集(链接)以Python RL环境的形式暴露出来(blog) 可以简单用一句脚本安装 pip install pysc2 将相关地图(链接)下...

2018-12-28 · 1 min · Ian

TorchCraftAI 简介和部署记录

系统简介 摘录原文如下: TorchCraftAI is a platform that lets you build agents to play (and learn to play) StarCraft®: Brood War®†. TorchCraftAI includes: A modular framework for building StarCraft agent CherryPi, a bot which plays complete games of StarCraft (1st place SSCAIT 2017-18) A reinforcement learning environment with minigames, models, and training loops TorchCraft support for TCP communication with StarCraft and BWAPI Support for Linux, Windows, and OSX 可以看到TorchCraftAI是一个集成了StarCraft通信协议以及强化学习环境的项目,可训...

2018-12-28 · 8 min · Ian