Neural MMO 学习笔记（四）

发表于2023-04-25|更新于2024-10-27|Neural MMO

|字数总计:822|阅读时长:2分钟|阅读量:

写这篇笔记的时候也在学习强化学习相关知识，移步：强化学习（一） | 雨白的博客小屋 (ameshiro77.cn)

上文说到我们希望运行出一个游戏界面，而之后我发现是经典读东西读不全的问题，官方文档给出的提示是让我们运行demos.minimal后去运行client里的可执行文件，而非用浏览器打开对应端口（虽然不知道为什么引入了three.js库（做图形学用过这个），但他的示例是用unity做的）。教程还贴心的告诉我们要运行符合系统的可执行文件，我之前之所以运行不了是因为运行了上次在windows下用的.exe。本文先按照官方文档的TUTORIALS的教程来。

顺便解释个名词：scripted_agent：动作由自定义脚本所控制的智能体。

Minimal Example

这个示例让我们渲染智能体所在的环境。运行baselines中的minimal后，来到client/UnityCilent中,启动右边这个exe。

image-20230425123810351

可以看到如下界面：

image-20230425123948469

按tab隐藏下面文字；使用鼠标中键可以调整视角以及进行缩放。按右键可以拖动位置。我们放大视角，选定一个agent，可以对其进行follow：

image-20230425124543867

至于下面的commands，目前还没有找到有什么用。另外，这个unity游戏甚至找不到退出键，必须得alt+F4才行。。

Config Classes

Neural MMO提供了小型、中型、大型预设的基本配置，以及一套游戏系统。通过对预设子类化(大概就是python对子类的定义)来启用游戏系统。比如默认配置是：

image-20230425131538638

而在我们刚才所运行的minimal中，就指定了config:

image-20230425132433003

可以看出用的是中型预设。地图将根据提供的配置在环境实例化时生成，并存放在PATH_MAPS里以供重用。如果主动调整terrain（地形）生成参数，要像上图里设置MAP_FORCE_GENERATION = TRUE。（文档写的是FORCE_MAP_GENERATION不知道为啥）

当然也可以通过覆盖预设和游戏系统配置参数来自定义地形生成和游戏平衡：

image-20230425133455292

使用config的话，就把自己设定的config当成simulate()的参数就行了。（应该是）

image-20230425133554611

源码的simulate()如下：

image-20230425133639963

Scripted API

暂时没看懂这是在干啥。源代码里捏了个LavaAgent，这个Agent喜欢没事就往岩浆里跳，通过nmmo.Agent的子类来实现。这一部分提到了observation和wrapper class，之后再看看。

Rewards & Tasks

默认情况下，Neural MMO为死亡提供-1的奖励信号，其他行为信号为0.当然我们可以自己覆写奖励。如下：

image-20230425135312956

这是插入了一个新属性kills。hasattr()函数是用来判断一个对象是否包含对应属性的。这段代码是增加了一个奖励机制：对每一个击败的玩家增加0.1的奖励。比如击杀了两个，就加0.2。当然了，如果只这么加的话，智能体就会总想着杀人而不参与农业了。

暂时看到这，看代码的时候还得继续看强化学习的知识。。

文章作者: Ameshiro

文章链接: https://www.ameshiro77.cn/posts/a719dae3.html

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自雨白的博客小屋！

Newral MMO 强化学习多智能体

相关推荐

Neural MMO 学习笔记(五)

Nerual MMO 学习笔记(三)

Nerual MMO 学习笔记(二)

Neural MMO 学习笔记(一)

论文阅读-分布式强化学习应用于车联边缘计算中的联邦学习

论文阅读:QECO-移动边缘计算(MCE)中基于DRL的面向QoE的计算卸载算法

评论

数据库加载中