MARL周报(4)

目前许多框架是以petting zoo为基本搭建的。目前petting zoo对windows并不是很友善，MADDPG的论文MPE环境就是基于它的。同时，面对大规模多智能体，除了NMMO外，还有MAgent。游戏环境，星际争霸2因为暴雪停服而凉了，此外还有Unity ML-Agents。

这两周尝试了Unity ML-Agents，也折腾了好久跑通了，并且有了结果：

但是！这个环境如果要自定义算法的话非常麻烦，内置算法只有PPO，也翻阅了哔哩哔哩一些up的资料，都说unity ml-agents的环境很难自定义修改..因此尝试了两周不得不放弃了。

另外，这些环境很多在windows都是跑不通的，只能开着虚拟机去运行。。Magent的环境更是重量级，它现在迁移到v2.0版本了，但是pip install的包和它github的包竟然严重不一致以至于必须自己手动复制到site-package里。