ML-Agents学习笔记二：UNITY实例工程简介

作者: IT前沿技术分享 | 来源:发表于2020-06-08 21:34 被阅读0次

ML-Agents学习笔记二：UNITY实例工程简介
2018-06-28
这是份值得收藏的Unity强化学习指南！
ML-Agents学习笔记一：开发环境
Unity ML-Agents之Academy设计
Unity官方实例教程 Roll-a-Ball（一）
9/6 第二天笔记-----Ubuntu系统
Unity shader基础学习(三) ------ 数学基础
Unity引擎 —— LeapMotion开发
Unity shader基础学习(二) ------ Unity

上文已经介绍了，如何搭建一个ML-Agents的开发环境，接下来，我们进入主题，开始利用demo来学习，如何利用ML-Agents进强化学习训练。

1、ML-Agents工具包目录

在我们下载的工具包中，包含一个 Unity Project 的目录，

如果你熟悉Unity工程的话，很明显能看出来这是个unity的工程，上文也提到，这个是ml-agents 的unity demo，

image-20200605201548636.png

包含几个若干个示例，突出显示工具包的各种特性，这里将挑选其中一个，训练一个代理，并将训练好的模型嵌入到Unity环境中的端到端过程。

2、用Unity加载Demo

运行 Unity Hub
在项目对话框中, 点击添加

image-20200605203546747.png

在项目窗口中，进入工具包的project目录，打开即可

image-20200605203627967.png

打开工程后，我们选择 pyramids 这个demo

image-20200605204037183.png

双击 pyramids场景，点击播放，就能看到一个方形头在追着一个一个的彩色目标进行撞击

image-20200605204425573.png

你会发现，它很少走冤枉路，这个就利用ML-Agents预先训练好的模型(.nn 文件，存放在TFModels目录下)，应用到实际场景的推理。

image-20200606165824638.png

3、ML-Agents 的Unity环境

这里介绍一下ML—Agents 的Unity环境，它包含一个或多个Agent对象的场景，包括Agent与之交互的其他实体。

在打开pyramids场景后，您可能会注意到的第一件事是，它包含了多个Agent训练迷宫AreaPB++，而不是一个。场景中的每个Agent训练迷宫都包含一个独立的agent，但是它们都有相同的行为，这样可以过个Agent同时训练，速训练，因为16个agent都是并行进行训练的。