美文网首页初见
ML-Agents学习笔记三、训练模型

ML-Agents学习笔记三、训练模型

作者: IT前沿技术分享 | 来源:发表于2020-06-08 21:50 被阅读0次

上文简单的介绍了一个ML-Agents的示例 pyramids,并且查看了示例的成果:预先训练好的模型会根据实际场景进行推理,让代理者神奇在迷宫中躲避各种障碍,不走弯路顺利找到目标。

虽然demo中提供了预先训练好的.nn文件,但是,您肯定会非常好奇,我该如何训练它呢,我们自己创建的其它场景都需要怎么玩呢。

在本节中,我们将演示如何使用ML-Agents Python包中的强化学习算法来完成这一任务。我们提供了一个方便的命令mlagents-learn,它接受用于配置培训和推理阶段的参数。

1、训练模型

  • 打开命令或终端窗口,cd 到 ml-agents 的存储库的文件夹。
    cd D:\develop\AI\MachineLearning\ml-agents-master
    D:

注意:如果遵循默认安装,那么应该能够从任何目录运行mlagents-learn

  • 运行
mlagents-learn /config/Pyramids.yaml --run-id=Pyramids

config/ppo/Pyramids.yaml 是工具包提供的默认训练配置文件的路径。
config/ppo 文件夹包含所有示例环境(包括Pyramids)的培训配置文件。
run-id 是此训练课程的唯一名称。

当屏幕上显示“Start training by pressing the Play button in the Unity Editor”的信息时,您可以在Unity中按Play键开始在编辑器中进行训练。

启动训练后,可以看到小方人在迷宫中开始寻宝啦,再回到终端窗口,可以看到当前训练情况

请注意,随着训练的进行,打印在屏幕上的平均奖励值是如何增加的。这是培训成功的积极信号。

当训练结束后,会有如下生成 Pyramids.nn文件的提示:

2、查看训练成果

Pyramids.nn文件就是我们的训练成果,我们可以把它拷贝到Unity 工程的TFModels目录替换原来的模型,运行,就能看到我们的训练成果了。

注意,一般会给自己的训练模型加个日期,如:Pyramids-20200607.nn,再拷贝过去,这样就能切换模型(切换方法见下图),看看自己的训练成果与官方提供的训练模型的差距,差距不是一般的小,哭!

相关文章

网友评论

    本文标题:ML-Agents学习笔记三、训练模型

    本文链接:https://www.haomeiwen.com/subject/jsbdtktx.html