进一寸有一寸的欢喜

进一寸有一寸的欢喜

作者: 吕鹏_hunhun | 来源:发表于2017-04-23 20:28 被阅读167次

成长语录
2018.10.5
无标题文章
2017-09-12
别怕，进一寸有进一寸的欢喜
明知真理无穷，进一寸有一寸的欢喜
进步
求知
怕什么真理无穷
2019-03-06

之前一直理解的actor-critic的算法就像网上的经典图：

actor是一个policy的（深度神经）网络，critic的是一个价值或者Q网络。比如像DDPG和A3C里面提到的那样算法：

联系增强学习的一些相关actor-critic的算法分析和上图DDPG和A3C的算法框架，我一直都认为actor和critic是各自独立的网络，算法中两个网络也是独立更新的。后面再看Sim-to-Real Robot Learning from Pixels with Progressive Nets这篇文章时，对下面的图：

在这篇文章中同一个网络输出策略和价值，我还认为他们画的是简图。直到最近看REINFORCEMENT LEARNING WITH UNSUPERVISED AUXILIARY TASKS和LEARNINGTO NAVIGATEIN COMPLEX ENVIRONMENTS，如下的图：

这一系列的论文中提到的actor-critic的网络是一个共享参数的网络，我找了一段时间，也没有看到具体的出处，看github上别人的代码确实是这样实现的：

也就是说actor和critic是共享一个网络的，网络更新是根据两者的loss和来做反向传递的，不过actor的loss要仔细一点才行。注意负号的含义。

对别人来说，可能就是这样啊，对我来说，进一寸有一寸的欢喜。

相关文章

成长语录
进一寸有进一寸的欢喜
2018.10.5
心进一寸有进一寸的欢喜！
无标题文章
知足常乐，进一寸有进一寸的欢喜
2017-09-12
怕什么困难无穷，进一寸有进一寸的欢喜
别怕，进一寸有进一寸的欢喜
怕什么真理无穷，进一寸有进一寸的欢喜。 ...
明知真理无穷，进一寸有一寸的欢喜
明知真理无穷，进一寸有一寸的欢喜
进步
怕什么真理无穷，进一寸有进一寸的欢喜胡适先生说
求知
怕什么真理无穷，进一寸有一寸的欢喜。
怕什么真理无穷
怕什么真理无穷，进一寸有一寸的欢喜。
2019-03-06
怕什么真理无穷，进一寸有一寸的欢喜

网友评论

本文标题：进一寸有一寸的欢喜

本文链接：https://www.haomeiwen.com/subject/wmiyzttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|进一寸有一寸的欢喜|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！