美文网首页深度学习
强化学习(1)概述

强化学习(1)概述

作者: zidea | 来源:发表于2019-08-16 21:48 被阅读14次
MachineLearninginMarketing

强化学习通过自己进行学习,属于无监督学习,计算机在过程中不断尝试和摸索来尝试学习。这里有一位评审员对你的行为进行打分。我们正确行为会的得到高分,可以暂时这么理解,所有强化学习具有分数导向性。

在监督学习中已经有了数据和数据对应标签,强化学习需要一次一次地尝试获取数据和其对应的标签。
强化学习中包含许多算法

基于价值选行为的算法

  • Q learning (基于表格)
  • Sarsa
  • Deep Q Network (基于神经网络)

基于选行为

Policy Gradients

想象环境

Model based RL

为什么学习强化学习

一切都是因深度学习,强化学习也是因为深度学习出现才有质的飞跃。强化学习是数据小或者我们也没有经验的事物上采用强化学习可以得到好的结果。

需要了解哪些 python 库

  • Numpy 数据处理
  • Pandas 数据处理
  • Matplotlib 数据开可视化
  • Tkinter 编写模拟环境
  • Tensorflow
  • OpenAI gym 提供了很多现成的模拟环境

相关文章

  • 强化学习(1)概述

    强化学习通过自己进行学习,属于无监督学习,计算机在过程中不断尝试和摸索来尝试学习。这里有一位评审员对你的行为进行打...

  • 强化学习笔记(1)--概述

    目录: 强化学习问题 强化学习的组成 智能体的组成 强化学习分类 强化学习一些重要概念 1. 强化学习问题 面向智...

  • Deep Q-learning Network(DQN)

    概述 DQN其实是深度学习和强化学习知识的结合,也就是用Deep Networks框架来近似逼近强化学习中的Q v...

  • 单步强化学习在糖豆推荐系统的应用

    1.强化学习基础 1.1 强化学习概念 强化学习通常用马尔科夫决策过程(Markov Desicision Pro...

  • 讲人话系列——DQN初探之2048

    概述 强化学习也火了好久,最近才有空来充充电。老实说,最开始强化学习的知识点还挺多的,看了好久也没太弄清楚几个算法...

  • 强化学习(1)

    在开始之前个人觉得有必要把概念给大家说清楚,用大写字母表示一类事物的集合,用小写字母表示一类事物的实例。 在强化学...

  • 强化学习(1)

    涵盖内容 学会如何把生活中具体问题来强化学习来描述 介绍强化学习的核心内容 经典条件反射 操作条件反射 Qlear...

  • 2019年上半年收集到的人工智能强化学习干货文章

    2019年上半年收集到的人工智能强化学习干货文章 从0到1-强化学习篇 关于人工智能中强化学习的扫盲 强化学习简介...

  • 基于Python的深度学习 刘哲宁

    深度强化学习 1 强化学习是一种什么样的方法 强化学习作为一个序列决策(Sequential Decision M...

  • 强化学习(Reinforcement Learning)中的Q-

    1. 什么是强化学习 其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcement Lear...

网友评论

    本文标题:强化学习(1)概述

    本文链接:https://www.haomeiwen.com/subject/tktajctx.html