首页 > 其他 > 详细

深度强化学习入门笔记

时间:2020-02-07 12:15:16      阅读:138      评论:0      收藏:0      [点我收藏+]

一、深度强化学习( DRLDRLDRL)

传统强化学习:真实环境中的状态数目过多,求解困难。
深度强化学习:将深度学习和强化学习结合在一起,通过深度神经网络直接学习环境(或观察)与状态动作值函数Q(s,a)之间的映射关系,简化问题的求解

Deep Q Network(DQN)

Deep Q Network(DQN):是将神经网络(neural network)和Q-1earning结合,利用神经网络近似模拟函数Q(s,a),输入是问题的状态(e.g.,图形),输出是每个动作a对应的Q值,然后依据Q值大小选择对应状态执行的动作,以完成控制。
神经网络的参数:应用监督学习完成

DQN学习过程

    技术分享图片

 

DQN算法流程

技术分享图片

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 技术分享图片

 

深度强化学习入门笔记

原文:https://www.cnblogs.com/tianqianlan/p/12271683.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!