首页 > 其他 > 详细

强化学习精要第一二章

时间:2019-09-12 17:37:06      阅读:74      评论:0      收藏:0      [点我收藏+]

1、np.dot的用法,用于向量的时候是点积,用于矩阵的时候是矩阵的乘法,一个向量只有一行的时候,它的shape是(列数, )

2、matplot画图,更改图中的字体,

mpl.rcParams[‘font.sans-serif‘] = [‘WenQuanYi Micro Hei‘] #指定默认字体WenQuanYi Micro Hei中文,DejaVu Sans英文

https://www.jianshu.com/p/240ea3ae0dc9(查看字体、负号的问题)

如果有多条直线,一般用不同的linespace表示,‘--’、‘:’

3、np.log2:以对数为底

np.meshgrid(x,y):坐标矩阵

4、KL散度的性质:非负,两个分布越接近,散度越小,分布越远,散度越大

5、损失函数有两种:平方损失函数和交叉熵损失函数,回归问题损失函数是平方损失函数,分类问题损失函数是交叉熵损失函数

 

 


 

强化学习精要第一二章

原文:https://www.cnblogs.com/lin-kid/p/11511491.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!