首页 > 编程语言 > 详细

机器学习实战笔记(Python实现)-07-分类性能度量指标

时间:2017-01-03 17:01:25      阅读:538      评论:0      收藏:0      [点我收藏+]

1、混淆矩阵

下图是一个二类问题的混淆矩阵,其中的输出采用了不同的类别标签

技术分享

常用的衡量分类性能的指标有:

  • 正确率(Precision),它等于 TP/(TP+FP) ,给出的是预测为正例的样本中的真正正例的比例。
  • 召回率(Recall),他等于 TP/(TP+FN),给出的是预测为正例的真实正例占所有真实正例的比例。

2、ROC曲线 

技术分享

 

图中的横轴是伪正例的比例(假阳率=FP/(FP+TN)),而纵轴是真正例的比例(真阳率=TP/(TP+FN))。ROC曲线给出的是当阈值变化时假阳率和真阳率的变化情况。左下角的点所对应的是将所有样例判为反例的情况,而右上角的点对应的则是将所有样例判为正例的情况。虚线给出的是随机猜测的结果曲线。

对不同的ROC曲线进行比较的一个指标是曲线下的面积(Area Unser the Curve)。AUC给出的是分类器的平均性能值,当然它并不能完全代替对整条曲线的观察。一个完美分类器的AUC为1.0,而随机猜测的AUC则为0.5。 

 

 

THE END.

 

机器学习实战笔记(Python实现)-07-分类性能度量指标

原文:http://www.cnblogs.com/hemiy/p/6237539.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!