首页 > 其他 > 详细

鸢尾花数据(PCA主成分分析)

时间:2019-10-11 18:26:14      阅读:455      评论:0      收藏:0      [点我收藏+]

1.导包

技术分享图片

2.提取数据

技术分享图片

 3.PCA降维

3.1  调用PCA

技术分享图片

 3.2  绘图

技术分享图片

 技术分享图片

提取两个主成分的累计贡献率达到了0.9777,说明主成分的解释效果较好。

 4  贡献率曲线

当参数n_components中不填写任何值时,默认返回min(X.shape)个特征。一般来说,样本量都会大于特征数目,所以什么都不填就相当于转换了新特征空间,但没有减少特征的个数。一般不会使用这种输入?式。但我们可以使用这种?式来画出累计可解释?差贡献率曲线,以此选择最好的n_components取值。

技术分享图片

 技术分享图片

 从累计贡献率曲线可以看出提取两个主成分的累计贡献率达到0.9777,提取四个主成分的累计贡献率为0.9948,增加两个主成分累计贡献率只增加0.0171,但同时却增加了模型复杂度,加大计算量,增加运行时间,所以提取二个主成分最为合适。

 

鸢尾花数据(PCA主成分分析)

原文:https://www.cnblogs.com/lvzw/p/11655902.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!