首页 > 其他 > 详细

特征归一化的必要性

时间:2020-02-11 15:50:20      阅读:82      评论:0      收藏:0      [点我收藏+]

特征归一化

原因

特征数字差值很大的属性会对计算结果产生很大的影响,当我们认为特征是等权重的时候,因为取值范围不同,因此要进行归一化

例子

time distance weight
1.2 5000 80
1.6 6000 90
1.0 3000 50

例如我们认为,time,distance,weight三个权重是一样的,在做特征分析的时候会明显发现distance对计算结果的影响是最大的。
因此,使用归一化的方法将数值处理到0~1的范围内

最值归一化方法

\(x_{new}\)=(\(x\)-\(x_{min}\))/(\(x_{max}\)-\(x_{min}\))

cle<-function(df){
    df_new<-(df-min(df))/(max(df)-min(df))
    return df_new
}

均值方差归一化方法

\(x_{\text {scale}}=\frac{x-x_{\text {mean}}}{s}\)

cle<-function(df){
    df_new<-(df-mean(df))/std(df)
    return df_new
}

python中提供了standardscaler类可以直接对np对象进行归一化
可以参考

特征归一化的必要性

原文:https://www.cnblogs.com/gaowenxingxing/p/12295207.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!