首页 > 其他 > 详细

局部加权回归

时间:2015-03-27 01:14:00      阅读:293      评论:0      收藏:0      [点我收藏+]

通常情况下的线性拟合不能很好地预测所有的值,因为它容易导致欠拟合(under fitting),比如数据集是

一个钟形的曲线。而多项式拟合能拟合所有数据,但是在预测新样本的时候又会变得很糟糕,因为它导致数据的

过拟合(overfitting),不符合数据真实的模型。

 

今天来讲一种非参数学习方法,叫做局部加权回归(LWR)。为什么局部加权回归叫做非参数学习方法呢? 首

先参数学习方法是这样一种方法:在训练完成所有数据后得到一系列训练参数,然后根据训练参数来预测新样本

的值,这时不再依赖之前的训练数据了,参数值是确定的。而非参数学习方法是这样一种算法:在预测新样本值

时候每次都会重新训练数据得到新的参数值,也就是说每次预测新样本都会依赖训练数据集合,所以每次得到的

参数值是不确定的。

 

 

接下来,介绍局部加权回归的原理。

 

之前在普通的线性拟合中,我们得到了最小二乘的损失函数为

 

      技术分享

 

找到合适的参数技术分享使得上述损失函数最小即可。而在局部加权回归中,损失函数变为

 

      技术分享

 

其中技术分享的表达式如下

 

      技术分享

 

上式中参数技术分享为新预测的样本特征数据,它是一个向量,参数技术分享控制了权值变化的速率,权值有一个性质

 

     (1)如果技术分享,则技术分享

     (2)如果技术分享,则技术分享

 

所以,对于离预测样本数据技术分享较近的点权值较大,离预测样本数据技术分享较远的点权值较小。

 

很明显,局部加权回归在每一次预测新样本时都会重新确定参数,以达到更好的预测效果。当数据规模比较大的

时候计算量很大,学习效率很低。并且局部加权回归也不是一定就是避免underfitting

 

 

局部加权回归

原文:http://blog.csdn.net/acdreamers/article/details/44662753

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!