首页 > 其他 > 详细

Linear Regression(线性回归)(二)—正规方程(normal equations)

时间:2014-03-05 01:19:55      阅读:581      评论:0      收藏:0      [点我收藏+]

(整理自AndrewNG的课件,转载请注明。整理者:华科小涛@http://www.cnblogs.com/hust-ghtao/

    在上篇博客中,我们提出了线性回归的概念,给出了一种使代价函数bubuko.com,布布扣最小的方法:梯度下降法。在本篇博客中,我们给出另一种方法:正规方程。

    bubuko.com,布布扣是关于bubuko.com,布布扣的函数,要求此函数的最小值,有人说可以求导啊,另bubuko.com,布布扣,求出相应的bubuko.com,布布扣即可,本文提出的就是此方法。但是由于bubuko.com,布布扣是一个矩阵(向量是特殊的矩阵),我们需要关于矩阵求导方面的知识。

1 矩阵求导

    假设函数bubuko.com,布布扣bubuko.com,布布扣阶矩阵映射到实数空间,我们定义bubuko.com,布布扣对于bubuko.com,布布扣阶矩阵bubuko.com,布布扣求导为:

 

   bubuko.com,布布扣

    所以导函数也是bubuko.com,布布扣阶的矩阵。例如假设:

 

bubuko.com,布布扣

    而bubuko.com,布布扣,求bubuko.com,布布扣:

 

bubuko.com,布布扣

    另外介绍矩阵迹的概念:对于一个bubuko.com,布布扣的矩阵bubuko.com,布布扣,它的迹就是它的对角线的元素求和:

bubuko.com,布布扣,矩阵的迹有如下的性质:

 

bubuko.com,布布扣

   

    上述介绍了矩阵函数的求导法则和矩阵迹的概念,下面给出一些后面要用到的结论:

 

bubuko.com,布布扣

 

2 正规方程

    大家不用太纠结于基础知识,只是一个推到工具而已,下面才是正题。磨好工具,就去砍柴吧:

    我们的任务是对代价函数求导:即令bubuko.com,布布扣,然后解出bubuko.com,布布扣。给定训练集,定义设计矩阵(design matrix)bubuko.com,布布扣,其中bubuko.com,布布扣是输入特征的维数,bubuko.com,布布扣是训练集中训练样本的个数。将bubuko.com,布布扣写成下列形式:

 

bubuko.com,布布扣

    同样,定义目标向量:

 

bubuko.com,布布扣 ,由于bubuko.com,布布扣,于是得到:

 

bubuko.com,布布扣

 

    另外对于向量bubuko.com,布布扣,我们有bubuko.com,布布扣,所以:

 

bubuko.com,布布扣 

    由bubuko.com,布布扣 显然:bubuko.com,布布扣   (1),

 

so

bubuko.com,布布扣   注意在推导过程中,步骤4我们用到了公式(1),bubuko.com,布布扣。令导函数的值为0,我们得到正规方程:

bubuko.com,布布扣

 

    解出:

bubuko.com,布布扣 好了,这就是我们要学习的bubuko.com,布布扣

   

    总结一下:整篇充斥着公式推导,但思路很简单:欲求代价函数的最小值,令其导函数为0,求出参数即可。最后提点建议,机器学习中是有很多公式推倒的内容,本人认为结论固然重要,但得来的过程也很重要,只有知其然并知其所以然,才能对背后的思想有更深刻的认识。检验自己是否弄懂了公式:看自己能否独立推导出结果。

Linear Regression(线性回归)(二)—正规方程(normal equations),布布扣,bubuko.com

Linear Regression(线性回归)(二)—正规方程(normal equations)

原文:http://www.cnblogs.com/hust-ghtao/p/3580188.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!