一、回归算法
1.1 一元线性回归
最小二乘法:
通过使因变量的真实值和估计值之间的离差平方和达到最小来求 β0 和 β1
1.2 多元回归(今天先略过)
通过矩阵来求解最小二乘法
二、回归算法相关函数
使用 R 自带的 women 数据集
一元线性回归
# 模型创建 fit1 = lm(weight~.,data=women)
# 查看拟合结果 plot(women) abline(fit1)
发现点有些弯曲,可能存在二次关系
去除截距项的方法
# 除去截距项 fit2 = lm(weight~-1+height,data=women)
一元二次回归
# 模型创建 fit3 = lm(weight~.+I(height^2),data=women)
使用 summary 查看回归模型的信息
summary(fit3)
Tip:
R方:(决定系数、拟合优度)拟合出来的结果解释了多少数据点中的信息(代表拟合程度,越接近1越好):可以用来评估模型拟合的好不好
F值:所有的参数是否为零(是否接受0假设),越小越拒绝0假设,检验模型整体指标的值
模型诊断
par(mfrow=c(2,2)) # par设置图片格式的函数(2*2的版式) plot(fit3)
Tip:
A :检查整体的拟合情况
B :点越呈对角线分布,说明数据越呈正态分布
C :曲线波动越明显,越可能异方差
D :落在虚线外的点为异常值、离群值
回归的预测函数
lm.pred = predict(fit3, women)
如需预测区间:
interval :给出相应的预测区间
level:置信水平
lm.pred = predict(fit3, women, interval="prediction", level=0.95) lm.pred
困了...今天先到这啊哈
三、模型选择
四、回归诊断
原文:https://www.cnblogs.com/ykit/p/12500274.html