R语言-回归
定义: 回归是统计学的核心,它其实是一个广义的概念,通常指那些用一个或多个预测变量来预测响应变量.既:从一堆数据中获取最优模型参数 1.线性回归 1.1简单线性回归 案例:女性预测身高和体重的关系 结论:身高和体重成正比关系 1 fit <- lm(weight ~ height,data = women) 2 summary(fit) 3 plot(women$height,women$weight,xlab = ' Height inches ' ,ylab = ' Weight pounds ' ) 4 abline(fit) 1.2添加多项式来提升预测精度 结论:模型的方差解释率提升到99.9%,表示二次项提高了模型的拟合度 1 fit2 <- lm(weight ~ height + I(height^2),data = women) 2 summary(fit2) 3 plot(women$height,women$weight,xlab = ' Height inches ' ,ylab = ' Weight pounds ' ) 4 lines(women$height,fitted(fit2)) 1.3多元线性回归 案例探究:探究美国州的犯罪率和其他因素的关系,包括人口,文盲率,平均收入,天气 结论:谋杀率和人口