murder

R语言-回归

家住魔仙堡 提交于 2021-01-06 10:46:43
定义:   回归是统计学的核心,它其实是一个广义的概念,通常指那些用一个或多个预测变量来预测响应变量.既:从一堆数据中获取最优模型参数 1.线性回归   1.1简单线性回归   案例:女性预测身高和体重的关系   结论:身高和体重成正比关系 1 fit <- lm(weight ~ height,data = women) 2 summary(fit) 3 plot(women$height,women$weight,xlab = ' Height inches ' ,ylab = ' Weight pounds ' ) 4 abline(fit)   1.2添加多项式来提升预测精度    结论:模型的方差解释率提升到99.9%,表示二次项提高了模型的拟合度 1 fit2 <- lm(weight ~ height + I(height^2),data = women) 2 summary(fit2) 3 plot(women$height,women$weight,xlab = ' Height inches ' ,ylab = ' Weight pounds ' ) 4 lines(women$height,fitted(fit2))   1.3多元线性回归   案例探究:探究美国州的犯罪率和其他因素的关系,包括人口,文盲率,平均收入,天气   结论:谋杀率和人口