线性相关|回归分析|
生物统计学 ----- 相关与回归 描述和预测统计之后,相关与回归预测变量之间的关系。 相关关系是变量间关系不能用函数精确表达,即不一一对应而是点分布在直线周围。 评价指标是相关系数,有总体相关系数和样本相关系数 , 协方差的正负性与相关系数的正负性同步,当相关系数为 0 时虽然无线性相关,但是可能存在其他非线性关系: 相关系数具有对称性,改变坐标系和尺度不改变 r 大小(但协方差不满足该性质,只能表明某两个因素有线性相关性,但不一定因果关系。通常,还会对相关系数做假设检验。 回归方程进行预测是从一组样本出发,在筛选得到教较有影响力的因素后建立方程,利用回归方程由自变量得到因变量的结果。与相关区别在于线性相关中 x 、 y 是平等的且都是随机变量,而在回归中要求 x 是自变量且是否是随机变量都无所谓, y 是被解释的必须是随机变量。线性相关是用于描述的,而回归分析是用于描述和预测的。 回归分析类型可以是一元或多元的。 回归模型中, X 是自变量。 y 是因变量。 是 误差项,随机因素,是用来不能用线性关系解释的部分,满足均值为零方差相同的正态分布,是独立的。 但是每个 x 得到的信息都不相关独立,输入 x 得到的是所有可能 y 的均值。 求两个系数使用拉格朗日乘法(最小二乘法),即偏导数为零的点,得到系数。 离差平方和的分解,即 SST=SSR+SSE 。 SST