非线性回归结果分析

眉间皱痕 提交于 2020-02-08 18:42:02

最近发现一个特别好用的统计软件——minitab
在他的帮助文档中,很好的总结了如何比较拟合结果的好坏
以下为具体网址:https://support.minitab.com/zh-cn/minitab/18/help-and-how-to/modeling-statistics/regression/how-to/nonlinear-regression/interpret-the-results/key-results/#step-3-determine-how-well-the-model-fits-your-data
我们在非线性和线性拟合后,会得到残差平方和、决定系数R方等等,之前我一直用前两个来比较拟合优度,但是对于不同的拟合方程,他们的残差平方和也不同。当我们确定一个线性模型与数据的吻合程度时,几乎会将所有注意力集中在R-squared上。但是,以前我曾经说过R-squared被高估了。下面会提供一些其他的方法。

简单概述概述一下。
在此之前需要明白几个术语:
其他参数见网址:(https://support.minitab.com/zh-cn/minitab/18/help-and-how-to/modeling-statistics/regression/how-to/fitted-line-plot/methods-and-formulas/methods-and-formulas/
响应变量:因变量y
预测变量:自变量x
回归标准误差(S):S表示的是观测值到回归线的平均距离,简单的说 ,它告诉你使用回归模型预测响应变量的平均误差。S越小,模型越好,因为它表明,观察值更接近拟线。
(https://img-blog.csdnimg.cn/20200208173014492.png)
转自:https://zhuanlan.zhihu.com/p/42074332

———————————————————————————————————————————————

解释非线性回归的主要结果

目录:

步骤 1:确定回归线是否与数据拟合
步骤 2:检查预测变量与响应变量之间的关系
步骤 3:确定模型对数据的拟合优度
步骤 4:确定模型是否符合分析的假设条件

步骤一:确定回归线是否与数据拟合

如果非线性模型包含一个预测变量,Minitab 会显示拟合线图来表明响应和预测变量数据之间的关系。该图包含回归线,代表回归方程。您可以选择在图中显示 95% 的置信区间和预测区间。

评估模型与数据的拟合优度以及模型是否符合您的目标。检查拟合线图来确定是否符合下列标准:
1、具有足够多的观测值来进行拟合
2、模型与数据中的任何弯曲正确拟合。要确定最佳模型,请在数据包含仿行的情况下,检查图、回归标准误 (S) 以及失拟检验。
3、查找任何异常值,这些值可能对结果产生较强的效应。尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除与异常的单次事件(也称为特殊原因)相关联的数据值。然后,重新执行分析。有关检测异常值的更多信息,请转到异常观测值(https://support.minitab.com/zh-cn/minitab/18/help-and-how-to/modeling-statistics/regression/supporting-topics/model-assumptions/unusual-observations/

步骤 2:检查预测变量与响应变量之间的关系

回归方程是回归线的代数表示。将每个预测变量的值输入方程可计算平均响应值。与线性回归不同,非线性回归方程可以采取多种不同形式。

例如:
方程
膨胀系数 = (1.07764 - 0.122693 * 开尔文温度 + 0.00408638 * 开尔文温度 ** 2 -
1.42627e-006 * 开尔文温度 ** 3) / (1 - 0.00576099 * 开尔文温度 +
0.000240537 * 开尔文温度 ** 2 - 1.23144e-007 * 开尔文温度 ** 3)
主要结果:方程
在这些结果中,存在一个预测变量和七个参数估计值。响应变量是膨胀量,预测变量是开尔文温度。这个冗长的方程描述了响应变量和预测变量之间的关系。开尔文温度每提高一度对于铜膨胀的影响高度取决于起始温度。变化的温度对铜膨胀的影响作用不太容易总结。请评估拟合线图来查看预测变量和响应变量之间的关系。
如果向方程中输入开尔文温度值,结果为铜膨胀的拟合值

如果需要确定参数估计值是否在统计意义上显著,请使用参数的置信区间。如果此范围不包含原假设值,则参数的统计意义显著。Minitab 无法计算非线性回归中参数的 p 值。对于线性回归,每个参数的原假设值均为 0(没有效应),而且 p 值以此值为基础。但是,在非线性回归中,每个参数的正确原假设值取决于预期函数以及参数在预期函数中的位置。

步骤 3:确定模型对数据的拟合优度

要确定模型对数据的拟合优度,请检查模型汇总表和失拟表中的统计量。

S
使用 S 可评估模型描述响应值的程度。

S 以响应变量的单位进行度量,它表示数据值与拟合值的距离。S 值越低,模型描述响应的程度越高。但是,自身低 S 值并不表明模型符合模型假设。您应检查残差图来验证假设。

失拟
当数据包含仿行时,Minitab 会自动显示失拟表。仿行是多个具有相同预测变量值的观测值。如果您的数据不包含仿行,那么不可能计算执行此检验所需的纯误差。仿行的不同响应值代表纯误差,因为只有随机变异可以导致观测响应值之间的差异。

要确定模型是否正确地指定响应与预测变量之间的关系,请将失拟检验的 p 值与显著性水平进行比较以评估原假设。失拟检验的原假设声明模型正确指定了响应与预测变量之间的关系。通常,显著性水平(用 alpha 或 α 表示)为 0.05 即可。显著性水平 0.05 指示在模型正确指定响应与预测变量之间的关系时得出模型未正确指定此关系的风险为 5%。
P 值 ≤ α:失拟在统计意义上显著
如果 p 值小于或等于显著性水平,则得出模型未正确指定关系的结论。要改善模型,可能需要添加项或者变换数据。
P 值 > α:失拟在统计意义上不显著
如果 p 值大于显著性水平,则检验不检测任何失拟。

步骤 4:确定模型是否符合分析的假设条件

使用残差图可帮助您确定模型是否适用并符合分析的假设。如果不符合此假设,则模型可能无法充分拟合数据,在解释结果时应当格外小心。
此处具体内容见网址(https://support.minitab.com/zh-cn/minitab/18/help-and-how-to/modeling-statistics/regression/how-to/nonlinear-regression/interpret-the-results/all-statistics-and-graphs/residual-plots/

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!