评价分类与预测算法的指标
分类与预测模型对训练集进行预测而得出的准确率并不能很好地反映预测模型未来的性能,为了有效判断一个预测模型的性能表现,需要一组没有参与预测模型建立的数据集,并在该数据集上评价预测模型的准确率,这组独立的数据集叫做测试集。模型预测效果评价,通常用相对/绝对误差、平均绝对误差、均方误差、均方根误差、平均绝对百分误差等指标来衡量。 1、绝对误差与相对误差 设$Y$表示实际值,$\hat{Y}$表示预测值,则$E$为绝对误差,其计算公式为:$E=Y-\hat{Y}$ $e$为相对误差,其计算公式为:$e=\frac{Y-\hat{Y}}{Y}$ 2、平均绝对误差 平均误差的计算公式为:$MAE=\frac{1}{n} \sum_{i=1}^{n}\left|E_{i}\right|=\frac{1}{n} \sum_{i=1}^{n}\left|Y_{i}-\hat{Y}_{i}\right|$ 其中,$MAE$表示平均绝对误差,$E_{i}$表示第$i$个实际值与预测值的绝对误差,$Y_{\mathrm{i}}$表示第$i$个实际值,$\hat{Y}_{i}$表示第$i$个预测值。 由于预测误差有正有负,为了避免正负相抵消,故 取误差的绝对值进行综合并取其平均数 ,这是误差分析的综合指标法之一。 3、均方误差 均方误差的计算公式为:$MSE=\frac{1}{n