机器学习周志华——模型评估与选择
(1)经验误差与过拟合 错误率error rate:分类错误的样本数占样本总数的比例a。 精度accuracy:分类正确的样本数占样本总数的比例1-a。 误差error:|实际预测输出-样本真实输出| 训练误差training error或经验误差empirical error:学习器在训练集上的误差 泛化误差generalization error:在新样本上的误差 学习的理想情况:从训练样本中尽可能学出适用于所有潜在样本的“普通规律” 过拟合(overfitting):学习器把训练样本学的“太好”,很可能导致已将训练样本自身一些特点当作了潜在样本的共性,如些导致泛化性能下降。由于学习能力太强导致。 欠拟合underfitting:对训练样本的一般性质未学好。通常由于学习能力低下导致。 欠拟合比较容易解决,过拟合则不太好解决,过拟合是机器学习面临的关键障碍,但过拟合是无法彻底避免的。 现实学习任务中,选择学习算法及确定参数配置即是“模型选择”(model selection)问题。 (2)模型评估 由于无法获取所有样本上的泛化误差,因此一般只能以测试集上的“测试误差”(testing error)作为泛化误差的近似。 测试集应尽可能与训练集互斥,即测试样本未在训练中使用过。 针对m个样本的数据集D={( x 1 , y 1 ),( x 2 , y 2 ),…,( x m , y