机器学习面试--算法评价指标
机器学习分为三个阶段 : 第一阶段: 学习模型 。采用学习算法,通过对训练集进行归纳学习得到分类模型; 第二阶段: 测试模型 。将已经学习得到的分类模型用于测试集,对测试集中未知类别的实例进行分类。 第三阶段: 性能评估 。显然,通过测试集产生的分类未必是最佳的,这就导致对测试集的分类可能产生错误。而人们希望尽量得到信呢个最佳的分类模型,就是的对分类器性能评价至关重要。只有通过优秀的评价标准才能选择出性能更好的分类器。 不同机器学习算法的评价指标: 回归是对连续的实数值进行预测,即输出值是连续的实数值,而分类中是离散值。 (1)平均绝对误差(Mean Absolute Error,MAE)又被称为 l1 范数损失(l1-norm loss) (2)平均平方误差(Mean Squared Error,MSE)又被称为 l2 范数损失(l2-norm loss) 计算公式 : Accuracy = (TP+TN)/(TP+TN+FP+FN) 在 正负样本不平衡 的情况下,准确率这个评价指标有很大的缺陷。比如在互联网广告里面,点击的数量是很少的,一般只有千分之几,如果用Accuracy,即使全部预测成负类(不点击)Accuracy也有 99% 以上,没有意义。 定义 :正确分类的正例个数占分类为正例的实例个数的比例,也称 查准率 。 计算公式 : TP/(TP+FP) 定义