简述K近邻算法的优缺点
优点
1、简单,易于理解,易于实现。
2、只需保存训练样本和标记,无需估计参数,无需训练。
3、不易受小错误概率的影响。经理论证明,最近邻的渐进错误率最坏时不超过两倍的贝叶斯错误率,最好时接近或达到贝叶斯错误率。
缺点
1、K的选择不固定。
2、预测结果容易受含噪声数据的影响。
3、当样本不平衡时,新样本的类别偏向训练样本中数量占优的类别,容易导致预测错误。
4、具有较高的计算复杂度和内存消耗,因为对每一个待分类的文本,都要计算它到全体已知样本的距离,才能求得它的K个最近邻。
来源:CSDN
作者:恰巧偶遇
链接:https://blog.csdn.net/weixin_44420421/article/details/103876730