knn算法的优缺点

别来无恙 提交于 2020-01-11 05:42:03

简述K近邻算法的优缺点

优点

1、简单,易于理解,易于实现。
2、只需保存训练样本和标记,无需估计参数,无需训练。
3、不易受小错误概率的影响。经理论证明,最近邻的渐进错误率最坏时不超过两倍的贝叶斯错误率,最好时接近或达到贝叶斯错误率。

缺点

1、K的选择不固定。
2、预测结果容易受含噪声数据的影响。
3、当样本不平衡时,新样本的类别偏向训练样本中数量占优的类别,容易导致预测错误。
4、具有较高的计算复杂度和内存消耗,因为对每一个待分类的文本,都要计算它到全体已知样本的距离,才能求得它的K个最近邻。

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!