k均值聚类算法

有些话、适合烂在心里 提交于 2019-11-29 12:06:29
  • 步骤

1.随机选择k个初始点作为聚类中心

2.将数据中每个对象赋予给最近的聚类中心

3.每一类数据求取质心,作为新的聚类中心

4.重复2和3,直到满足结束条件(迭代步数或者最终的聚类中心变化较小或者误差平方和变化较小)

注意:1.这里初始化是随机的,这会导致局部最优解,可以通过不断地做2均值聚类来提高性能,这是二分k均值算法,每次选择聚类后误差平方和最小的方式做2均值聚类

           2.使用误差平方和,也就是每一类的数据点的方差之和作为衡量聚类效果的指标

问题:如何保证多次迭代后一定会使得误差平方和稳定?

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!