k均值聚类算法
步骤 1.随机选择k个初始点作为聚类中心 2.将数据中每个对象赋予给最近的聚类中心 3.每一类数据求取质心,作为新的聚类中心 4.重复2和3,直到满足结束条件(迭代步数或者最终的聚类中心变化较小或者误差平方和变化较小) 注意:1.这里初始化是随机的,这会导致局部最优解,可以通过不断地做2均值聚类来提高性能,这是二分k均值算法,每次选择聚类后误差平方和最小的方式做2均值聚类 2.使用误差平方和,也就是每一类的数据点的方差之和作为衡量聚类效果的指标 问题:如何保证多次迭代后一定会使得误差平方和稳定? 来源: https://blog.csdn.net/math_computer/article/details/100807053