首页 > 编程语言 > 详细

聚类算法K-means

时间:2015-06-05 14:07:14      阅读:245      评论:0      收藏:0      [点我收藏+]

顾名思义,这个算法是与K相关的一个方法,事实也是如此。

对于一个大的集群,该方法通过对以下三步的不停迭代得出结果:

  1. 确定K值,K值表示需要将这个大的集群分成多少个小的簇(聚类)。然后虚拟K个中心位于集群坐标系内。

  2. 计算集群坐标系内所有点与K个中心点的位置,将距离中心点最近的点划归一簇。

  3. 根据每一簇的所有点计算这一簇的重心,将其作新的K个中心点重复这一过程。


为何要迭代

经过证明,算法是必然收敛的。意思也就是说,在N次迭代后,K个中心点都趋于稳定,不会发生大的变动。


缺点

不适合在坐标系中呈现形状怪异的集群

不适合有属性参数间距过大的集群


聚类算法K-means

原文:http://my.oschina.net/sitan/blog/425190

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!