ML之Clustering之K-means：K-means算法简介、应用、经典案例之详细攻略（一）

更新时间：2022-09-16 10:00:08

K-means算法简介

K-均值是著名聚类算法，它找出代表聚类结构的k个质心。如果有一个点到某一质心的距离比到其他质心都近，这个点则指派到这个最近的质心所代表的簇。依次，利用当前已聚类的数据点找出一个新质心，再利用质心给新的数据指派一个簇。

上图所示，用“x”表示聚类质心，用点表示训练样本：

a) 原始数据集

b) 随机初始化聚类质心

c) (c-f)k-均值迭代2次的示意图

在每次迭代中每个训练样例都被指派到一个最近的聚类质心，每个聚类质心被移动到分配给它的点的平均值的位置。

ML之Clustering之K-means：K-means算法简介、应用、经典案例之详细攻略（一）

ML之Clustering之K-means：K-means算法简介、应用、经典案例之详细攻略（一）

ML之Clustering之K-means：K-means算法简介、应用、经典案例之详细攻略（一）