更新时间:2022-09-16 10:00:08
K-均值是著名聚类算法,它找出代表聚类结构的k个质心。如果有一个点到某一质心的距离比到其他质心都近,这个点则指派到这个最近的质心所代表的簇。依次,利用当前已聚类的数据点找出一个新质心,再利用质心给新的数据指派一个簇。
上图所示,用“x”表示聚类质心,用点表示训练样本:
a) 原始数据集
b) 随机初始化聚类质心
c) (c-f)k-均值迭代2次的示意图
在每次迭代中每个训练样例都被指派到一个最近的聚类质心,每个聚类质心被移动到分配给它的点的平均值的位置。