且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

ML之Clustering之K-means:K-means算法简介、应用、经典案例之详细攻略(一)

更新时间:2022-09-16 10:00:08

K-means算法简介

ML之Clustering之K-means:K-means算法简介、应用、经典案例之详细攻略(一)



       K-均值是著名聚类算法,它找出代表聚类结构的k个质心。如果有一个点到某一质心的距离比到其他质心都近,这个点则指派到这个最近的质心所代表的簇。依次,利用当前已聚类的数据点找出一个新质心,再利用质心给新的数据指派一个簇。

       上图所示,用“x”表示聚类质心,用点表示训练样本:


a) 原始数据集

b) 随机初始化聚类质心

c) (c-f)k-均值迭代2次的示意图

       在每次迭代中每个训练样例都被指派到一个最近的聚类质心,每个聚类质心被移动到分配给它的点的平均值的位置。


1、K-means算法适用的数据类型

ML之Clustering之K-means:K-means算法简介、应用、经典案例之详细攻略(一)


2、K-Means算法的全局最优解和局部最优解的比较

ML之Clustering之K-means:K-means算法简介、应用、经典案例之详细攻略(一)




1、K-means算法的过程及其主要思路


ML之Clustering之K-means:K-means算法简介、应用、经典案例之详细攻略(一)


ML之Clustering之K-means:K-means算法简介、应用、经典案例之详细攻略(一)