请问从EM角度理解kmeans? k-means是两个步骤交替进行,可以分别看成E步和M步 M步中将每类的中心更新为分给该类各点的均值,可以认为是在「各类分布均为单位方差的高斯分布」的假设下,最大化似然值; E步中将每个点分给中心距它最近的类(硬分配),可以看成是EM算法中E步(软分配)的近似 为什么kmeans一定会收敛? M步中的最大化似然值,更新参数依赖的是MSE,MSE至少存在局部最优解,必然收敛 kmeans初始点除了随机选取之外的方法? 先层次聚类,再在不同层次上选取初始点进行kmeans聚类