Skip to content

Latest commit

 

History

History
10 lines (8 loc) · 667 Bytes

File metadata and controls

10 lines (8 loc) · 667 Bytes

请问从EM角度理解kmeans?

  • k-means是两个步骤交替进行,可以分别看成E步和M步
  • M步中将每类的中心更新为分给该类各点的均值,可以认为是在「各类分布均为单位方差的高斯分布」的假设下,最大化似然值;
  • E步中将每个点分给中心距它最近的类(硬分配),可以看成是EM算法中E步(软分配)的近似

为什么kmeans一定会收敛?

M步中的最大化似然值,更新参数依赖的是MSE,MSE至少存在局部最优解,必然收敛

kmeans初始点除了随机选取之外的方法?

先层次聚类,再在不同层次上选取初始点进行kmeans聚类