无监督学习
衡量:处理不规则形状,噪音点
相似的物品成一类,不相似的物品不成一类
K-Means
步骤:
随机选K个聚集点
每个数据被赋值最近聚集点类别
使用每个聚集中心点更新
重复直到聚点不再移动
返回K个中心点坐标
优点:简单,对于规则性图形聚类很好,收敛性号 O(t k n)
缺点:定K值,可能收敛到局部最优,噪音点影响大
Sequential Leader Clustering
特点:不需要K 不需要迭代
一个点一个点扫描,计算新的数据和每个类重心,如果最小距离小于选择边界,则重新为一个类
期望最大法
用模型预计
高斯混合模型
EM算法(贝叶斯公式)
隐含参数
密度与层次
密度聚类:
Density Base Methods
DBSCAN
核心点,边缘点,噪音点
根据连通性
簇,从核心点膨胀,一个点一个点加入,删除噪音点