机器学习复习四聚类

机器学习复习四聚类

news/2024/5/20 7:28:39 标签: 聚类, 聚类算法, 机器学习

无监督学习
衡量：处理不规则形状，噪音点

相似的物品成一类，不相似的物品不成一类

K-Means

步骤：
随机选K个聚集点
每个数据被赋值最近聚集点类别
使用每个聚集中心点更新
重复直到聚点不再移动
返回K个中心点坐标

优点：简单，对于规则性图形聚类很好，收敛性号 O(t k n)
缺点:定K值，可能收敛到局部最优，噪音点影响大

Sequential Leader Clustering

特点：不需要K 不需要迭代
一个点一个点扫描，计算新的数据和每个类重心，如果最小距离小于选择边界，则重新为一个类

期望最大法

用模型预计
高斯混合模型
在这里插入图片描述
EM算法（贝叶斯公式）
隐含参数

在这里插入图片描述

密度与层次

密度聚类：
Density Base Methods
DBSCAN
核心点，边缘点，噪音点
根据连通性
簇，从核心点膨胀，一个点一个点加入，删除噪音点

层次聚类：（距离选择，最大距离，最小距离等）
从底到上聚类，迭代，合并，知道所有样本聚层一个类
例题：城市距离聚类

http://www.niftyadmin.cn/n/1093965.html

相关文章

Java使用占位符拼接字符串

Java使用占位符拼接字符串

大家知道，在C#编程中，可以用占位符来拼接字符串，用起来非常的方便。特别是需要进行大量的参数拼接的时候，比如： Console.WriteLine(String.Format("该域名{0}被访问了 {1} 次.", domain, iVisit)); 但是在j…

阅读更多...

第10章泛型算法

第10章泛型算法

10.1概述大多数算法定义在头文件<algorithm>中，另外在<numeric>中定义了一组数值泛型算法。一般来说，算法不直接操作容器，而是使用迭代器访问容器中的元素，但是在对元素进行比较的时候，会依赖于元素的类…

阅读更多...

机器学习复习五关联

机器学习复习五关联

项集与规则频繁集frequent itemsets 关联规则 association rules 序列模式 sequential patterns 实例：商品拜访支持度与向量度 support（X）#X/n 条件概率最小支持度最小置信度步骤： 找到所有频繁项生成频繁项所有非空子…

阅读更多...

linux命令--nslookup

linux命令--nslookup

nslookup和dig都是非常有用的网络命令，简单而言，就是查dns信息用的。本地的dns配置文件在哪里？ 文件是：/etc/resolv.conf 打开这个文件：vi /etc/resolv.conf nameserver 127.0.1.1 先介绍nslookup 【如何进入交互模…

阅读更多...

个人学习进度条------第四周

个人学习进度条------第四周

学习时间10小时代码量500行博客量1篇所学内容c#窗体应用程序的编程实现，各种控件的简单应用转载于:https://www.cnblogs.com/Againzg/p/5990926.html

阅读更多...

sql常用语法

sql常用语法

mysql启动 mysql -u root-p 修改数据库 create database database_name; drop database dbname; 修改表 create table tablename() drop table tabname 修改表字段添加列: ALTER TABLE table_name ADD column_name datatype 删除列： ALTER TABLE table_name DROP…

阅读更多...

【iOS】ARC-MRC下的单例及其应用

【iOS】ARC-MRC下的单例及其应用

单例的应用十分普遍，单例模式使一个类只有一个实例。 *易于供外界访问.*方便控制实例个数,节约系统资源.*OC中的常见单例：如：UIApplication, NSNotificationCenter, NSUserDefaults, NSFIleManager。*应用程序中用到的单例：如&…

阅读更多...

大数据技术原理复习二 hdfs

大数据技术原理复习二 hdfs

分布式文件系统HDFS 3.1 分布式文件系统计算机集群结构：分布式文件系统把文件分布存储到多个计算机节点上，降低硬件开销分布式文件系统的结构：分布式文件系统在物理结构上是由计算机集群中的多个节点构成的，这些节点分为两类…

阅读更多...

最新文章