机器学习 复习四 聚类

news/2024/5/20 7:28:39 标签: 聚类, 聚类算法, 机器学习

无监督学习
衡量:处理不规则形状,噪音点

相似的物品成一类,不相似的物品不成一类

K-Means

步骤:
随机选K个聚集点
每个数据被赋值最近聚集点类别
使用每个聚集中心点更新
重复直到聚点不再移动
返回K个中心点坐标

优点:简单,对于规则性图形聚类很好,收敛性号 O(t k n)
缺点:定K值,可能收敛到局部最优,噪音点影响大

Sequential Leader Clustering

特点:不需要K 不需要迭代
一个点一个点扫描,计算新的数据和每个类重心,如果最小距离小于选择边界,则重新为一个类

期望最大法

用模型预计
高斯混合模型
在这里插入图片描述
EM算法(贝叶斯公式)
在这里插入图片描述隐含参数

在这里插入图片描述

密度与层次

密度聚类
Density Base Methods
DBSCAN
核心点,边缘点,噪音点
根据连通性
簇,从核心点膨胀,一个点一个点加入,删除噪音点

层次聚类:(距离选择,最大距离,最小距离等)
从底到上聚类,迭代,合并,知道所有样本聚层一个类
例题:城市距离聚类


http://www.niftyadmin.cn/n/1093965.html

相关文章

Java使用占位符拼接字符串

大家知道,在C#编程中,可以用占位符来拼接字符串,用起来非常的方便。 特别是需要进行大量的参数拼接的时候,比如: Console.WriteLine(String.Format("该域名{0}被访问了 {1} 次.", domain, iVisit)); 但是在j…

第10章 泛型算法

10.1概述 大多数算法定义在头文件<algorithm>中&#xff0c;另外在<numeric>中定义了一组数值泛型算法。 一般来说&#xff0c;算法不直接操作容器&#xff0c;而是使用迭代器访问容器中的元素&#xff0c;但是在对元素进行比较的时候&#xff0c;会依赖于元素的类…

机器学习 复习五 关联

项集与规则 频繁集frequent itemsets 关联规则 association rules 序列模式 sequential patterns 实例&#xff1a;商品拜访 支持度与向量度 support&#xff08;X&#xff09;#X/n 条件概率 最小支持度 最小置信度 步骤&#xff1a; 找到所有频繁项 生成频繁项所有非空子…

linux命令--nslookup

nslookup和dig都是非常有用的网络命令&#xff0c;简单而言&#xff0c;就是查dns信息用的。 本地的dns配置文件在哪里&#xff1f; 文件是&#xff1a;/etc/resolv.conf 打开这个文件&#xff1a;vi /etc/resolv.conf nameserver 127.0.1.1 先介绍nslookup 【如何进入交互模…

个人学习进度条------第四周

学习时间10小时代码量500行博客量1篇所学内容c#窗体应用程序的编程实现&#xff0c;各种控件的简单应用转载于:https://www.cnblogs.com/Againzg/p/5990926.html

sql常用语法

mysql启动 mysql -u root-p 修改数据库 create database database_name; drop database dbname; 修改表 create table tablename() drop table tabname 修改表字段 添加列: ALTER TABLE table_name ADD column_name datatype 删除列&#xff1a; ALTER TABLE table_name DROP…

【iOS】ARC-MRC下的单例及其应用

单例的应用十分普遍&#xff0c;单例模式使一个类只有一个实例。 *易于供外界访问.*方便控制实例个数,节约系统资源.*OC中的常见单例&#xff1a;如&#xff1a;UIApplication, NSNotificationCenter, NSUserDefaults, NSFIleManager。*应用程序中用到的单例&#xff1a;如&…

大数据技术原理 复习二 hdfs

分布式文件系统HDFS 3.1 分布式文件系统 计算机集群结构&#xff1a;分布式文件系统把文件分布存储到多个计算机节点上&#xff0c;降低硬件开销 分布式文件系统的结构&#xff1a;分布式文件系统在物理结构上是由计算机集群中的多个节点构成的&#xff0c;这些节点分为两类…