DBSCAN聚类算法学习笔记

news/2024/5/20 8:46:52 标签: 算法, 聚类, 学习, DBSCAN聚类, k-means, 笔记, 人工智能

DBSCAN聚类算法学习笔记

一些概念名词
MinPts:聚类在一起的点的最小数目,超过这一阈值才算是一个族群
核心点:邻域内数据点超过MinPts的点
边界点:落在核心点邻域内的点称为边界点
噪声点:既不是核心点也不是边界点的点

过程:
1、算法通过任意选取数据集中的一个点(直到所有的点都访问到)来运行
2、如果在该点的半径范围内至少存在MinPoint点,那么认为所有这些点都属于同一个聚类
通过递归地重复步骤1、步骤2 对每个相邻点的邻域计算来扩展聚类

图示过程:
在这里插入图片描述
开始,选取一点,看邻域范围内是否达到MinPts,达到就加入簇,图示标为红,没达到就判断下一个
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
落在核心点邻域内的点称为边界点,如图标黄色的点
在这里插入图片描述
本例子有一个噪声点
在这里插入图片描述
划分点后,将距离不超过邻域半径的核心点及其所属边界点聚成一个簇
在这里插入图片描述
基于密度的聚类算法,可以根据样本分布的紧密程度决定,同一类别的样本之间是紧密相连的,不同类别样本联系是比较少的
优点是DBSCAN算法不需要事先指定聚类的数量,而是通过样本密度来聚合在一起,对于复杂的分布(比如自动驾驶场景下的点云,含有车、行人、骑行者等,有些目标在空间上还很靠近)及离群点产生的结果比K-Means更加合理
在这里插入图片描述
缺点是如果样本集的密度不均匀、聚类间距差相差很大时,聚类质量较差;
而且算法较复杂,需要针对距离阈值(邻域范围)和领域样本阈值(MinPts)进行调参才能产生较好的效果

参考资料:
1、https://www.jianshu.com/p/dd6ce77bfb8a
2、DBSCAN聚类 动画演示 https://www.bilibili.com/video/BV114411M7ci/?share_source=copy_web&vd_source=fffc779375536f749de4104fe5c56d3a
3、http://t.csdnimg.cn/avicU


http://www.niftyadmin.cn/n/5242722.html

相关文章

竞赛选题 题目:基于深度学习的中文对话问答机器人

文章目录 0 简介1 项目架构2 项目的主要过程2.1 数据清洗、预处理2.2 分桶2.3 训练 3 项目的整体结构4 重要的API4.1 LSTM cells部分:4.2 损失函数:4.3 搭建seq2seq框架:4.4 测试部分:4.5 评价NLP测试效果:4.6 梯度截断…

第四章:面向对象

Java面向对象 1.基本概念: Java是一种面向对象的编程语言,它支持面向对象的编程范式和概念。面向对象编程(Object-Oriented Programming,OOP)是一种编程方法,通过将系统看作是一组相互作用的对象来构建程…

爬虫-xpath篇

1.xpath的基础语法 表达式描述nodename选中该元素/从根节点选取、或者是元素和元素间的过渡//从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置.选取当前节点…选取当前节点的父节点选取属性text()选取文本 举例: 路径表达式结果html选择html元…

使用 Shell 执行批量任务

Shell 是一个常见的命令行界面,它可以用来执行各种命令和脚本。在 Linux 和 Unix 系统中,Shell 是一个标准的组件,它提供了许多功能和工具,可以用来自动化执行任务和处理数据。 批量任务是指一组任务,需要按照一定的顺…

Linux--程序地址空间

📘北尘_:个人主页 🌎个人专栏:《Linux操作系统》《经典算法试题 》《C》 《数据结构与算法》 ☀️走在路上,不忘来时的初心 [TOC](文章目录) 一、程序地址空间回顾 我们在讲C语言的时候,老师给大家画过这样的空间布局…

代码随想录算法训练营 ---第五十一天

1.第一题: 简介: 本题相较于前几题状态复杂了起来,因为多了一个冷冻期。本题讲解可去代码随想录看,这里差不多只是加了些自己的理解。 动规五部曲,分析如下: 确定dp数组以及下标的含义 dp[i][j]&#x…

【无标题】读transformer

这里写目录标题 transformerabstractconclusionintroductionbackground注意力机制mlptransformer和RNN传递序列信息embedding之后维度越大的向量归一化后其单个值就越小,乘个根号512position encoding加入时序信息 transformer abstract 编码器和解码器的架构 处理…

这是二叉搜索树吗?——模拟

一棵二叉搜索树可被递归地定义为具有下列性质的二叉树:对于任一结点, 其左子树中所有结点的键值小于该结点的键值; 其右子树中所有结点的键值大于等于该结点的键值; 其左右子树都是二叉搜索树。 所谓二叉搜索树的“镜像”&#x…