聚类笔记:聚类算法评估指标

news/2024/5/20 6:03:02 标签: 算法, 聚类, 笔记

1 内部评估方法

  • 当一个聚类结果是基于数据聚类自身进行评估的,这一类叫做内部评估方法。
  • 如果某个聚类算法聚类的结果是类间相似性低,类内相似性高,那么内部评估方法会给予较高的分数评价。
  • 不过内部评价方法的缺点是:
    • 这些评估方法对某些算法有倾向性,如k-means聚类都是基于点之间的距离进行优化的,而那些基于距离的内部评估方法就会过度的赞誉这些生成的聚类结果

      • ——>这些内部评估方法是基于特定场景判定一个算法要优于另一个

1.1 SSE 和方差

拟合数据和原始数据对应点的误差的平方和

1.2 Compactness(紧密性)(CP)

每一个类各点到聚类中心的平均距离

CP越低意味着类内聚类距离越近

1.3 Separation(间隔性)(SP)

  • 聚类中心两两之间平均距离
  • SP越高意味类间聚类距离越远

1.4 轮廓系数 Silhouette Coefficient

对于单个样本,设a是与它同类别中其他样本的平均距离,b是与它距离最近不同类别中样本的平均距离,其轮廓系数为:

对于一个样本集合,它的轮廓系数是所有样本轮廓系数的平均值。

轮廓系数的取值范围是[-1,1],同类别样本距离越相近不同类别样本距离越远,分数越高

1.5 Davies-Bouldin Index(戴维森堡丁指数)

  • 任意两类别的类内距离平均距离(CP)之和除以两聚类中心距离求最大值。
  • DB越小意味着类内距离越小同时类间距离越大

1.6 Dunn Validity Index (邓恩指数)(DVI)

  • 任意两个簇元素的最短距离(类间)除以任意簇中的最大距离(类内)。
  • DVI越大意味着类间距离越大同时类内距离越小。

2 外部评估指标

  • 在外部评估方法中,聚类结果是通过使用没被用来做训练集的数据进行评估。
    • 这些数据已经预先分类好,被用作ground truth

2.1 纯度(Purity

  • 每个簇中最多的类作为这个簇所代表的类
  • 计算正确分配的类的数量,然后除以N


http://www.niftyadmin.cn/n/5263220.html

相关文章

17.分割有效信息【2023.12.9】

1.问题描述 有时候我们需要截取字符串以获取有用的信息,比如对于字符串 “日期:2010-10-29”,我们需要截取后面的 10 个字符来获取日期,以便进行进一步分析。编写一个程序,输入一个字符串,然后输出截取后的…

基于Spring Boot和微信小程序的智能小程序商城

文章目录 项目介绍主要功能截图:部分代码展示设计总结项目获取方式🍅 作者主页:超级无敌暴龙战士塔塔开 🍅 简介:Java领域优质创作者🏆、 简历模板、学习资料、面试题库【关注我,都给你】 🍅文末获取源码联系🍅 项目介绍 基于Spring Boot和微信小程序的智能小程…

微信小程序单图上传和多图上传

图片上传主要用到 1、wx.chooseImage(Object object) 从本地相册选择图片或使用相机拍照。 参数 Object object 属性类型默认值必填说明countnumber9否最多可以选择的图片张数sizeTypeArray.<string>[original, compressed]否所选的图片的尺寸sourceTypeArray.<s…

拦截器实现指定的IP白名单进行访问规定的Controller

需求&#xff1a;只允许内网的IP&#xff08;也就是IP白名单&#xff09;进行访问VideoController和ImgController&#xff0c;其余的FontController可以随便访问不做限制 总体的项目结构&#xff1a; 1、先写好业务代码三个Controller 访问的路径分别是&#xff1a; /api/…

分布式块存储 ZBS 的自主研发之旅|元数据管理

重点内容 元数据管理十分重要&#xff0c;犹如整个存储系统的“大黄页”&#xff0c;如果元数据操作出现性能瓶颈&#xff0c;将严重影响存储系统的整体性能。如何提升元数据处理速度与高可用是元数据管理的挑战之一。SmartX 分布式存储 ZBS 采用 Log Replication 的机制&…

设计模式(2)--对象创建(5)--单件

1. 意图 保证一个类仅有一个实例&#xff0c;并提供一个访问它的全局访问点。 2. 一种角色 单件(Singleton) 3. 优点 3.1 对唯一实例的受控访问 3.2 缩小名空间(对全局变量的改进) 3.3 允许对操作和表示精化(可以有子类) 3.4 允许可变数目的实例 3.5 比类操作更灵活 4. 缺点…

android版本webrtc使用ffmpeg 解码h264编译报错

1, android studio使用ffmpeg解码h264编译报错&#xff1a; third_party/ffmpeg/ffmpeg_internal/videodsp.o: in function ff_prefetch_aarch64: (.text0x10): relocation truncated to fit: R_AARCH64_CONDBR19 against symbol ff_prefetch_aarch64 defined in .text sect…

TrustZone之总线请求

接下来&#xff0c;我们将查看系统中的总线请求者&#xff0c;如下图所示&#xff1a; 系统中的A型处理器具有TrustZone感知&#xff0c;并在每个总线访问中发送正确的安全状态。然而&#xff0c;大多数现代SoC还包含非处理器总线请求者&#xff0c;例如GPU和DMA控制器。 与完成…