聚类效果评估

news/2024/5/20 8:34:11 标签: 聚类, 机器学习, python

目录

1.轮廓系数(Silhouette Coefficient)

1.1 为什么轮廓系数可以评价聚类效果的好坏?

1.2 平均轮廓系数

2. 其他聚类质量函数

2.1方差比准则(Variance Ratio Criterion, VRC)

 2.2 戴维斯-博尔丁指数(Davies-Bouldin指数,DB指数)


 

评价聚类结果效果的指标通常有:误差平方和(Sum of the Squared Errors, SSE),轮廓系数(Silhouette Coefficient)和CH指标(Calinski-Harabaz)。

1.轮廓系数(Silhouette Coefficient)

轮廓系数,是用于评价聚类效果好坏的一种指标。可以理解为描述聚类后各个类别的轮廓清晰度的指标。其包含有两种因素——内聚度和分离度。

内聚度可以理解为反映一个样本点与类内元素的紧密程度。
分离度可以理解为反映一个样本点与类外元素的紧密程度。

1.1 为什么轮廓系数可以评价聚类效果的好坏?

 

1.2 平均轮廓系数

2. 其他聚类质量函数

2.1方差比准则(Variance Ratio Criterion, VRC)

 2.2 戴维斯-博尔丁指数(Davies-Bouldin指数,DB指数)

 

 

 


http://www.niftyadmin.cn/n/429814.html

相关文章

使用Async如何传递ThreadLocal及自定义线程池

问题: 1. 当使用ThreadLocal存储数据时,程序中使用了Async异步任务注解,后导致子任务中无法获取到ThreadLocal存储的数据 2. 使用Async注解后默认的线程池最大线程数和队列长度为 Integer.MAX_VALUE,当并发量增高后会导致系统负载…

在字节划水的4年,很真实...

先简单交代一下,我是某不知名211的计算机本硕,18年毕业加入滴滴,之后跳槽到了头条,一直从事测试开发相关的工作。之前没有实习经历,算是四年半的工作经验吧。 这四年半之间完成了一次晋升,换了一家公司&am…

组合索引是如何提高数据库查询性能的

组合索引是一种在数据库表中同时包含多个列的索引,它在提高数据库查询性能方面起着关键作用。本文将深入探讨组合索引的原理、优势以及如何合理设计和使用组合索引来提高查询性能,同时通过实际案例进行说明。 组合索引的原理 解释组合索引的工作原理&am…

基于清华chatglm-6b模型的向量化检索问答

之前清华模型已经证实在中文领域具有相当不错的表现,这是其他老外模型所不具备的(除了openai),目前在免费领域来说chatglm-6b已经是领头羊的地位。抛开此模型的弊端(微调大部分都会失败,可能失去通用领域的能力,可能失去语言能力)来说,将其应用于本地知识库的问答检索…

【CSS】文字扫光 | 渐变光

码来 可调整角度与颜色值来改变效果 <p class"gf-gx-color">我是帅哥</p> <style>.gf-gx-color {background: -webkit-linear-gradient(135deg,red,red 25%,red 50%,#fff 55%,red 60%,red 80%,red 95%,red);-webkit-text-fill-color: transparen…

海外社媒营销揭秘:品牌出海的关键策略与注意事项

在全球化的背景下&#xff0c;品牌出海已成为众多企业拓展市场的必然选择。而海外社媒营销作为一种有效的推广手段&#xff0c;不仅能够帮助品牌建立海外影响力&#xff0c;还可以增强品牌知名度、提高销售额。然而&#xff0c;要在海外社媒平台上实施成功的营销策略&#xff0…

安全左移DevSecOps开源工具链建设

开发安全相关技术和产品受到越来越多的关注。行业共识认为&#xff0c;应用系统上线之后进行软件漏洞修复&#xff0c;其修复成本是需求设计阶段修复成本的几十倍。因此&#xff0c;在开发环节&#xff0c;引入相应的安全工具&#xff0c;能够有效的降低漏洞的修复成本&#xf…

精通postman教程(四)-创建请求及添加参数 详解

作为一名测试工程师&#xff0c;那么Postman绝对是大伙必备的工具之一。 在这个系列教程中&#xff0c;我将为大伙详细讲解如何使用Postman进行API测试。 今天我为大伙讲解postman如何创建请求及添加参数&#xff0c;让你们快速上手这款工具。 一、处理GET请求 Get请求用于…