层次聚类1

news/2024/5/20 7:54:21 标签: 聚类

样本空间有 N N N个点 { x 1 , x 2 , . . . , x n } \{x_1,x_2,...,x_n\} {x1,x2,...,xn},层次聚类的过程如下:

1、将每个点都单独归为1类

2、计算各个类之间的相似度/距离

3、将相似度最大/距离最近的两个类合并为1类

4、重复步骤2和3,直到所有类归为1类

最开始有 N N N个类,每循环一次便有两个类合并了(即类的总数-1),直到减到你想要的k个类,则可以停止迭代,若想得到所有结果,则一直减,减到1为止

如何计算两个类之间的距离:

  • Single Linkage:取两个类中最近的两个样本的距离
  • Complete Linkage:取两个类中最远的两个样本的距离
  • Average Linkage:把两个类中点两两求距离然后取均值


http://www.niftyadmin.cn/n/568988.html

相关文章

机器学习模型跨平台部署:pmml+springboot

机器学习模型跨平台部署:pmmlspringboot 工作中,大部分都是使用Python和机器学习库进行建模,但是线上环境基本上都是Java开发的,所以如何将我们训练好的模型部署到线上始终是一个问题。PMML就是针对这一问题的解决办法。 1&#…

层次聚类

href"http://ounix1xcw.bkt.clouddn.com/github.markdown.css" rel"stylesheet"> 样本空间有$N$个点${x_1,x_2,...,x_n}$,层次聚类的过程如下: 1、将每个点都单独归为1类 2、计算各个类之间的相似度/距离 3、将相似度最大/…

xgboost中如何自定义metric

xgboost中如何自定义metric xgboost算法取precision≥0.97的情况下,recall的最大值。那无疑这个测评函数是要自己写的(官方没给),可是我怎么把它放进xgboost里呢?这样我设置silent1时,我每一步都能看到tra…

Docker命令大全

文章目录docker hello world运行交互式的容器启动容器(后台模式)停止容器docker容器使用docker客户端容器使用获取镜像启动容器启动已停止运行的容器后台运行停止一个容器进入容器导入和导出容器删除容器清理掉所有处于终止状态的容器运行一个web应用查看web应用容器网络端口的…

java web应用调用python机器学习训练的模型

java web应用调用python机器学习训练的模型 项目线上平台是用java编写的web应用程序,而深度学习使用的是python语言,这就涉及到了在java代码中调用python语言的方法。为了能在java应用中使用python语言训练的算法模型,我在网上找了很久。我大…

Hadoop Shell命令

Hadoop Shell命令 FS Shell 调用文件系统(FS)Shell命令应使用 bin/hadoop fs <args>的形式。 所有的的FS shell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统&#xff0c;scheme是hdfs&#xff0c;对本地文件系统&#xff0c;scheme是f…

Influxdb语法

1、数据构成 INSERT cpu_load_short,hostserver01,regionus-west value0.64,value20.86 1434055562000000000第一部分&#xff1a;“cpu_load_short,hostserver01,regionus-west” 第一部分称为key&#xff0c;key中包含了measurement name&#xff08;类似表&#xff09;和t…

PySpark︱DataFrame操作指南:增/删/改/查/合并/统计与数据处理

PySpark︱DataFrame操作指南&#xff1a;增/删/改/查/合并/统计与数据处理 https://blog.csdn.net/sinat_26917383/article/details/80500349#_13___142