层次聚类

news/2024/5/20 6:22:59 标签: 聚类, ml
mlns="http://www.w3.org/2000/svg" style="display: none;"> href="http://ounix1xcw.bkt.clouddn.com/github.markdown.css" rel="stylesheet">

样本空间有$N$个点${x_1,x_2,...,x_n}$,层次ml" title=聚类>聚类的过程如下:

1、将每个点都单独归为1类

2、计算各个类之间的相似度/距离

3、将相似度最大/距离最近的两个类合并为1类

4、重复步骤2和3,直到所有类归为1类

最开始有$N$个类,每循环一次便有两个类合并了(即类的总数-1),直到减到你想要的k个类,则可以停止迭代,若想得到所有结果,则一直减,减到1为止

如何计算两个类之间的距离:

  • Single Linkage:取两个类中最近的两个样本的距离
  • Complete Linkage:取两个类中最远的两个样本的距离
  • Average Linkage:把两个类中点两两求距离然后取均值


http://www.niftyadmin.cn/n/568986.html

相关文章

xgboost中如何自定义metric

xgboost中如何自定义metric xgboost算法取precision≥0.97的情况下,recall的最大值。那无疑这个测评函数是要自己写的(官方没给),可是我怎么把它放进xgboost里呢?这样我设置silent1时,我每一步都能看到tra…

Docker命令大全

文章目录docker hello world运行交互式的容器启动容器(后台模式)停止容器docker容器使用docker客户端容器使用获取镜像启动容器启动已停止运行的容器后台运行停止一个容器进入容器导入和导出容器删除容器清理掉所有处于终止状态的容器运行一个web应用查看web应用容器网络端口的…

java web应用调用python机器学习训练的模型

java web应用调用python机器学习训练的模型 项目线上平台是用java编写的web应用程序,而深度学习使用的是python语言,这就涉及到了在java代码中调用python语言的方法。为了能在java应用中使用python语言训练的算法模型,我在网上找了很久。我大…

Hadoop Shell命令

Hadoop Shell命令 FS Shell 调用文件系统(FS)Shell命令应使用 bin/hadoop fs <args>的形式。 所有的的FS shell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统&#xff0c;scheme是hdfs&#xff0c;对本地文件系统&#xff0c;scheme是f…

Influxdb语法

1、数据构成 INSERT cpu_load_short,hostserver01,regionus-west value0.64,value20.86 1434055562000000000第一部分&#xff1a;“cpu_load_short,hostserver01,regionus-west” 第一部分称为key&#xff0c;key中包含了measurement name&#xff08;类似表&#xff09;和t…

PySpark︱DataFrame操作指南:增/删/改/查/合并/统计与数据处理

PySpark︱DataFrame操作指南&#xff1a;增/删/改/查/合并/统计与数据处理 https://blog.csdn.net/sinat_26917383/article/details/80500349#_13___142

Python操作InfluxDB指南

文章目录简单例子详细APIInfluxDBClientInfluxDBClient类的参数说明InfluxDB类的方法DataFrameClientDataFrameClient类的参数说明DataFrame类的方法详细例子InfluxDBClient例子DataFrameClient例子简单例子 from influxdb import InfluxDBClient client InfluxDBClient(loca…

sklearn系列——目录

监督学习 广义线性模型 普通最小二乘法岭回归Lasso回归多任务Lasso弹性网络多任务弹性网络最小角回归坐标下降法正交匹配追踪法贝叶斯回归 贝叶斯岭回归主动相关决策理论 逻辑回归随机梯度下降感知器被动攻击算法稳健回归多项式回归 线性和二次判别分析 线性判别分析二次判别分…