聚类算法介绍(欧氏距离和余弦距离)

news/2024/5/20 5:59:26 标签: 聚类, kmeans

1.聚类就是将数据集划分为若干相似对象组成的多个组或簇的过程,使得同一个组或簇相似度最大化,不同簇间相似度最小化。(有时候聚类可以评价相似性)

2.聚类的本质是分组,属于无监督机器学习(只需要特征X,不需要标签y)。

3.在聚类分析中,样本之间相似性通常采用样本之间的距离来表示,距离越大表示两个样本越不相似,差异性越大。距离越小,样本差异性越大,距离为零表示两个样本完全一样,无差异。

4.连续型数值计量方法

 

最常用的是欧氏距离(l2范数,两点之间直线距离)

曼哈顿距离(l1范数,两点之间台阶式距离)

5.如果数据是连续性的数据,我们要计算距离,就要对数据做归一化处理,防止不同维度的数据对距离计算造成影响。

6.计算空间中点的距离的时候评价远近可以用欧式距离或者余弦距离。不同的距离测度会得出不同的聚类结果。

余弦距离:假设空间中有两点,我们计算这两个点与原点连成的直线的夹角的余弦是多少度,取值范文是[-1,+1]如果越趋近于1代表越相似,越趋近于-1代表方向相反,0代表正交。

夹角越大就说明两点越不相似,夹角越小说明越相似。(简单来说,欧氏距离就是看两点之间的直线距离,余弦距离就是直接比较两点之间的夹角)

7.如果两个向量长度相等且方向相同,那么就说这两个向量欧氏距离和余弦距离相同 

余弦距离测度效率比欧氏距离测度高


http://www.niftyadmin.cn/n/1443270.html

相关文章

设计模式 - 简单工厂模式

package com.swt.dp.factory;/*** 书*/ public abstract class Book {/*** 打印书籍名字*/public abstract void printName();}package com.swt.dp.factory;/*** 英语书*/ public class EnglishBook extends Book {Overridepublic void printName() {System.out.println("…

Python 两个list合并成一个字典

方法一:list1 [k1,k2,k3] list2 [v1,v2,v3] dic dict(map(lambda x,y:[x,y],list1,list2))>>> print(dic) {k3: v3, k2: v2, k1: v1}方法二:>>> dict(zip(list1,list2)) {k3: v3, k2: v2, k1: v1} >>> l1[1,2,3,4,5,6]>…

K近邻算法(KNN)K-means聚类算法

K近邻算法(KNN) 有监督机器学习 KNN是分类算法 1.思想:在特征空间中,如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别,则该样本也属于这个类别。简单来说就是你离那个样本最近你就属于那个类别。 2.运用欧式距…

hdu 4616 Game(树形dp)

题目链接&#xff1a;hdu 4616 Game 解题思路 dp维护不以trap为起点的最优&#xff0c;ed维护以trap为起点的最优。注意&#xff0c;当前节点如果不为trap的话&#xff0c;不能从dp[K]转移过来。 代码 #include <cstdio> #include <cstring> #include <algo…

ARM汇编伪指令详解

我们做一些操作会有一点麻烦&#xff0c;比方进行一个if then的判断操作。比如要比较a&#xff1e;b&#xff0c;则去调用某个函数&#xff0c;这就要先去比较a,b的值&#xff0c;然后就会跳转&#xff0c;跳转又会比较大小&#xff0c;less than&#xff0c;就是BLLT&#xff…

口令保护(转)

password.asp:提供一个输入界面 <!--- This example is a simple login system ---&gt Password.aspUser Name: Password:      engine.asp:检验用户输入项 Connects and opens the text file    DATA FORMAT IN TEXT FILE "usernamepassword" Set My…

ORACLE关于bin目录下各文件的意义及使用方法(转)

ORACLE关于bin目录下各文件的意义及使用方法,sql,sql教程,Oracle基础$ORACLE_HOME/bin下的utilities解释Binary First Available Description--------- ---------------- ------------------------------------------adapters (7.3.4) Installed Network Adaptersagentctl 9.0.…

hdu 4617 Weapon(几何)

题目链接&#xff1a;hdu 4617 Weapon 解题思路 异面直线之间距离。 代码 #include <cstdio> #include <cstring> #include <cmath> #include <cstdlib> #include <vector> #include <algorithm>using namespace std; const double ep…