聚类-理论补充2

news/2024/5/20 8:34:02 标签: 聚类, 算法, 机器学习

目录

一。拉普拉斯矩阵的定义

二。谱聚类算法:未正则拉普拉斯矩阵 

三。谱聚类算法:随机游走拉普拉斯矩阵

四。谱聚类算法:对称拉普拉斯矩阵

五。进一步思考

 六。随机游走和拉普拉斯矩阵的关系

 七。标签传递算法


一。拉普拉斯矩阵的定义

计算点之间的邻接相似度矩阵W

        若两个点的相似度值越大,表示这两个点越相似;
        同时,定义wij=0表示vi,vj两个点没有任何相似性(无穷远) 

W的第i行元素的和为vi的度。形成顶点度对角阵D

        dii表示第i个点的度
        除主对角线元素,D其他位臵为0

未正则的拉普拉斯矩阵:L=D-W

正则拉普拉斯矩阵

二。谱聚类算法:未正则拉普拉斯矩阵 

输入:n个点{pi},簇的数目k

        计算n×n的相似度矩阵W和度矩阵D;
        计算拉普拉斯矩阵L=D-W;
        计算L的前k个特征向量u1,u2,...,uk;
        将k个列向量u1,u2,...,uk组成矩阵U,U∈Rn×k;
        对于i=1,2,...,n,令yi∈Rk是U的第i行的向量;
        使用k-means算法将点(yi)i=1,2,...,n聚类成簇C1,C2,...Ck;
        输出簇A1,A2,...Ak,其中,Ai={j|yj∈Ci}

三。谱聚类算法:随机游走拉普拉斯矩阵

输入:n个点{pi},簇的数目k

        计算n×n的相似度矩阵W和度矩阵D;
        计算正则拉普拉斯矩阵Lrw=D-1(D-W);
        计算Lrw的前k个特征向量u1,u2,...,uk;
        将k个列向量u1,u2,...,uk组成矩阵U,U∈ Rn×k ;
        对于i=1,2,...,n,令yi∈Rk是U的第i行的向量;
        使用k-means算法将点(yi)i=1,2,...,n聚类成簇C1,C2,...Ck ;
        输出簇A1,A2,...Ak,其中,Ai={j|yj∈Ci}

四。谱聚类算法:对称拉普拉斯矩阵

输入:n个点{pi},簇的数目k
        计算n×n的相似度矩阵W和度矩阵D;
        计算正则拉普拉斯矩阵Lsym=D-1/2(D-W) D-1/2;
        计算Lsym的前k个特征向量u1,u2,...,uk;
        将k个列向量u1,u2,...,uk组成矩阵U,U∈Rn×k;
        对于i=1,2,...,n,令yi∈Rk是U的第i行的向量;
        对于i=1,2,...,n,将yi∈Rk依次单位化,使得|yi|=1;
        使用k-means算法将点(yi)i=1,2,...,n聚类成簇C1,C2,...Ck;
        输出簇A1,A2,...Ak,其中,Ai={j|yj∈Ci}

五。进一步思考

 六。随机游走和拉普拉斯矩阵的关系

图论中的随机游走是一个随机过程,它从一个顶点跳转到另外一个顶点。谱聚类即找到图的一个划分,使得随机游走在相同的簇中停留而几乎不会游走到其他簇。

 七。标签传递算法

对于部分样本的标记给定,而大多数样本的标记未知的情形,是半监督学习问题。

标签传递算法(Label Propagation Algorithm,LPA),将标记样本的标记通过一定的概率传递给未标记样本,直到最终收敛。

 

 


http://www.niftyadmin.cn/n/80629.html

相关文章

docker安装配置镜像加速器-拉取创建Mysql容器示例

List item docker 常见命令大全docker安装docker拉取创建Mysql容器docker 安装 1、安装链接:https://blog.csdn.net/BThinker/article/details/123358697 ; 2、安装完成需要配置docker镜像加速器 3、docker 镜像加速器推荐使用阿里云的: 编…

GO的临时对象池sync.Pool

GO的临时对象池sync.Pool 文章目录GO的临时对象池sync.Pool一、临时对象池:sync.Pool1.1 临时对象的特点1.2 临时对象池的用途1.3 sync.Pool 的用法二、临时对象池中的值会被及时清理掉2.1 池清理函数2.2 池汇总列表2.3 临时对象池存储值所用的数据结构2.4 临时对象…

ChatGPT:自然语言处理的新里程碑

近年来,基于自然语言处理技术的对话系统逐渐成为了人工智能领域的热门研究方向。其中,ChatGPT作为一种基于预训练的生成式对话模型,因其在生成高质量回复方面的表现而备受关注。在本篇博客中,我们将详细介绍ChatGPT的技术原理和应…

葡萄酒(WINE)数据集分类(PyTorch实现)

一、数据集介绍 Data Set Information: These data are the results of a chemical analysis of wines grown in the same region in Italy but derived from three different cultivars. The analysis determined the quantities of 13 constituents found in each of …

【java基础】运算符

运算符 operator 运算符优先级 Operators 操作员Precedence 优先级postfix 后缀expr expr--unary 一元的expr --expr expr -expr ~ !multiplicative 〔数〕乘法的 / %additive 添加剂 -shift 移动<< >> >>>relational 关系的< > < > insta…

DPDK — MEMPOOL(librte_mempool,Memory Pool Manager,内存池管理组件)

目录 文章目录 目录MEMPOOL(librte_mempool,Memory Pool Manager,内存池管理组件)Mempool 的布局关系Mempool Local CacheMempool ObjectMEMPOOL(librte_mempool,Memory Pool Manager,内存池管理组件) MEMPOOL 库提供了一组 API,用于从指定的 Memzone 中分配 Memory …

在Linux和Windows上安装sentinel-1.8.5

记录&#xff1a;380场景&#xff1a;在CentOS 7.9操作系统上&#xff0c;安装sentinel-1.8.5。在Windows上操作系统上&#xff0c;安装sentinel-1.8.5。Sentinel是面向分布式、多语言异构化服务架构的流量治理组件。版本&#xff1a;JDK 1.8 sentinel-1.8.5 CentOS 7.9官网地址…

【人工智能AI】三、NoSQL 实战《NoSQL 企业级基础入门与进阶实战》

帮我写一篇介绍NoSQL的技术文章&#xff0c;文章标题是《NoSQL 实战》&#xff0c;不少于3000字。这篇文章的目录是 3.NoSQL 实战 3.1 MongoDB 入门 3.1.1 MongoDB 基本概念 3.1.2 MongoDB 安装与配置 3.1.3 MongoDB 数据库操作 3.2 Redis 入门 3.2.1 Redis 基本概念 3.2.2 Red…