(完全解决)如何输入一个图的邻接矩阵(每两个点的亲密度矩阵affinity),然后使用sklearn进行谱聚类

news/2024/5/20 9:22:55 标签: sklearn, 聚类, 人工智能, 1024程序员节

文章目录

      • 背景
      • 输入点
      • 直接输入邻接矩阵

背景

网上倒是有一些关于使用sklearn进行谱聚类的教程,但是这些教程的输入都是一些点的集合,然后根据谱聚类的原理,其会每两个点计算一次亲密度(可以认为两个点距离越大,亲密度越小),假设一共有N个点,那么就是N*N个亲密度要计算,这特别像什么?图里面的邻接矩阵对不对。然后算法再根据这些亲密度进行聚类,即亲密度越大的点,他们应该聚在一起。

总结,这些教程都是输入点,没有说如何直接输入邻接矩阵,然后使用sklearn进行谱聚类

输入点

下面的X就是输入的点的坐标,形状为(100,2),我们是对这些点进行聚类,聚两类。然后affinity参数其实就是距离计算公式你选用哪个的意思,比如我们常常知道的欧式距离,曼哈顿距离,当然谱聚类里面不是这些。总之,实际使用中,哪个效果好用哪个,建议官方提供的距离你都可以试一试。

import numpy as np
from sklearn import datasets
from sklearn.cluster import SpectralClustering
import matplotlib.pyplot as plt

X, _ = datasets.make_circles(n_samples=100, factor=0.5, noise=0.05)
#X就是输入的点
fig = plt.figure(figsize=(16,4))

# 谱聚类默认聚类数为8
model = SpectralClustering(n_clusters=2).fit(X)
ax = fig.add_subplot(132)
ax.scatter(X[:,0], X[:,1], c=model.labels_, marker='.')


model = SpectralClustering(n_clusters=2, affinity="nearest_neighbors").fit(X)
ax = fig.add_subplot(133)
ax.scatter(X[:,0], X[:,1], c=model.labels_, marker='.')

plt.show()

在这里插入图片描述

直接输入邻接矩阵

邻接矩阵表示各个点之间的亲密度,我们先准备好邻接矩阵如下,形状是N*N,注意邻接矩阵需要为正数,否则报错,所以我们下面用了指数。

adjacency_matrix=[[ 0.0470,  0.0309,  0.0269,  0.0867,  0.0548,  0.0109,  0.0771,  0.0307,
          0.0276],
        [ 0.1033,  0.0157,  0.0012, -0.0097,  0.0050,  0.0059, -0.0179, -0.0133,
         -0.0074],
        [-0.0070,  0.0795,  0.0222, -0.0379, -0.0281, -0.0073, -0.0569, -0.0341,
         -0.0208],
        [ 0.0370,  0.0165, -0.0008,  0.0012, -0.0044, -0.0090,  0.0311,  0.0330,
          0.0124],
        [-0.0185, -0.0267, -0.0199,  0.1049,  0.0289, -0.0023, -0.0270, -0.0290,
         -0.0348],
        [-0.1064, -0.0719, -0.0368, -0.0589,  0.0236, -0.0024, -0.0903, -0.0769,
         -0.0512],
        [ 0.0624,  0.0479,  0.0304,  0.0762,  0.0512,  0.0178,  0.0633,  0.0288,
          0.0256],
        [-0.0258, -0.0148, -0.0024, -0.0092,  0.0007, -0.0081,  0.0819, -0.0039,
         -0.0092],
        [-0.0472, -0.0152, -0.0039, -0.0405, -0.0287, -0.0161, -0.0083,  0.0608,
         -0.0053]]
adjacency_matrix=np.exp(np.array(adjacency_matrix))
from sklearn.cluster import SpectralClustering
sc = SpectralClustering(3, affinity='precomputed', n_init=100,
                        assign_labels='discretize')#precomputed就是说我们算好了的意思。
sc.fit_predict(adjacency_matrix)  

输出结果

array([1, 2, 2, 1, 0, 0, 1, 1, 0], dtype=int64)

这个就是我们9个点的聚类结果。


完结撒花


http://www.niftyadmin.cn/n/5117096.html

相关文章

【面试】虾皮

Java 代码,输出是什么 static A setValue(int value) {return new A(value);}public static void setV(A a, int value) {a setValue(value);}public static void main(String[] argv) {A a new Solution3.A(1);setV(a, 10);System.out.println(a.value);}Spring …

继电器测试的方法和步骤有哪些?

继电器测试是一种常见的电气测试方法,用于检测继电器的工作状态和性能,下面是继电器测试的一般方法和步骤: 准备工作:确认测试设备的准备情况,包括测试仪器、电源、继电器和连接线等。确认继电器的工作原理和参数&…

如何撰写一份优秀的活动策划与执行方案?这些步骤和技巧请收好

活动策划与执行是一个综合性、复杂性极高的工作,对于任何一场活动的成功举办都起着至关重要的作用。一份优秀的活动策划与执行方案能够确保活动目标的实现,有效管理资源,提升活动效果。在本文中,我们将探讨如何撰写一份优秀的活动…

Prewitt算子详解及例程

Prewitt算子是一种常用的边缘检测算子,与Sobel算子类似,用于寻找图像中的水平和垂直边缘。它通过计算图像中像素点的梯度来确定边缘的位置。 与Sobel算子不同的是,Prewitt算子使用了一个3x3的卷积核来进行图像的卷积操作。具体而言&#xff…

Panoply启动报错A Java Exception has occurred

Panoply启动报错A Java Exception has occurred 问题描述 原因 可能是版本不对,目前panoly只支持java11以后的了,我的java是8的,需要升级。 解决方案 删除原有的Java8重新安装Java11之后,即打开成功 安装Java11步骤

基本的爬虫工作原理

爬虫是一种自动化程序,能够模拟人类的浏览行为,从网络上获取数据。爬虫的工作原理主要包括网页请求、数据解析和数据存储等几个步骤。本文将详细介绍爬虫的基本工作原理,帮助读者更好地理解和应用爬虫技术。 首先,爬虫的第一步是…

云租赁安全管理制度

1、总则 1.1、目的 为规范XXXXX单位使用云计算服务的安全,为使用云计算服务提供全生命周期的安全指导,特制定本制度。 1.2、范围 本制度适用于XXXXX单位采用云计算租赁服务的安全管理基本要求。 1.3、职责 信息安全工作小组负责执行云租赁服务的安…

【uniapp】小程序开发7:自定义组件、自动注册组件

一、自定义轮播图组件、自动注册 以首页轮播图组件为例。 1、创建组件文件src/components/my-swipper.vue 代码如下&#xff1a; <template><view><view class"uni-margin-wrap"><swiper class"swiper" circular :indicator-dots…