matlab 实现模糊C均值聚类

1. 原理

模糊c均值算法步骤:

1. 设定聚类数目c和加权指数b:

2. 初始化各个聚类中心m

3. 重复下面的运算,直到各个样本的隶属度值稳定:用当前的聚类中心根据下式计算隶属度函数:

用当前的隶属度函数按下式更新计算各类聚类中心:

当模糊C均值算法收敛时,就得到了各类的聚类中心和各个样本对于各类的隶属度值,从而完成了模糊聚类划分

Matlab中模糊c均值聚类函数(b=2):

[Center,U,obj_fcn]=fcm(data,cluster_n)

data:要聚类的数据集合,每一行为一个样本;

cluster_n:聚类数;

Center:最终的聚类中心矩阵,每一行为聚类中心的坐标值;

U:最终的模糊分区矩阵;

obj_fcn:在迭代过程中的目标函数值。

2. 过程

2.1 数据集合并及可视化

 

将MALE.txt和FEMALE.txt文件合并成一个data.txt文件,在matlab中导入data文件并绘制样本点分布:

图1 初始样本点分布图

2.2 模糊c均值聚类

调用MATLAB中模糊c均值聚类函数fcm实现聚类,初始设置聚类簇的个数为2,求出每个样本的最大隶属度,然后找出分别属于两类样本的点并绘制图像:

程序如上图所示,运行后聚类结果如下:

图2 迭代过程中目标函数值

可以看出目标函数值在迭代中是不断减小的

图3 聚类结果

图4 簇为2聚类结果样本点分布

为了能够寻找到更合理的聚类数目,接下来分别进行3类、4类、5类聚类

图5 簇个数为3

图6 簇个数为4

图7 簇个数为5

3. 结果与分析

在上述实验过程中,我们成功实现了模糊c均值聚类,因为数据集是由两类样本合成的所以初始聚类簇的个数设置为2,结果如图4所示,然后从图中可以发现聚类效果似乎并非最佳,于是后续又增大了簇的个数进行多次实验,如图5到图7所示,通过观察可知聚类个数为4时或许会更加合理。在实验迭代的过程中可以了解到这种聚类的方式主要是通过优化目标函数然后得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行聚类的目的。同时我也通过改变聚类个数的方式去寻找更加合理的类别数。但是实验中还缺少对于聚类优劣的描述,可以通过一些聚类指标来对实验进行进一步优化。


http://www.niftyadmin.cn/n/5416334.html

相关文章

力扣hot100:240.搜索二维矩阵II(脑子)

吉大21级算法分析与设计的一道大题,由于每一行都是排好序的直接逐行二分 可以达到:O(mlogn)。但是这里追求更广的思路可以使用其他方法。 矩阵四分: 在矩阵中用中心点比较,如果target大于中心点的值,则由于升序排列&am…

selenium之PO设计模式

初识PO模式 PO(PageObject)是一种设计模式。简单来说就是把一些繁琐的定位方法、元素操作方式等封装到类中,通过类与类之间的调用完成特定操作。 PO被认为是自动化测试项目开发实践的最佳设计模式之一。 在学习PO模式前,可以先…

突破编程_C++_字符串算法(检查一个字符串是否是某个字符串的子序列)

1 算法题 :检查一个字符串是否是某个字符串的子序列 1.1 题目含义 这个题目要求检查一个字符串是否是另一个字符串的子序列。子序列指的是一个字符串可以通过删除原字符串中的某些字符(也可以不删除)但不改变剩下字符的顺序而得到。例如&am…

大语言模型如何充分理解人类自然语言指令

经过海量数据预训练后的语言模型虽然具备了大量的知识,但是由于其训练的目标仅是进行下一个词的预测,此时的模型还不能够理解并遵循人类自然语言的指令。指令微调(Instruction Tuning),是指在已经训练好的语言模型的基础上,通过使…

华为OD机试真题-查找接口成功率最优时间段

查找接口成功率最优时间段 题目描述 服务之间交换的接口成功率作为服务调用关键质量特性,某个时间段内的接口失败率使用一个数组表示,数组中每个元素都是单位时间内失败率数值,数组中的数值为0~100的整数,给定一个数值(minAverag…

【开源】SpringBoot框架开发河南软件客服系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 系统管理人员2.2 业务操作人员 三、系统展示四、核心代码4.1 查询客户4.2 新增客户跟进情况4.3 查询客户历史4.4 新增服务派单4.5 新增客户服务费 五、免责说明 一、摘要 1.1 项目介绍 基于JAVAVueSpringBootMySQL的河…

备考银行科技岗刷题笔记(持续更新版)

银行考试计算机部分复习 IEEE 802.11的帧格式 1.1 IEEE 802.11是什么? 802.11是国际电工电子工程学会(IEEE)为无线局域网络制定的标准。目前在802.11的基础上开发出了802.11a、802.11b、802.11g、802.11n、802.11ac。并且为了保证802.11更…

Vue3:toRef和toRefs的用法

一、情景说明 我们知道,Vue3中想要定义对象类型的响应式数据 可以通过reactive函数实现 如果,后端返回的对象,有很多的字段,我们想进行结构化赋值 但是,又想保证赋值后的变量也是响应式数据 那么,这个时候…