基于K-Means的图片聚类算法实战

news/2024/5/20 7:01:47 标签: 算法, kmeans, 聚类

一. 场景说明

我们通常遇到一个问题,当很多图片放在一个文件夹中,要把这些文件夹中的图片按规律分为几类。当图片比较少时,我们可以手动完成,但是当图片的数量是几千甚至几万时,手动挑选图片的工作量就太大了。
因此,需要一个算法对图片进行自动化分类并保存,也就是本文的《基于K-Means的图片聚类算法实战》。

二. 算法步骤

  1. 基于深度学习模型提取图片特征;
  2. 基于K-Means聚类算法对图片特征进行聚类
  3. 根据不同的类别,把相应的图片保存在不同的文件夹中。

下面是一个例子,./imgs中保存了很多猫和狗的图片,运行脚本后,就把猫和狗的图片分开,分别保存在./0 和 ./1 两个文件夹中。
代码如下:

import torch
import torchvision.models as models
import torchvision.transforms as transforms
from PIL import Image
import torch.nn.functional as F
import glob
import numpy as np
from tqdm import tqdm
from sklearn.cluster import KMeans


class FeatureExtract(object):
    def __init__(self):
        # 加载预训练的ResNet18模型
        self.resnet = models.resnet18(pretrained=True)

        # 移除最后一层全连接层
        self.resnet = torch.nn.Sequential(*list(self.resnet.children())[:-1])

        # 设置模型为评估模式
        self.resnet.eval()

        self.preprocess = transforms.Compose([
            transforms.Resize(224),
            transforms.ToTensor(),
            transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
            ])

    def feature_extract(self, image_path):
        # 加载和预处理图像
        image = Image.open(image_path)
        input_tensor = self.preprocess(image)
        input_batch = input_tensor.unsqueeze(0)

        # 使用模型提取特征
        with torch.no_grad():
            features = self.resnet(input_batch)

        # 输出特征向量
        return features.squeeze()


def k_means(data, n_clusters=2):
    # 定义聚类器, 设置迭代次数和终止条件
    kmeans = KMeans(n_clusters=2, max_iter=1000, tol=1e-4)
    kmeans.fit(data)
    # 获取每个数据点的簇标签
    labels = kmeans.labels_
    return labels


if __name__ == "__main__":
    import shutil
    import os
    extract = FeatureExtract()
    features = []
    images = glob.glob("./imgs/*.jpg")
    print("开始抽取图片特征...")
    for img_path in tqdm(images):
        feature = extract.feature_extract(img_path)
        features.append(feature.tolist())
    data = np.array(features)
    print("开始特征聚类...")
    n_clusters = 2
    labels = k_means(data, n_clusters)
    print("开始保存图片")
    for i in range(n_clusters):
        os.mkdir(str(i))
    for label, img_path in zip(labels, images):
        shutil.copy(img_path, os.path.join(str(label), os.path.basename(img_path)))

理论基础可学习:K-Means(K-均值)聚类算法


http://www.niftyadmin.cn/n/5255570.html

相关文章

什么是rocketmq❓

在大规模分布式系统中,各个服务之间的通信是至关重要的,而RocketMQ作为一款分布式消息中间件,为解决这一问题提供了强大的解决方案。本文将深入探讨RocketMQ的基本概念、用途,以及在实际分布式系统中的作用,并对Produc…

持续集成交付CICD:GitLabCI上传Nexus制品

目录 一、实验 1.GitLabCI上传Nexus制品 2.优化GitLabCI(引用系统变量) 3.添加if条件判断项目类型 4.优化GitLabCI(模板类) 二、问题 1.GitLabCI获取jar文件失败 2. GitLabCI获取流水线项目命名空间失败 3.GItLab Packag…

k8s一键部署uniswap

1、拉取uniswap源码 github地址 2、编写Dockerfile并打镜像 # Set the base image FROM node:18.10.0# WORKDIR /usr/src/app/ WORKDIR /home/gateway# Copy files COPY ./ /home/gateway/# Dockerfile author / maintainer LABEL maintainer"Michael Feng <mikehummi…

Springboot+vue项目使用RSA公私钥对返回数据加解密

针对于项目数据安全&#xff0c;对后台返回数据使用 RSA加密方式 进行加密处理 RSA 加密方法类 import org.apache.commons.codec.binary.Base64;import javax.crypto.BadPaddingException; import javax.crypto.Cipher; import javax.crypto.IllegalBlockSizeException; imp…

day45-46-Vue+ElementUI实现学生管理

VueElementUI实现学生管理 代码&#xff1a; qiushiju/java2313_vue_elementui_crud (gitee.com) 一、思考 考虑需求&#xff08;登录&#xff0c;查询全部&#xff0c;基本增删改查&#xff0c;分页&#xff0c;搜索&#xff0c;批量&#xff09; 设计数据库搭建项目 后端…

C# OpenCvSharp DNN 部署FastestDet

目录 效果 模型信息 项目 代码 下载 C# OpenCvSharp DNN 部署FastestDet 效果 模型信息 Inputs ------------------------- name&#xff1a;input.1 tensor&#xff1a;Float[1, 3, 512, 512] --------------------------------------------------------------- Outpu…

Python-docx 深入word源码 自定义字符间距

代码和实现效果 from docx import Document from docx.oxml import OxmlElement from docx.oxml.ns import qn from docx.shared import Pt# 调整pt设置字间距 def SetParagraphCharSpaceByPt(run, pt1):通过修改word源码方式, 添加w:spacing标签直接通过调整pt来设置字符间距…

perl处理json的序列化和反序列化

perl可以使用JSON模块很方便的处理json的序列化和反序列化。先来一段简单的例子&#xff1a; #! /usr/bin/perl use v5.14; use JSON; use IO::File;my $info {id > 1024,desc > hello world,arry > [1, 2, 3, 4, 5],obj > {char > [ A, B, C ]} };say to_jso…