机器学习概念:监督学习、无监督学习、回归、聚类

news/2024/5/20 9:13:39 标签: 学习, 回归, 聚类, 机器学习, 深度学习
  1. 监督学习(Supervised Learning)

    • 在监督学习中,训练数据包含了输入特征,和相应的标签(目标值)
    • 监督学习的目标是学习一个从输入到输出的映射,使得模型能够根据输入预测相应的输出。
    • 典型的监督学习任务包括分类任务和回归任务。
    • 分类任务中,目标是将输入数据分为不同的类别,例如图像识别中将图像分类为猫、狗等。
    • 回归任务中,目标是预测连续数值型的输出,例如房价预测中预测房屋价格。
  2. 无监督学习(Unsupervised Learning)

    • 在无监督学习中,训练数据只包含输入特征,没有相应的标签或目标值。
    • 无监督学习的目标是从数据中发现潜在的结构或模式,而无需事先给定标签。
    • 典型的无监督学习任务包括聚类、降维、异常检测等。
    • 聚类任务中,目标是将数据集中的样本分组到不同的簇中,使得同一簇内的样本相似度较高。
    • 降维任务中,目标是减少数据集的维度,同时保留数据集中的重要信息。
    • 异常检测任务中,目标是识别数据集中的异常样本或异常模式

    3.分类:

分类是监督学习中的一种任务,其目标是将输入数据分配到预定义的类别或标签中。在分类问题中,每个样本都有一个标签,模型的任务是学习从输入特征到输出标签的映射关系。

分类问题通常可以分为两类:

  1. 二分类(Binary Classification)

    • 在二分类问题中,每个样本只能被分配到两个互斥的类别中的一个
    • 典型的例子包括垃圾邮件检测(垃圾邮件或非垃圾邮件)、癌症诊断(恶性或良性)等。
  2. 多分类(Multi-class Classification)

    • 在多分类问题中,每个样本可以被分配到多个类别中的一个
    • 典型的例子包括手写数字识别(数字 0 到 9)、图像分类(动物分类、物体分类等)等。

分类任务的解决通常涉及以下步骤

  1. 数据准备:准备带有标签的训练数据,包括输入特征和相应的标签。

  2. 模型选择:选择适合分类问题的模型,如逻辑回归、支持向量机、决策树、随机森林、神经网络等。

  3. 训练模型:使用训练数据对选择的模型进行训练,学习输入特征与标签之间的映射关系。

  4. 评估模型:使用测试数据对训练好的模型进行评估,通常使用准确率、精确率、召回率、F1 分数等指标来评估模型的性能。

  5. 模型调优:根据评估结果调整模型的超参数或算法,以提高模型的性能。

  6. 应用模型:使用训练好的模型对新的未见过的数据进行预测,将其分配到相应的类别中。

    4.回归

回归问题是机器学习中的一种常见问题类型,其目标是预测一个连续数值型的输出变量,基于一个或多个输入变量的特征。回归问题中,我们试图建立一个模型来描述输入变量和输出变量之间的关系,并使用这个模型来对新的输入进行预测

举例来说,如果我们想要预测房屋的销售价格,我们可以收集一些房屋的特征,比如面积、地理位置、房间数量等,然后利用这些特征来预测房屋的销售价格。在这个例子中,销售价格是一个连续的数值,因此这是一个回归问题。

回归问题的解决方法有很多种,包括线性回归、多项式回归、岭回归、Lasso回归、支持向量回归、决策树回归、随机森林回归等等。这些方法使用不同的技术和算法来拟合数据并进行预测。

     5.聚类

聚类是一种无监督学习的技术,它的目标是将数据集中的样本分成若干个相似的组(簇),使得每个组内的样本之间的相似度较高而不同组之间的相似度较低。在聚类中,我们通常不知道数据集的真实标签或类别,而是依靠数据之间的相似性来进行分组。

聚类的目标是发现数据内在的结构,从而找到数据中的潜在模式和规律。聚类技术可以应用于许多领域,如市场分析、社交网络分析、生物信息学等。

常见的聚类算法包括K均值聚类、层次聚类、DBSCAN(基于密度的空间聚类)、高斯混合模型等。这些算法在不同的数据集和应用场景下有不同的优劣势,选择合适的聚类算法通常依赖于数据集的特点和分析的目标。


http://www.niftyadmin.cn/n/5473123.html

相关文章

STL —— list

博主首页: 有趣的中国人 专栏首页: C专栏 本篇文章主要讲解 list模拟实现的相关内容 1. list简介 列表(list)是C标准模板库(STL)中的一个容器,它是一个双向链表数据结构&#xff0c…

C++ templates: (4)、引用折叠

引用折叠(Reference collapsing)是C11中引入的一种规则,用于处理函数模板参数的类型和值完全匹配的情况。当一个非const左值引用和一个右值引用绑定到同一块内存时,引用折叠会发生。 引用折叠的规则如下: 如果两个引…

卷积神经网络实战

构建卷积神经网络 卷积网络中的输入和层与传统神经网络有些区别,需重新设计,训练模块基本一致 1.首先读取数据 - 分别构建训练集和测试集(验证集) - DataLoader来迭代取数据 # 定义超参数 input_size 28 #图像的总尺寸28*28…

Pnpm + Turbo 搭建 Web Component Monorepo 组件库

技术选型 使用 Pnpm Turbo 搭建 Web Component Monorepo项目 stencil-component-ui 组件库 pnpm 作为包管理器Turborepo 作为构建系统Vitepress 管理文档 pnpm 技术 什么是 pnpm? 它有哪些优势? pnpm 跟 npm、yarn一样,都是用于管理Node包依赖的管…

python+ opencv(Mat)——笔记

opencv中用Mat数据类型来表示图片; python中将mat转化为numpy的ndarray;type(img)numpy.ndarray; Mat的属性: rows:表示矩阵的行数。cols:表示矩阵的列数。size:表示矩阵的尺寸,即…

015——步进电机模块驱动开发(基于I.MX6uLL、MX-1502和28BYJ-48)

目录 一、电机驱动模块介绍 1.1 特性 1.2 应用范围 1.3 概述 1.4 电气属性 1.5 经典应用线路 二、电机介绍(本节内容来自韦东山老师课程资料) 三、 代码编写思路 四、 驱动程序 五、应用程序 一、电机驱动模块介绍 1.1 特性  低待机电流 (…

【C++ STL有序关联容器】map 映射

文章目录 【 1. 基本原理 】【 2. map 的创建 】2.1 调用默认构造函数,创建一个空的 map2.2 map 被构造的同时初始化2.3 通过一个 queue 初始化另一个 queue2.4 取已建 map 中指定区域内的键值对,初始化新的 map2.5 指定排序规则 【 2. map 元素的操作 】…

opencv-python库 cv2开运算闭运算形态学梯度顶部帽底部帽

文章目录 开运算闭运算形态学梯度顶部帽底部帽cv2.morphologyEx() 开运算 cv2中的开运算是图像依次经过腐蚀、膨胀处理后的过程。 开运算实际是先腐蚀运算,再膨胀运算,可以把细微连在一起的两块目标分开。一般来说,开运算可以使图像的轮廓变…