机器学习概念：监督学习、无监督学习、回归、聚类

机器学习概念：监督学习、无监督学习、回归、聚类

news/2024/5/20 9:13:39 标签: 学习, 回归, 聚类, 机器学习, 深度学习

监督学习（Supervised Learning）：
- 在监督学习中，训练数据包含了输入特征，和相应的标签（目标值）。
- 监督学习的目标是学习一个从输入到输出的映射，使得模型能够根据输入预测相应的输出。
- 典型的监督学习任务包括分类任务和回归任务。
- 在分类任务中，目标是将输入数据分为不同的类别，例如图像识别中将图像分类为猫、狗等。
- 在回归任务中，目标是预测连续数值型的输出，例如房价预测中预测房屋价格。
无监督学习（Unsupervised Learning）：
- 在无监督学习中，训练数据只包含输入特征，没有相应的标签或目标值。
- 无监督学习的目标是从数据中发现潜在的结构或模式，而无需事先给定标签。
- 典型的无监督学习任务包括聚类、降维、异常检测等。
- 在聚类任务中，目标是将数据集中的样本分组到不同的簇中，使得同一簇内的样本相似度较高。
- 在降维任务中，目标是减少数据集的维度，同时保留数据集中的重要信息。
- 在异常检测任务中，目标是识别数据集中的异常样本或异常模式。

3.分类：

分类是监督学习中的一种任务，其目标是将输入数据分配到预定义的类别或标签中。在分类问题中，每个样本都有一个标签，模型的任务是学习从输入特征到输出标签的映射关系。

分类问题通常可以分为两类：

二分类（Binary Classification）：
- 在二分类问题中，每个样本只能被分配到两个互斥的类别中的一个。
- 典型的例子包括垃圾邮件检测（垃圾邮件或非垃圾邮件）、癌症诊断（恶性或良性）等。
多分类（Multi-class Classification）：
- 在多分类问题中，每个样本可以被分配到多个类别中的一个。
- 典型的例子包括手写数字识别（数字 0 到 9）、图像分类（动物分类、物体分类等）等。

分类任务的解决通常涉及以下步骤：

数据准备：准备带有标签的训练数据，包括输入特征和相应的标签。
模型选择：选择适合分类问题的模型，如逻辑回归、支持向量机、决策树、随机森林、神经网络等。
训练模型：使用训练数据对选择的模型进行训练，学习输入特征与标签之间的映射关系。
评估模型：使用测试数据对训练好的模型进行评估，通常使用准确率、精确率、召回率、F1 分数等指标来评估模型的性能。
模型调优：根据评估结果调整模型的超参数或算法，以提高模型的性能。
应用模型：使用训练好的模型对新的未见过的数据进行预测，将其分配到相应的类别中。

4.回归：

回归问题是机器学习中的一种常见问题类型，其目标是预测一个连续数值型的输出变量，基于一个或多个输入变量的特征。在回归问题中，我们试图建立一个模型来描述输入变量和输出变量之间的关系，并使用这个模型来对新的输入进行预测。

举例来说，如果我们想要预测房屋的销售价格，我们可以收集一些房屋的特征，比如面积、地理位置、房间数量等，然后利用这些特征来预测房屋的销售价格。在这个例子中，销售价格是一个连续的数值，因此这是一个回归问题。

回归问题的解决方法有很多种，包括线性回归、多项式回归、岭回归、Lasso回归、支持向量回归、决策树回归、随机森林回归等等。这些方法使用不同的技术和算法来拟合数据并进行预测。

5.聚类：

聚类是一种无监督学习的技术，它的目标是将数据集中的样本分成若干个相似的组（簇），使得每个组内的样本之间的相似度较高，而不同组之间的相似度较低。在聚类中，我们通常不知道数据集的真实标签或类别，而是依靠数据之间的相似性来进行分组。

聚类的目标是发现数据内在的结构，从而找到数据中的潜在模式和规律。聚类技术可以应用于许多领域，如市场分析、社交网络分析、生物信息学等。

常见的聚类算法包括K均值聚类、层次聚类、DBSCAN（基于密度的空间聚类）、高斯混合模型等。这些算法在不同的数据集和应用场景下有不同的优劣势，选择合适的聚类算法通常依赖于数据集的特点和分析的目标。

http://www.niftyadmin.cn/n/5473123.html

相关文章

STL —— list

STL —— list

博主首页： 有趣的中国人专栏首页： C专栏本篇文章主要讲解 list模拟实现的相关内容 １. list简介列表（list）是C标准模板库（STL）中的一个容器，它是一个双向链表数据结构&#xff0c…

阅读更多...

C++ templates: (4)、引用折叠

C++ templates: (4)、引用折叠

引用折叠（Reference collapsing）是C11中引入的一种规则，用于处理函数模板参数的类型和值完全匹配的情况。当一个非const左值引用和一个右值引用绑定到同一块内存时，引用折叠会发生。引用折叠的规则如下： 如果两个引…

阅读更多...

卷积神经网络实战

卷积神经网络实战

构建卷积神经网络卷积网络中的输入和层与传统神经网络有些区别，需重新设计，训练模块基本一致 1.首先读取数据 - 分别构建训练集和测试集（验证集） - DataLoader来迭代取数据 # 定义超参数 input_size 28 #图像的总尺寸28*28…

阅读更多...

Pnpm + Turbo 搭建 Web Component Monorepo 组件库

Pnpm + Turbo 搭建 Web Component Monorepo 组件库

技术选型使用 Pnpm Turbo 搭建 Web Component Monorepo项目 stencil-component-ui 组件库 pnpm 作为包管理器Turborepo 作为构建系统Vitepress 管理文档 pnpm 技术什么是 pnpm? 它有哪些优势？ pnpm 跟 npm、yarn一样，都是用于管理Node包依赖的管…

阅读更多...

python+ opencv（Mat）——笔记

python+ opencv（Mat）——笔记

opencv中用Mat数据类型来表示图片； python中将mat转化为numpy的ndarray；type（img）numpy.ndarray; Mat的属性: rows：表示矩阵的行数。cols：表示矩阵的列数。size：表示矩阵的尺寸，即…

阅读更多...

015——步进电机模块驱动开发（基于I.MX6uLL、MX-1502和28BYJ-48）

015——步进电机模块驱动开发（基于I.MX6uLL、MX-1502和28BYJ-48）

目录一、电机驱动模块介绍 1.1 特性 1.2 应用范围 1.3 概述 1.4 电气属性 1.5 经典应用线路二、电机介绍（本节内容来自韦东山老师课程资料） 三、代码编写思路四、驱动程序五、应用程序一、电机驱动模块介绍 1.1 特性  低待机电流 (…

阅读更多...

【C++ STL有序关联容器】map 映射

【C++ STL有序关联容器】map 映射

文章目录【 1. 基本原理】【 2. map 的创建】2.1 调用默认构造函数，创建一个空的 map2.2 map 被构造的同时初始化2.3 通过一个 queue 初始化另一个 queue2.4 取已建 map 中指定区域内的键值对，初始化新的 map2.5 指定排序规则【 2. map 元素的操作】…

阅读更多...

opencv-python库 cv2开运算闭运算形态学梯度顶部帽底部帽

opencv-python库 cv2开运算闭运算形态学梯度顶部帽底部帽

文章目录开运算闭运算形态学梯度顶部帽底部帽cv2.morphologyEx() 开运算 cv2中的开运算是图像依次经过腐蚀、膨胀处理后的过程。开运算实际是先腐蚀运算，再膨胀运算，可以把细微连在一起的两块目标分开。一般来说，开运算可以使图像的轮廓变…

阅读更多...

最新文章