专利学习——一种基于变量相关性的多元时间序列相似性搜索方法

news/2024/5/20 7:28:30 标签: 聚类, 机器学习, 相似性分析

文章目录

  • 1 摘要
  • 2 介绍——针对多元时间序列相似度量
    • 2.1 目前常见的多元时间序列特征提取方法
  • 3 步骤分析
    • 3.1 归一化
    • 3.2 采用皮尔逊相关系数,算相关性

在这里插入图片描述

1 摘要

一种基于变量相关性的多元时间序列相似性搜索方法。

步骤一:对多元时间序列进行归一化处理
步骤二:计算序列间数据间的皮尔逊相关系数
步骤三:以皮尔逊相关性为基础,使用OPTICS聚类,将趋势相似的变量聚成类
步骤四:提取聚类后每个类的中心序列,用中心序列代表该类
步骤五:最后对所有中心序列进行PAA特征提取,获得多元时间序列的特征表示数列
步骤六:计算特征表示后的多元时间序列间的DTW距离,找出相似序列。

2 介绍——针对多元时间序列相似度量

  1. 很多一元时间序列相似度量的方法,无法直接用于多元时间序列的研究(如最长公共子序列、编辑距离等等)
  2. 使用于多元时间序列的相似度量方法(如动态时间弯曲、欧式距离等),往往无法平衡计算效率与查询准确率之间的矛盾

2.1 目前常见的多元时间序列特征提取方法

  1. 主成分分析(CPCA)
  2. 多维分段拟合
  3. 奇异值分解(SVD)
  4. 特征点提取

3 步骤分析

3.1 归一化

  • 具体的说,就是选择两条时间序列(别整什么“多元,俩就是俩”)(这里貌似是有m条时间序列,好的先不管,先用两条去分析)
    在这里插入图片描述
  • 归一化之后,得到的是两条序列,不等长,每个序列的数据值都在[0, 1]

3.2 采用皮尔逊相关系数,算相关性

  • “计算所有变量间的相关性” —— 请问变量是指什么?
  • 每一个时间点的数据,都是一个变量。
    举个例子说,两条序列,序列A有2万个数据(每小时一个水位值),序列B有3万个数据(每小时一个水位值),那么用皮尔逊相关性分析来说,就是一个2万 * 3万的矩阵。矩阵中的每一个值,就是横坐标与纵坐标之间的皮尔孙相关性。

在这里插入图片描述

  • 那么上图说,“根据变量间的相关性判断两变量是否可以归为一类”, 这一句话是真的读不懂了…怎么能把两个时间序列中某两个点,或者多个点,归为一类呢?

http://www.niftyadmin.cn/n/1434500.html

相关文章

python 进程池不足_python3.7多进程池的缺陷及绕过方法,python37multiprocesspool,陷阱

1、问题描述有个任务,我们把它写成了一个函数f,这个函数底层可能使用了C写的库绑定,调用的时候会造成资源泄露,最麻烦的是,这个函数f无能在一个process中运行多次,只能运行1次。现在,我们有很多…

安卓usb接口与串口打印机_安卓手机USB直连打印机详细教程

最近大家在家上网课,作业、试卷之类都需要自己打印,打印机前所未有地畅销,于是各打印机品牌纷纷涨价,本来预算能够买个微信款的打印机,结果现在只能买USB款了,本来想直接使用手机打印的,现在不得…

从截图里面识别数字_【答疑解惑】还没成功入驻数字工坊的同学看过来!!!

快点这里订阅最有趣有料的3D/VR/AR/Ai数字化资讯数字工坊是供网友在线分享3D素材的开放平台、为网友提供的信息存储空间。数字工坊的诞生,使得图形的浏览效果有了一个质的飞跃,摆脱了传统的图、文的浏览形式,你能以最专业、最全面的方式&…

什么是水位?水文中常见的特征水位有哪些,各表达什么意思?

文章目录1 什么是水位2 起涨水位3 洪峰水位4 警戒水位5 保证水位1 什么是水位 答:河流或者其他水体的自由水面,离某一基面零点以上的高程称为水位。水位的单位是米,一般是要求小数点2位,0.01m。 2 起涨水位 一次洪水过程中&…

章硕士论文学习——第二章数据挖掘中的聚类方法+时间序列相似性分析

文章目录1 前言2 总结距离度量函数2.1 动态时间弯曲距离 DTW2.2 最长公共子序列距离 LCS2.3 **模式距离 PD1 前言 时间序列相似性度量,是高效时间序列相似比较分析的基础,建立何种度量函数来实现时间序列相似度量直观重要 —— 度量函数的选择!!! 考虑…

论文学习——时间序列的距离模式

文章目录1 摘要2 引言2.1 举个例子3 文章核心点4 时间序列的模式表示5 实验5.1 变换一下分段数6 结语写在前面:《时间序列的模式距离》;《浙江大学学报(工学版); 2004年7月发表;》 1 摘要 基于时间序列的分…

python租车系统_Python共享单车数据--可视化

项目描述:利用kaggle网站项目(Bike Sharing Demand | Kaggle)中提供的2011年到2012年美国某城市的共享单车数据集,其中包括了租车日期,天气,季节,气温,体感温度,空气湿度,风速等数据…

论文学习——基于降雨类型直方图分析的降雨站点相似性研究

文章目录1 摘要2 结论3 引言4 实验流程4.1 特征选择4.2 基于Dacies-Bouldin指数的K-means聚类4.3 基于单场降雨的降雨类型直方图4.4 基于降雨类型直方图的相似性度量5 实验结果与分析6 结论写在前面:《水文》;月刊;中文核心期刊 这一篇论文和…