文章目录
- 1 什么是时间序列?
- 2 时间预测方法的核心
- 3 时间序列数据的特点
- 4 相关的时间序列参数模型
- 4.1 移动平均模型(Moving Average, MA)
- 4.2 自回归模型(Autoregressive Models, AP)
- 4.3 自回归移动平均模型
- 5 传统的时间序列预测方法
- 6 基于机器学习的时间序列预测方法
- 6.1 基于支持向量机的时间序列预测方法
- 6.2 基于贝叶斯网络的时间序列预测方法
- 6.3 基于矩阵分解的时间序列预测方法(MF)
- 6.4 基于高斯过程的时间序列预测方法
[1]杨海民,潘志松,白玮.时间序列预测方法综述[J].计算机科学,2019,46(01):21-28.
摘要:本文着重介绍了 传统的时间序列预测方法、基于机器学习的时间序列预测方法 和基于参数模型的在线时间序列预测方法。
1 什么是时间序列?
时间序列是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果。
时间序列是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果。
总之,目前时间序列数据正以不可预测的速度产生于几乎每一个应用领域。
时间序列数据的研究方法主要包括:分类、聚类和回归预测等方面。
2 时间预测方法的核心
时间序列数据本质上反映的是某个或者某些随机变量随时间不断变化的趋势,而时间序列预测方法的核心就是从数据中挖掘出这种规律,并利用其对将来的数据做出估计。
3 时间序列数据的特点
- (最大)当前时刻的数据值与之前时刻的数据值存在联系,该特点表明过去的数据已经暗示了现在或者将来数据发展变化的规律,包括趋势性、周期性和不规则性。
- 平稳性和非平稳性。
- 数据规模不断增大。如果仅仅把时间序列看作单纯的一维向量来处理,则不可避免地会带来维数灾难等问题。
4 相关的时间序列参数模型
4.1 移动平均模型(Moving Average, MA)
4.2 自回归模型(Autoregressive Models, AP)
- 定义
如果一个单变量时序数据{ y t ; t = 1 , 2 , . . . } , 可以以此时序数据本身的多个时刻之前的点的值来回归,这种情况称为自回归,公式如下:
这里的p称为自回归模型的阶数,记作AR(p)。
\alpha 是系数项,_omega 是白噪声。
补充:出自高尔顿种豆子的实验,通过大量数据统计,他发现个体小的豆子往往倾向于产生比其更大的子代,而个体大的豆子则倾向于产生比其小的子代,然后高尔顿认为这是由于新个体在向这种豆子的平均尺寸“回归”,大概的意思就是事物总是倾向于朝着某种“平均”发展,也可以说是回归于事物本来的面目。(知乎高赞回答)
4.3 自回归移动平均模型
5 传统的时间序列预测方法
- 传统的时间序列预测方法主要是在确定时间序列参数模型的基础上求解出模型参数,并利用求解出的模型完成预测工作。
- 最大似然估计经常被用来进行时间序列模型参数的估计,根据观察到的样本值,构建关于模型参数的概率密度。
- 传统的时间序列预测方法非依赖参数模型的选择,能否正确选择参数模型在很大程度上决定了预测结果的准确率。
6 基于机器学习的时间序列预测方法
时间序列数据预测工作本质上与机器学习方法分类中的回归分析之间存在着紧密的联系。经典的支持向量机SVM、贝叶斯网络BN、矩阵分解MF和高斯过程GP在时间序列预测方面均取得了不错的效果。早期的人工神经网络ANN也被用来获取时间序列中长期的趋势。随着深度学习的崛起,深度学习也成为了实现时间序列预测的有效工具。
6.1 基于支持向量机的时间序列预测方法
- 支持向量机坚实的理论基础保证了其在解决小样本、高维数据和非线性问题方面展现出的特有优势。
6.2 基于贝叶斯网络的时间序列预测方法
- 为什么要采用贝叶斯网络?
答:例如把BN应用到气象时间序列数据预测方面,主要是把时空信息融入到现有网络结构中,考虑气候变量间的时空相互关系。
6.3 基于矩阵分解的时间序列预测方法(MF)
- MF在处理拥有缺失数据的时间序列数据预测中取得了很好的效果。
6.4 基于高斯过程的时间序列预测方法
高斯过程(GP)
- 核函数的采用保证了高斯过程具有很强的处理非线性问题的能力,其还具有很多其他的特点。