type
status
date
slug
summary
tags
category
icon
password
8.1.1 统计工具
8.1.1.1 自回归模型
随着数据增加,需要考虑的 会非常多,因此需要选用方法进行近似
自回归模型
不需要考虑全部序列数据,而是截取长度为 的序列数据,进行训练
这种模型被称为自回归模型(autoregressive models)
隐变量自回归模型
保留一些对过去观测的总结 ,同时更新预测 和总结
基于以下公式更新数据:

在统计学或时间序列分析中,“静止性”指的是时间序列的统计特性不随时间改变,比如:• 均值不变• 方差不变• 自协方差只取决于两个时间点之间的间隔,而不是时间本身
对于离散对象,序列的估计值:
对于离散的对象,需要使用分类器而不是回归模型来进行估计
这里的分类器、回归模型其实就是对应的两个主要任务:classification 和 regression
8.1.1.2 马尔可夫模型
在自回归模型中,我们截取序列的片段进行估计,使用马尔可夫模型的方法
• 自回归模型是更通用的形式,可以依赖任意多的过去值。
• 马尔可夫模型是一个特例,只依赖固定数量的历史(最常见是只看 )。

8.1.1.3 因果关系
我们需要把 进行展开,方便进一步计算
这里可以按照任意顺序,基于条件概率展开
按常理来说,对于条件概率,根据“后者”推出“前者”似乎更合理,因此最好按时间顺序正向建模,这样可以增强可解释性
8.1.4 小结
- 内插法(在现有观测值之间进行估计)和外推法(对超出已知观测范围进行预测)在实践的难度上差别很大。因此,对于所拥有的序列数据,在训练时始终要尊重其时间顺序,即最好不要基于未来的数据进行训练。
- 序列模型的估计需要专门的统计工具,两种较流行的选择是自回归模型和隐变量自回归模型。
- 对于时间是向前推进的因果模型,正向估计通常比反向估计更容易。
- 对于直到时间步t的观测序列,其在时间步t+k的预测输出是“k步预测”。随着我们对预测时间k值的增加,会造成误差的快速累积和预测质量的极速下降。
- 作者:昊卿
- 链接:hqhq1025.tech/article/1c1a897c-9da0-803e-9218-f09227467bd9
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。
相关文章