在统计学角度来看,时间序列分析是统计学中的一个重要分支, 是基于随机过程理论和数理统计学平稳性序列和非平稳性序列. 目前应用最多的是Box一JenkinS 模型建模法, 它是由G.E.P.Box和英国统计学家G.M.JenkinS于1970年首次系统提出的.Box一JenkinS方法是一种较为完善的统计预测方法 , 他们的作用是为实际工作者提供了对时间序列进行分析、预测 , 以用对ARMA模型识别、估计和诊断的系统方法. 优点在于如果建立精确的模型后,并确定模型的系数之后,就可以根据有限的数据集对其发展进行预测
平稳性
平稳性是时间序列分析中很重要的一个概念。一般的,我们认为一个时间序列是平稳的,如果它同时满足一下两个条件:
1)均值函数是一个常数函数。
2)自协方差函数只与时滞有关,与时间点无关。
以上面两个时间序列为例。两个序列均满足条件1),因为标准正态分布白噪声和其形成的随机游走的均值函数都是值恒为0的常数函数。再来看条件2)。白噪声的自协方差函数可以表述为:
可以看到只有在时滞为0时值为1,其它均为0,所以白噪声是一个平稳序列。
而随机游走我们上面分析过,其自协方差为:
很明显其自协方差依赖于时间点,所以是一个非平稳序列。
后面可以看到,一般的时间序列分析往往针对平稳序列,对于非平稳序列会通过某些变换将其变为平稳的,例如,对于随机游走来说,其一阶差分序列是平稳的(显然其一阶差分是白噪声)。
时序分析主要统计量
现假设我们有随机时间序列
下面先给出一些常用的统计量。后面会接着通过一些常见序列来举例说明各统计量如何计算。
均值
均值函数被定义为关于自变量t的函数:
t的均值函数值表示在t时刻随机变量的期望。
方差
与均值类似,方差是t时刻序列元素的方差:
自协方差
自协方差是一个二元函数,其自变量为两个时间点,值是两个时间点上序列值的协方差:
当t=s时,自协方差就是t时刻的方差。
自相关系数
自相关系数是两个时刻的值的相关系数:
如果忽略元素来自时间序列这一事实,各统计量的意义实际上与普通的统计学中无异。因此这些统计量的一些性质也可以无缝推广到时间序列分析。例如期望的线性性质等等。如果有需要可以自行复习一下这些统计量的相关计算性质。后面的推导会主要集中于这几个统计量的计算。
常见的随机时间序列
常见的随机时间序列有:白噪音、布朗运动(随机游走)、白噪声
- "simhei""白噪声""b""red"
由于每个元素服从,所以均值,方差。又因为每个元素独立,所以对于任何,,。这些统计特征与对图像的直观观察基本一致。
白噪声的重要之处在于很多其它的重要时间序列都可以通过它构造出来,这一点下文会看到。我们一般用e表示白噪声,将白噪声序列写作:
布朗运动
下面考虑这样一个时间序列,其在t时刻的值是前面白噪声序列的前t个值之和,设为标准正态分布产生的白噪声,则:
布朗运动的模式在于其位置是连续曲线,但曲线的处处不可微。
- 10001
- forin2
- 1
- "simhei""随机游走""b""red"
- abline(h=0
可以看到随机游走比白噪声平滑很多,并且呈现出一些“趋势性”的感觉。下面分析其相关统计特征。
均值:
方差:
对协方差的计算需要用到一个协方差性质:
设t小于s,由于只有i=j时,所以:
自协方差:
自相关系数:
从统计性质可以看到,随机游走的“趋势性”实际是个假象,因为其均值函数一直是白噪声的均值,不存在偏离的期望。但是方差与时间呈线性增长并且趋向于无穷大,这意味着只要时间够长,随机游走的序列值可以偏离均值任意远,但期望永远在均值处。
物理与经济学中的很多现象都被看做是随机游走,例如分子的布朗运动,股票的价格走势等等。
从协方差和相关系数看,如果起点t固定,则越接近的点相关性越大,例如,,。同时,起点不同,时滞相同自相关系数也不同,越往后同时滞自相关系数越大,例如,。
实际上从纯数学角度可以将自相关系数看成一个二元函数,自变量是时间点t和时滞s-t。认识到这点很重要,因为它与时间序列分析中一个重要的概念――平稳性有着密切的关系。
二、AR、MA、ARMA模型
4、AR、MA、ARMA认是平稳时间序列最主要的参数模型. AR模型的正则方程是一组线形方程 ,而MA和ARMA模型是非线性方程.Word分解定理告诉我们任何有限方差的ARMA或MA平移过程可以用可能是无限阶的AR模型表达;同样,任何ARMA或AR模型可以用可能是无限阶的撇模型表达.因此,如果在这三个模型中选一个与信号不匹配的模型,但只要模型的阶足够高,它能够比较好地逼近被建模的随机过程.三种模型中AR模型具有一系列好的性能,因此,是研究最多并获得广泛应用的一种模型。
三、模型用于预测
1.AR(n)模型预测
2.MA(q)、ARMA(p,q)模型预测
3.预测误差