时间序列
1.定义
时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。经济数据中大多数以时间序列的形式给出。根据观察时间的不同,时间序列中的时间可以是年份、季度、月份或其他任何时间形式。例如:北京市月度CPI同比数据。http://data.eastmoney.com/cjsj/cpi.html
具体的定义去找度娘奥。
2.构成要素
与其说构成要素,不如说一个时间序列可以分解成哪些
构成要素:长期趋势,季节变动,循环变动,不规则变动。
1)长期趋势( T )现象在较长时期内受某种根本性因素作用而形成的总的变动趋势。
2)季节变动( S )现象在一年内随着季节的变化而发生的有规律的周期性变动。
3)循环变动( C )现象以若干年为周期所呈现出的波浪起伏形态的有规律的变动。
4)不规则变动(I )是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型.
通过构成要素可以发现,时间序列可以用来分析事物的发展变化趋势,根据变化趋势进行预测等,为有关部分制定相关政策提供参考。
3.组合模型
时间序列的组合模型主要有两种形式
加法模型:\begin{equation}
Y=T+S+C+l
\end{equation}(即为上面几种趋势的相加)
乘法模型:\mathrm{Y}=\mathrm{T} \cdot \mathrm{s} \cdot \mathrm{c} \cdot
具体用哪个,就根据具体问题来设定吧
4.平稳性
平稳的定义:平稳性是指时间序列的所有统计性质都不会随着时间的推移而发生变化
主要有
严平稳
宽平稳
不平稳
一个平稳时间序列的特征主要有
(1)均数和方差不随时间变化;
(2)自相关系数只与时间间隔有关,与所处的时间无关。
相关系数是用来量化变量之间的相关程度。自相关系数研究的是一个序列中不同时期的相关系数,也就是时间序列计算其当前期和不同滞后期的一系列相关系数。
目前主流的时间序列预测方法都是针对平稳的时间序列进行分析的,但是实际上,我们遇到的大多数时间序列都不平稳,所以在分析时,需要首先识别序列的平稳性,并且把不平稳的序列转换为平稳序列。一个时间序列只有被平稳化处理过,才能被控制和预测。
5.时间序列平稳化处理
将时间序列平稳化的方式有很多,基础的方法是差分和取对数法,因为这个方法有助于我们解读时间序列模型。差分,就是指序列中前后相邻的两期数据之差。取对数法就是对时间序列的值取对数。(这里基本上就是处理非平稳时间序列的两个方法),另外还有一些就是小波分析法(这里给个链接嗷嗷http://blog.sina.com.cn/s/blog_136949aa50102x750.html)小波分析在天气变化的时间序列中用的多一些。还有就是卡尔曼滤波啥的https://blog.csdn.net/yzxnuaa/article/details/79450182
在R语言中,差分用到的函数主要有diff()
emmmm这篇就是初识时间序列,以后具体模型具体分析