《时间序列分析课件.ppt》由会员分享,可在线阅读,更多相关《时间序列分析课件.ppt(40页珍藏版)》请在三一办公上搜索。
1、第十一章,时间序列分析,主要内容,11.1 时间序列的建立和平稳化11.2 指数平滑法11.3 ARIMA模型11.4 时序序列的季节性分解,11.1 时间序列的建立和平稳化,11.1.1 填补缺失值 时间序列分析中的缺失值不能采用通常删除的办法来解决,因为这样会导致原有时间序列周期性的破坏,而无法得到正确的分析结果。 按“转换替换缺失值”打开“替换缺失值”对话框,11.1 时间序列的建立和平稳化,11.1.2 定义日期变量 定义日期模块可以产生周期性的时间序列日期变量。使用“定义日期”对话框定义日期变量,需要在数据窗口读入一个按某种时间顺序排列的数据文件,数据文件中的变量名不能与系统默认的时
2、间变量名重复,否则系统建立的日期变量会覆盖同名变量。系统默认的变量名有:年份,年份、季度,年份、月份,年份、季度、月份,日,星期、日,日、小时等。 按“数据定义日期”顺序打开“定义日期”对话框,11.1 时间序列的建立和平稳化,11.1.3 创建时间序列 时间序列分析建立在序列平稳的条件上,判断序列是否平稳可以看它的均数方差是否不再随时间的变化而变化,自相关系数是否只与时间间隔有关而与所处时间无关。在时间序列分析中,为检验时间序列的平稳性,经常要用一阶差分、二阶差分,有时为选择一个合适的时间序列模型还要对原时间序列数据进行对数转换或平方转换等。这就需要在已经建立的时间序列数据文件中,再建立一个
3、新的时间序列变量。 按“转换创建时间序列”顺序打开“创建时间序列”对话框,11.1 时间序列的建立和平稳化,11.1.3 创建时间序列 时序图举例,按“分析预测序列图”顺序打开“序列图”对话框,主要内容,11.1 时间序列的建立和平稳化11.2 指数平滑法11.3 ARIMA模型11.4 时序序列的季节性分解,11.2 指数平滑法,11.2.1 基本概念及统计原理(1)基本概念 指数平滑法的思想来源于对移动平均预测法的改进。指数平滑法的思想是以无穷大为宽度,各历史值的权重随时间的推移呈指数衰减,这样就解决了移动平均的两个难题。(2)统计原理,11.2 指数平滑法,11.2.1 基本概念及统计原
4、理(2)统计原理,简单模型,Holt线性趋势模型,11.2 指数平滑法,11.2.2 SPSS实例分析【例11-4】下表是我国19962015年私人汽车拥有量数据,试用指数平滑法对全国私人汽车拥有量进行预测分析。,11.2 指数平滑法,第1步 数据组织。将数据组织成2列,一列是“年份”,另一列是“私人汽车拥有量”,输入数据并保存。第2步 分析。看用指数平滑法处理是否恰当。按11.1.3节所述创建私人汽车拥有量的序列图,如图11-6所示。从此图可以看出,私人汽车拥有量呈逐年增加趋势,开始增长较慢,然后变快,近似线性趋势,也可以说呈增长的线性趋势,或者用指数趋势描述更准确。所以可选用指数平滑法进行
5、处理。,11.2 指数平滑法,第3步 定义日期变量。按11.1.2节所示将“年份”定义为日期变量。第4步 指数平滑法设置。(1)按“分析时间序列预测创建传统模型”顺序打开“时间序列建模器”对话框(2)“变量”选项卡设置:其中包括要选择的因变量,本例中将“私人汽车拥有量”设为自变量(3)“统计”选项卡设置(4)“图”选项卡的设置:在“图”选项卡中选择“序列”、“实测值”、“预测值”和“拟合值”四项,其中各项的解释与“统计”选项卡类似。(5)“保存”选项卡的设置:将“预测值”保存到数据文件中,预测期在“选项”选项卡中设置。可以保存的变量有“预测值”、“置信区间”的上限和下限、“噪声残值”4项。(6
6、)“选项”选项卡设置:此例中我们设置预测期到2017年,其他为默认设置。,11.2 指数平滑法,第5步 主要结果及分析。(1)下表是模型的描述表,表示对“私人汽车拥有量”变量进行指数平滑法处理,使用的是“霍尔特”模型。(2)下表是模型的拟合情况表,包含了8个拟合情况度量指标,其中“平稳R方”值为-0.642,“R方”值为0.999,并给出了每个度量模型的百分位数。,11.2 指数平滑法,第5步 主要结果及分析。(3)下表是模型统计量表,从中可以看出模型的“平稳R方”值为-0.642,另外还给出了拟合统计量及杨-博克斯统计情况,可看出其显著性为0.329。此外,所有数据中没有离群值(孤立点)。(
7、4)下表是指数平滑法拟合的模型参数表,可以看出 取值为1.000, 取值为1.000,从对应的显著性概率值可看出均较小,说明两参数具有一定的显著意义。则根据式(11.5)可得 。,11.2 指数平滑法,第5步 主要结果及分析。(5)下表是预测情况表,表中给出了20162017年“私人汽车拥有量”变量的预测值、上区间和下区间值。,11.2 指数平滑法,第5步 主要结果及分析。(6)下图是观测值与预测值的序列图。实测值、拟合值和预测值的序列图,可发现该模型对历史数据的拟合较好。,11.2 指数平滑法,第5步 主要结果及分析。(7)下图是按指数平滑法预测的20162017年“私人汽车拥有量”保存在文
8、件中的数据。,主要内容,11.1 时间序列的建立和平稳化11.2 指数平滑法11.3 ARIMA模型11.4 时序序列的季节性分解,11.3 ARIMA模型,11.3.1 基本概念及统计原理(1)基本概念 在预测中,对于平稳的时间序列,可用自回归移动平均(AutoRegres- sive Moving Average, ARMA)模型及特殊情况的自回归(AutoRegressive, AR)模型、移动平均(Moving Average, MA)模型等来拟合,预测该时间序列的未来值,但在实际的经济预测中,随机数据序列往往都是非平稳的,此时就需要对该随机数据序列进行差分运算,进而得到ARMA模型的
9、推广ARIMA模型。 ARIMA模型全称综合自回归移动平均(AutoRegressive Integrated Moving Average)模型,简记为ARIMA(p, d, q)模型,其中AR是自回归,p为自回归阶数;MA为移动平均,q为移动平均阶数;d为时间序列成为平稳时间序列时所做的差分次数。ARIMA(p, d, q)模型的实质就是差分运算与ARMA(p, q)模型的组合,即ARMA(p, q)模型经d次差分后,便为ARIMA(p, d, q)。,11.3 ARIMA模型,11.3.1 基本概念及统计原理(2)统计原理 ARMA过程,则ARMA(p, q)模型简记为,或,11.3 A
10、RIMA模型,11.3.1 基本概念及统计原理(2)统计原理 ARMA模型的识别 设ACF代表xt的自相关函数,PACF代表xt的偏自相关函数。根据Box-Jenkins提出的方法,用样本的自相关函数(ACF)和偏自相关函数(PACF)的截尾性来初步识别ARMA模型的阶数。具体如下表所示。,11.3 ARIMA模型,11.3.1 基本概念及统计原理,说明: 所谓拖尾是自相关系数或偏相关系数逐步趋向于0,这个趋向过程有不同的表现形式,有几何型的衰减,有正弦波式的衰减;而所谓截尾是指从某阶后自相关或偏相关系数为0。,11.3 ARIMA模型,11.3.1 基本概念及统计原理(2)统计原理 非平稳时
11、间序列ARIMA过程,11.3 ARIMA模型,11.3.1 基本概念及统计原理(2)统计原理 季节ARIMA模型 时间序列常呈周期性变化,或称为季节性趋势。用变通的ARIMA模型处理这种季节性趋势会导致参数过多,模型复杂。季节性乘积模型可以得到参数简约的模型。季节性乘积模型表示为ARIMA(p, d, q, sp, sd, sq)(或ARIMA(p, d, q) (sp, sd, sq)k)。其中,sp表示季节模型的自回归系数;sd表示季节差分的阶数,通常为一阶季节差分;sq表示季节模型的移动平均参数。如是月度资料,要描述年度特征,则sd = 12;如是日志资料,要描述每周特征,则sd =
12、7。,11.3 ARIMA模型,11.3.1 基本概念及统计原理(3)ARIMA建模步骤 ARIMA建模实际上包括3个阶段,即模型识别阶段、参数估计和检验阶段、预测应用阶段。其中前两个阶段可能需要反复进行。 ARIMA模型的识别就是判断p,d,q,sp,sd,sq的阶,主要依靠自相关函数(ACF)和偏自相关函数(PACF)图来初步判断和估计。一个识别良好的模型应该有两个要素:一是模型的残差为白噪声序列,需要通过残差白噪声检验,二是模型参数的简约性和拟合优度指标的优良性(如对数似然值较大,AIC和BIC较小)方面取得平衡,还有一点需要注意的是,模型的形式应该易于理解。,11.3 ARIMA模型,
13、11.3.2 SPSS实例分析【例11-5】表是某加油站55天的燃油剩余数据,其中正值表示燃油有剩余,负值表示燃油不足,要求对此序列拟合时间序列模型并进行分析。,11.3 ARIMA模型,第1步 数据组织:将数据组织成两列,一列是“天数”,另一列是“燃油量”,输入数据并保存,并以“天数”定义日期变量。第2步 观察数据序列的性质: 先作时序图,观察数据序列的特点。按“分析预测序列图”的顺序打开“序列图”对话框,将“油料量”设置为变量,并将所生成的日期新变量“DATE_”设为时间标签轴,生成如下图所示的时序图。,可以看出数据序列在0上下振荡,且无规律,可能是平稳的时间序列。,11.3 ARIMA模
14、型,再做自相关图和偏自相关图进一步分析。按“分析预测自相关”顺序打开“自相关”对话框,并在“输出”选项组中将“自相关”和“偏自相关”同时选上,输出结果如下面两图所示。,从上左图可以看出,自相关函数呈现出比较典型的拖尾性,说明数据自相关性随时间间隔下降。从上右图可以看出,除了延迟1阶的偏自相关系数在2倍标准差范围之外,其他除数的偏自相关系数都在2倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列偏自相关函数1阶截尾。,综合该序列自相关函数和偏自相关函数的性质,根据前表的模型识别规则,可以拟合模型为AR(1),即ARIMA(1, 0, 0)。,1
15、1.3 ARIMA模型,第3步 模型拟合: 按“分析预测创建模型”顺序打开“时间序列建模器”对话框,将“燃油量”选入“因变量”框。设置过程与图11-7类似,并选择“方法”下的“ARIMA”模型。“条件”对话框设置。单击“方法”右边的“条件(C)”按钮,打开“时间序列建模器:ARIMA条件”对话框,并按如下图所示进行设置。在“ARIMA阶数”框中需设置“非季节性”参数:自回归的阶p、差分的阶d和移动平均数q。如果时间序列有季节性因素,还需设置“季节性”参数sp,sd和sq。由于经过前面的分析,此例是ARIMA(1, 0, 0)模型,且无季节性影响,则只需将自回归的阶数设为1,其余均为0。,11.
16、3 ARIMA模型,“统计量”选项卡的设置:“统计量”选项卡如图11-9所示,将“按模型显示拟合度量、Ljung-Box统计量和离群值的数量”、“R方”、“标准化的BIC”、“拟合优度”、“参数估计”勾上。“图表”选项卡的设置:在其中将“序列”、“残差自相关函数”、“残差偏自相关函数”、“观测值”和“预测值”这些选项选上。其他选项卡的设置读者可参照例11-4进行。第4步 主要结果及分析:模型的统计量表,列出了模型拟合的一些统计量,包括决定系数(R方)、标准化BIC值、Ljung-Box统计量值,从结果看,拟合效果不太理想,决定系数的值偏小,而且从Sig.0.05来看,Ljung-Box统计量的
17、观测值也不显著。,11.3 ARIMA模型,ARIMA模型参数表,可以看出,AR(1)模型的参数为-0.382,参数是显著的,常数项为4.69,不显著,这里仍然保留常数项。从结果来看,其拟合模型为,自相关函数和偏自相关函数图,可以看出,残差的自相关和偏自相关函数都是0阶截尾的,因而残差是一个不含相关性的白噪声序列。因此,序列的相关性都已经充分拟合了。,主要内容,11.1 时间序列的建立和平稳化11.2 指数平滑法11.3 ARIMA模型11.4 时序序列的季节性分解,11.4 时序序列的季节性分解,11.4.1 基本概念及统计原理(1)基本概念,11.4 时序序列的季节性分解,11.4.2 S
18、PSS实例分析【例11-6】 对表11.1所示某企业的销售数据进行季节性分解。第1步 数据组织:如例11-1,进行数据组织,并定义“年份、月份”格式的日期变量。第2步 观察数据序列的性质:对销售额作时序图,具体见下图。,从该时序图可以看出,销售额总的趋势是增长的,但增长并不是单调上升的,而是有涨有落。这种升降不是杂乱无章的,和季节或月份的季节因素有关。当然,除了增长的趋势和季节影响之外,还有些无规律的随机因素的作用。,11.4 时序序列的季节性分解,第3步 季节性分析设置:按“分析预测季节性分解”顺序打开“周期性分解(季节性分解)”对话框,并按下图进行设置。,“保存”对话框的设置,11.4 时
19、序序列的季节性分解,第4步 主要结果及分析:模型的描述表,显示了模型的名称、类型及季节性期间的长度等信息,季节性因素表,由于季节性的影响,各月份的销售额有很大不同,可看出11月、12月、35月的季节性因子为负值,这几个月的销售情况比较差,12月最差。同理,8月份的销售情况最好。,11.4 时序序列的季节性分解,第4步 主要结果及分析:数据文件的数据视图,从该图中可以看到,数据文件中增加了4个序列:ERR_1表示“销售额”序列进行季节性分解后的不规则或随机波动序列;SAS_1表示“销售额”序列进行季节性分解除去季节性因素后的序列;SAF_1表示“销售额”序列进行季节性分解产生的季节性因素序列;STC_1表示“销售额”序列进行季节性分解出来的序列趋势和循环成分。,11.4 时序序列的季节性分解,第4步 主要结果及分析:季节分解后的时序图:用数据文件中新增加的4个数据序列作时序图,如下图所示。,可以看到趋势、季节性影响、随机影响等已被成功分开。,The End,谢谢观看!,
链接地址:https://www.31ppt.com/p-1453111.html