《人大《统计学》第十一章时间序列分析.ppt》由会员分享,可在线阅读,更多相关《人大《统计学》第十一章时间序列分析.ppt(81页珍藏版)》请在三一办公上搜索。
1、统 计 学,第11章 时间序列分析,第11章 时间序列分析,1 时间序列的描述2 时间序列的分解法3 时间序列的平滑法4 ARIMA模型,1 时间序列的描述,1.1 时间序列及其分类1.2 图形描述1.3 水平变动描述 1.4 速度变动描述,1.1 时间序列及其分类,时间序列定义时间序列是同一现象按照时间顺序排列而成的一组观测值;由现象在不同时间上的观测值和现象所属的时间构成。时间序列分类绝对数时间序列 时期序列 时点序列相对数时间序列平均数时间序列,1.2 图形描述,图形描述 展示时间序列特征最直观、有效的形式,通常作为时序分析的第一步。给定一个时间序列,可以首先通过作图来观察数据随时间变化
2、的规律,然后在此基础上展开分析和建模。,1.2 图形描述,【例11.1】表11.1以年份形式给出19962007年我国国内生产总值、年末总人口、人口自然增长率、居民消费价格指数四个时间序列,通过作图描述这四个时间序列的特征和变化趋势。解:根据表11.1作图,可以判断 我国国内生产总值呈现上升的趋势,并且增长率逐年增加;年末总人口一直在增长,但增长率逐渐减少;人口自然增长率呈现线性下降的趋势;居民消费价格指数序列没有明显的趋势,但呈现出一定的循环变动。,1.2 图形描述,表11.1 国内生产总值等指标的时间序列表资料来源:中国统计年鉴2008,中国统计出版社,2008年。,1.2 图形描述,图1
3、1.1 不同时间序列的图形描述,1.3 水平变动描述,1发展水平与平均发展水平在时间序列中,令 表示现象所属的时间,表示现象在不同时间上的观测值,也称为发展水平。若将整个观测期内的发展水平与参照基期 的发展水平作对比,则 对应的发展水平 称为基期发展水平。分析研究的其他时期称为报告期,对应指标值称为报告期发展水平。平均发展水平是对整个观测期的发展水平取平均数。,1.3 水平变动描述,平均发展水平计算时间序列观测值的表现形式不同,平均发展水平的计算方法不尽相同。(1)绝对数时期序列平均发展水平即各期发展水平的简单算术平均。其计算公式为:,1.3 水平变动描述,【例11.2】根据表11.1国内生产
4、总值的时序数据,计算19962007年间我国的平均国内生产总值。解:根据,(亿元),1.3 水平变动描述,绝对数时点序列平均发展水平计算步骤1.计算出相邻两个时点观测值的平均数,将其视为这两个时点所夹的时间段 的发展水平近似值;2.以时间段 为权数,对所有时间段的发展水平近似值作加权算术平均。其计算公式为 特别地,若 相等(),计算公式为,1.3 水平变动描述,【例11.3】某公司一年内各个统计时点的职工人数见表11.2,计算该年度公司平均职工人数。表11.2 职工人数统计 单位:人,1.3 水平变动描述,解:根据1-3月平均职工人数:(人)4-6月平均职工人数:(人)7-8月平均职工人数:(
5、人)9-12月平均职工人数:(人),(人),1.3 水平变动描述,【例11.4】根据表11.1年末总人口的时序数据,计算19962007年间我国的年平均人口。解:根据,1.3 水平变动描述,(2)相对数或平均数时间序列的平均发展水平相对数或平均数时间序列的观测值通常由两个绝对数相比而成,即因此,其平均发展水平应分别计算分子和分母绝对数的平均发展水平,然后再相比得到,计算公式为:,1.3 水平变动描述,【例11.5】根据表11.1国内生产总值和年末总人口的时序数据,计算19962007年间我国人均国内生产总值的平均发展水平。解:根据例11.2和例11.4的计算结果,19962007年间我国年平均
6、国内生产总值为132816.9亿元,年平均人口数为127789万人。由,(元/人),1.3 水平变动描述,2增长量与平均增长量 增长量用来描述现象在观测期内增长的绝对数量,由报告期发展水平减去基期发展水平得到。增长量按基期的选择分类1.逐期增长量2.累计增长量,1.3 水平变动描述,设时间序列观测值为(),增长量为。计算公式为逐期增长量()累计增长量()各逐期增长量之和等于最末期的累计增长量平均增长量是各期逐期增长量的平均数,计算公式为,1.3 水平变动描述,【例11.6】根据表11.1国内生产总值的时序数据,计算1996-2007年我国国内生产总值的逐期增长量、累计增长量和平均增长量。表11
7、.3 1996-2007年国内生产总值的增长量 单位:亿元,1.3 水平变动描述,解:根据逐期增长量和累计增长量的公式得表11.3。由我国国内生产总值的平均增长量为,(亿元),1.4 速度变动描述,1发展速度根据对比的基期不同,发展速度可以分为环比发展速度和定基发展速度:环比速度描述现象逐期变化程度定基速度描述现象在观测期内总的变化程度,1.4 速度变动描述,设时间序列观测值为,发展速度为,计算公式为环比发展速度:()定基发展速度:()各期环比发展速度的连乘积等于相应的定基发展速度:相邻两个定基发展速度之商等于相应的环比发展速度:,1.4 速度变动描述,2增长速度(增长率)根据基期的不同选择,
8、增长速度可以分为环比增长速度和定基增长速度。设时间序列观测值为,增长速度为G,计算公式为环比增长速度:()定基增长速度:(),1.4 速度变动描述,【例11.7】根据表11.1国内生产总值的时序数据,计算2007年的环比发展速度、环比增长速度、定基发展速度、定基增长速度;假设2008年、2009年与2007年的环比增长率相等,预测2008年和2009年的国内生产总值。解:环比:定基:2008年和2009年的国内生产总值预测值为,(亿元),(亿元),1.4 速度变动描述,3平均发展速度与平均增长速度平均发展速度:()平均增长速度:(),1.4 速度变动描述,【例11.8】根据表11.1中国内生产
9、总值的时序数据,计算1996-2007年的平均发展速度、平均增长速度,并根据平均增长速度预测2008年和2009年的国内生产总值。解:1996-2007年的平均发展速度和平均增长速度依次为2008年和2009年的国内生产总值预测值为,(亿元),(亿元),1.4 速度变动描述,变动描述分析注意事项:1.正确选择基期2.在速度变动描述中,报告期和基期不允许有0和负数3.速度与水平应该结合分析:采用增长1%的绝对值来弥补增长率分析的局限性。增长率1%的绝对值反映增长率每增加一个百分点对应的绝对增长量,该指标一般与环比增长率结合使用,其计算公式为:增长1%的绝对值,2 时间序列的分解法,2.1 时间序
10、列的分解模型2.2 时间序列的分解步骤2.3 利用时间序列分解模型展开预测,2.1 时间序列的分解模型,时间序列的变动分解长期趋势(T)季节变动(S)循环变动(C)不规则变动(I),2.1 时间序列的分解模型,1长期趋势 长期趋势(long term trend)是时间序列在较长时期内持续上升或下降的发展态势;可以是线性的,也可以是非线性的;通常由某种固定性因素长期作用于事物产生,其发展具有持续性,有利于根据以往的观测值对未来进行预测。2季节变动 季节波动(seasonal fluctuation)是时间序列在一年内重复出现的周期性波动;“季节”不仅指一年中的四季,还可以指一年中任何一种周期,
11、如月、周、日、时等;季节波动多是由于自然因素和生产或生活条件的影响引起的,其波动具有重复性。,2.1 时间序列的分解模型,3循环变动循环变动(cyclical fluctuation)是时间序列较长时间内(通常为一年以上)上下起伏的周期性波动。循环变动是一种涨落相间的交替波动;循环变动的周期长短不一、幅度高低不同,不具有重复性。4不规则变动不规则变动(irregular variation)包含时间序列中所有没有明显规律性的变动;不规则变动是时间序列剔除长期趋势、季节变动、循环变动后的偶然性波动,又称剩余变动或随机变动。,2.1 时间序列的分解模型,构建时间序列分解模型(设 为时间序列的指标值
12、)1.加法模型:2.乘法模型:,2.2 时间序列的分解步骤,时间序列的分解步骤1图形描述2长期趋势的测定3季节变动的测定4循环变动的测定5不规则变动的测定,2.2 时间序列的分解步骤,【例11.9】表11.4是2000-2008年我国社会消费品零售总额月度时间序列。选择恰当的分解模型将该时间序列分解,并分别测算各个变动。表11.4 2000-2008年我国社会消费品零售总额月度数据 单位:亿元,2.2 时间序列的分解步骤,1图形描述。,图11.2 社会消费品零售总额月度时序图,2.2 时间序列的分解步骤,2长期趋势的测定 对于含有长期趋势的时间序列,首先采用移动平均法剔除季节变动和不规则变动,
13、再对得到的新时间序列拟合长期趋势。,图11.3 零售总额长期趋势图,2.2 时间序列的分解步骤,3季节变动的测定 在时间序列的乘法模型中,季节变动是通过季节指数来估算的;季节指数可以描述现象由于受季节因素的影响偏离其总平均水平的相对程度,可以通过按季平均法得到。按季平均法的前提是时间序列呈水平趋势,计算步骤如下:1.对多年同季数据进行简单平均,以消除不规则运动。2.将同季平均数与总平均数作比,得到季节指数。,2.2 时间序列的分解步骤,图11.4 零售总额季节指数图,2.2 时间序列的分解步骤,4循环变动的测定 由于循环波动的周期长短不一、波动大小不同,且常与不规则运动交织在一起,通常采用剩余
14、法得到;剩余法是以时间序列的分解模型为基础,从时间序列中分离趋势变动、季节变动和不规则变动,从而得到循环波动;由于分离的结果容易受其他变动因素估算效果的影响,实际通常还要结合定性分析方法。将序列 除以,即得到循环变动。,2.2 时间序列的分解步骤,5不规则变动的测定不规则变动没有规律可循,因此也采用剩余法得到。将序列SI除以S,即得到不规则变动I,,2.3 利用时间序列分解模型展开预测,展开预测具体步骤1.对各个变动历史观测值的分析和建模2.分项预测未来值3.合成时间序列的预测值注:由于不规则变动没有规律、无法预测,所以时间序列的预测模型只包含长期趋势、季节变动和循环变动三个成分。,2.3 利
15、用时间序列分解模型展开预测,【例11.10】在例11.9所建变动模型的基础上,对2009年1月至6月我国社会消费品零售总额进行预测。解:按照上述步骤,可以得到2009年上半年我国社会消费品零售月度总额的预测值,如表11.8。以2009年1月为例,其长期趋势为:,(亿元),2.3 利用时间序列分解模型展开预测,通过循环变动C的图形我们可以判断,该序列循环变动的周期较长,相对长期趋势的波动较和缓,如图11.5所示。因此直接选取2008年6月的循环变动值作为预测值:,图11.5 零售总额的循环变动图,2.3 利用时间序列分解模型展开预测,已知该时间序列1月的季节指数为110.15%。根据时间序列乘法
16、预测模型我们可以得到2009年1月我国社会消费品月度零售总额的预测值:最终得到2009年上半年6个月的预测值见表11.8。表11.8 2009年上半年社会消费品月度零售总额预测值,(亿元),2.3 利用时间序列分解模型展开预测,将2009年上半年社会消费品月度零售总额预测值与2000-2008年实际值联合绘图,可以看出预测值很好地沿承了原序列的变动特征,如图11.6所示。,图11.6 零售总额的原序列与预测值图,3 时间序列的平滑法,平滑法基本思想通过加权平均等方式消除随机波动的影响,使序列平滑化,从而展示其长期的发展趋势。平滑技术分类移动平均指数平滑平滑法运用平滑时间序列,描述序列趋势短期预
17、测,3 时间序列的平滑法,3.1 预测方法的评估3.2 移动平均法3.3 指数平滑法,3.1 预测方法的评估,衡量预测误差常用指标(1)平均绝对误差(mean absolute deviation,MAD)(2)均方误差(mean square error,MSE)(3)平均绝对百分比误差(mean absolute percentage error,MAPE)注:为时间序列第 期观测值,为第 期预测值。,3.2 移动平均法,1简单移动平均法设时间序列已有的 期观察值为,取移动平均期数为(),则第 期的预测值:第 期的预测值:,3.2 移动平均法,【例11.11】根据表11.9中我国城市居民消
18、费价格指数数据,分别取k=3和k=5,采用简单移动平均法计算各年城市居民消费价格指数的预测值,并对预测模型进行比较。(表11.9见书)解:移动平均的结果如表11.9。以3项移动平均为例,表11.9中1993年的预测值就是1990年、1991年、1992年3年的平均值;依次类推,2008年的预测值就是2005年、2006年、2007年3年的平均值。3项移动平均的均方误差是1993年至2007年误差平方的平均值。,3.2 移动平均法,各年城市居民消费价格指数的观测值与移动平均预测值如图11.7所示。,图11.7 消费价格指数的移动平均预测值,3.2 移动平均法,2加权移动平均法取移动期数为(),权
19、数为(),其中:,3.3 指数平滑法,指数平滑法指数平滑法是加权移动平均法的一种特殊形式,对距离越远的观测值赋予的权重越小,并且权重随着时间间隔的增大呈指数衰减。指数平滑法分类(依据修匀次数)1.一次指数平滑(适合对水平的时间序列进行预测)2.二次指数平滑(适合对有趋势的时间序列进行预测)3.多次指数平滑(适合对有趋势的时间序列进行预测),3.3 指数平滑法,【例11.12】根据表11.10中我国城市居民消费价格指数数据,选择、,采用指数平滑法计算各年城市居民消费价格指数的预测值,并对预测模型进行比较。(表11.10见书)解:指数平滑的结果如表11.10。以 为例,设,有依次类推,2008年的
20、预测值即2007年实际值与预测值的加权组合:,3.3 指数平滑法,各年城市居民消费价格指数的观测值与指数平滑预测值如图11.8所示。,图11.8 消费价格指数的移动平均预测,3.3 指数平滑法,预测结果:平滑系数为0.1的指数平滑预测均方误差为60.79平滑系数为0.5的指数平滑预测均方误差为37.75平滑系数为0.9的指数平滑预测均方误差为23.82就本例而言,平滑系数为0.9的指数平滑预测效果更好,选择104.2作为2008年我国城市居民消费价格指数的预测值。,4 ARIMA模型,4.1 ARIMA模型简介4.2 时间序列的自相关分析4.3 ARIMA模型的建模,4.1 ARIMA模型简介
21、,ARIMA模型 ARIMA模型是在ARMA模型基础上整合了差分运算后形成的方法,是拟合平稳序列最常用的模型。ARMA模型描述了时间序列观察值之间的相关关系,并利用这种关系预测未来值。ARIMA模型分类1.自回归模型(auto-regressive)2.移动平均模型(moving average)3.混合模型(auto-regressive and moving average),4.1 ARIMA模型简介,1ARMA模型自回归模型由前面 个观测值的线性组合加上随机误差项(服从独立同分布)得到,简记为,其模型为移动平均模型是当期的随机误差项和前面 个随机误差项的线性组合,简记为,其模型为自回归
22、移动平均模型是 和 的组合,简记为,其模型为,4.1 ARIMA模型简介,2差分法设 为后移算子,有:1阶差分2阶差分p阶差分k步差分,4.1 ARIMA模型简介,根据非平稳时间序列的不同特点,采取合适的差分运算实现其平稳:如果序列具有明显的线性趋势,1阶差分可以实现趋势平稳;如果序列具有曲线趋势,通过2阶或低阶差分可实现平稳化;如果序列变化具有季节性且波动周期为s,可以选择s步差分消除季节性波动的影响;如果差分后可以转换成平稳时间序列,也可以使用ARMA模型建模,所建模型记为,其中d为差分阶数。,4.2 时间序列的自相关分析,1自相关系数和偏自相关系数 期自相关系数反映时间序列间隔 期的观测
23、值之间的相关程度,其计算公式为:n表示时间序列的观测值个数,表示间隔时期数,表示时间序列的观测值均值。自相关系数的取值范围是-1到1。越接近1,时间序列间隔k期的观测值相关程度越大。,4.2 时间序列的自相关分析,期偏自相关系数描述在剔除中间观测值影响后间隔 期的观测值之间的相关程度,其计算公式为:这里,表示间隔时期数,表示自相关系数。偏自相关系数的取值范围也是-1到1。接近1,说明在中间观测值一定的条件下,时间序列间隔 期的观测值相关程度越大。,4.2 时间序列的自相关分析,2自相关分析图展示自相关系数和偏自相关系数的图称为自相关分析图;自相关分析图的横坐标表示间隔期数,纵坐标表示间隔 期的
24、自相关系数或偏自相关系数值;,图11.9 中国第三产业增加值序列的自相关分析图,4.2 时间序列的自相关分析,自相关分析图在ARIMA模型的建模中的作用(1)平稳性检验(2)纯随机性检验(3)模型的识别,4.2 时间序列的自相关分析,(1)平稳性检验,4.2 时间序列的自相关分析,(2)纯随机性检验,图11.10 纯随机序列的自相关系数图,4.2 时间序列的自相关分析,(3)模型的识别截尾如果自相关系数和偏自相关系数在最初的 步比较显著,之后迅速衰减为0附近的随机波动,则视为 步截尾。拖尾如果自相关系数衰减到0速度非常缓慢,就视为拖尾。,4.3 ARIMA模型的建模,ARIMA模型的建模步骤1
25、时间序列的预处理2模型的建立及估计3模型筛选及预测,4.3 ARIMA模型的建模,1时间序列的预处理平稳性检验平稳性检验主要根据自相关图法进行判断,另外,也可以适当结合时间序列的图形来判断:对非平稳时间序列,可以结合差分运算(可以反复尝试)和平稳性检验进行平稳化处理。非随机性检验在时间序列差分平稳后,还需要根据自相关图进行非纯随机性检验;时间序列的非纯随机性保证了时间序列还有相关性信息可以提取。,4.3 ARIMA模型的建模,2模型的建立及估计1.根据自相关系数和偏自相关系数的模型判别准则,初步判断模型的类型和阶数;2.对模型的参数进行估计估计方法有矩估计、极大似然估计和最小二乘估计等,这里不
26、再详细介绍;3.需要对参数和模型进行显著性检验,4.3 ARIMA模型的建模,3模型筛选及预测常用的筛选方法:采用BIC信息准则判断,选取使BIC值达到最小的模型采用MAPE、MSE判断,值越小,模型的预测误差越小将原序列与预测序列一起作图比较,通过图像可以大致判断拟合模型和原序列的差距,选择拟合差距最小的模型。,4.3 ARIMA模型的建模,【例11.13】表11.12 中是我国1978-2007年的国内生产总值,试采用ARIMA模型预测2008年的国内生产总值。表11.12 国内生产总值序列 单位:亿元,4.3 ARIMA模型的建模,解:(1)根据自相关系数进行平稳性检验。如图11.11所
27、示,自相关系数在滞后16期时仍落入置信区间外,可以判断原序列是非平稳序列。考虑采用差分平稳化。,图11.11 序列的自相关图,4.3 ARIMA模型的建模,图11.12 一阶差分序列的自相关图和偏自相关图,4.3 ARIMA模型的建模,表11.13 ARIMA(3,1,1)参数估计SPSS输出结果表11.14 ARIMA(1,1,1)参数估计SPSS输出结果,4.3 ARIMA模型的建模,我国国内生产总值序列的模型为模型的显著性检验结果如表11.15所示,模型显著成立。检验模型的有效性检验结果如图11.13所示,可以看到残差序列的信息已经被充分提取。表11.15 ARIMA(1,1,1)模型拟合显著性检验,4.3 ARIMA模型的建模,图11.13 残差序列的自相关和偏自相关图,4.3 ARIMA模型的建模,(3)根据ARIMA(1,1,1)模型预测我国2008年国内生产总值为289229.4亿元。预测效果的评价见表11.16。表11.16 ARIMA(1,1,1)模型预测效果评价,4.3 ARIMA模型的建模,最终拟合曲线与实际曲线关系见图11.14,可以看到预测值与实际值非常接近。,图11.14 实际曲线、拟合曲线和预测值,
链接地址:https://www.31ppt.com/p-5193504.html