数学建模-时间序列分析.ppt
《数学建模-时间序列分析.ppt》由会员分享,可在线阅读,更多相关《数学建模-时间序列分析.ppt(187页珍藏版)》请在三一办公上搜索。
1、时间序列分析,华中农业大学数学建模基地系列课件,7000年前的古埃及人把 尼罗河涨落的情况逐天记录下来,就构成所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,从而创建了埃及灿烂的史前文明。,引例,引例,时间序列:某一系统在不同的时间(地点或其他条件等)的响应(数据)。时间序列是按一定的顺序排列而成,“一定顺序”既可以是时间顺序,也可以是具有不同意义的物理量。如:研究高度与气压的关系,这里的高度就可以看作“时间”总而言之,时间序列只是强调顺序的重要性,因此又被称为“纵向数据”,相对于“横向数据”而言的。,什么是时间序
2、列,时间序列数据的预处理 平稳性检验 纯随机性检验 平稳时间序列数据分析非平稳时间序列数据分析,内容提要,时间序列数据的预处理,时间序列数据的预处理基本概念平稳性检验纯随机性检验,概率分布的意义随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定 时间序列概率分布族的定义几个重要数字特征:均值、方差、自协方差、自相关系数,时间序列数据的预处理,1 基本概念,1.1 基本的数字特征,特征统计量,均值 方差自协方差自相关系数,时间序列数据的预处理,1.2 平稳时间序列的定义,严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列
3、才能被认为平稳。宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。,时间序列数据的预处理,满足如下条件的序列称为宽平稳序列,时间序列数据的预处理,常数均值和方差 自协方差函数和自相关函数只依赖于时间的平移长度,而与时间的起止点无关 延迟k自协方差函数 延迟k自相关系数,平稳时间序列的统计性质,时间序列数据的预处理,平稳时间序列的意义,时间序列数据结构的特殊性可列多个随机变量,而每个变量只有一个样本观察值平稳性的重大意义极大地减少了随机变量的个数,并增加了待估变量的样本容量极大地简化
4、了时序分析的难度,同时也提高了对特征统计量的估计精度,时间序列数据的预处理,平稳性检验主要有两种方法:根据时序图和自相关图显示的特征做出判断的图检验方法构造检验统计量进行假设检验的方法。,时间序列数据的预处理,2 平稳性检验,时序图检验 根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征。自相关图检验 平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。,2.1 平稳性的图检验,时间序列数据的预处理,例1检验1964年1999年中国纱年产量序
5、列的平稳性例2检验1962年1月1975年12月平均每头奶牛月产奶量序列的平稳性例3检验1949年1998年北京市每年最高气温序列的平稳性,平稳性检验,时间序列数据的预处理,例1 平稳性检验,时间序列数据的预处理,平稳性检验,时间序列数据的预处理,平稳性检验,时间序列数据的预处理,例2 自相关图,时间序列数据的预处理,例3 时序图,时间序列数据的预处理,例3 自相关图,时间序列数据的预处理,时间序列数据的预处理,等间隔时间数据的录入,程序说明(数据的录入),时间序列数据的预处理,等间隔时间数据的录入,程序说明(数据的录入),时间序列数据的预处理,数据的变换,程序说明(数据的录入),时间序列数据
6、的预处理,取数据中的子集,程序说明(数据的录入),时间序列数据的预处理,缺失数据的插入,程序说明(数据的录入),data a;input sha;year=intnx(year,1964,_n_-1);format year year4.;dif=dif(sha);cards;97 130 156.5 135.2 137.7 180.5 205.2 190 188.6 196.7180.3 210.8 196 223 238.2 263.5 292.6 317 335.4 327321.9 353.5 397.8 436.8 465.7 476.7 462.6 460.8501.8 501.5
7、 489.5 542.3 512.2 559.8 542 567;proc gplot;plot sha*year=1 dif*year=2;symbol1 v=circle i=join c=black;symbol2 v=star i=join c=red;proc arima data=a;identify var=sha nlag=22;run;,时间序列数据的预处理,1964年1999年中国纱年产量SAS程序,时间序列数据的预处理,1962年1月1975年12月平均每头奶牛月产奶量SAS程序,时间序列数据的预处理,1949年1998年北京市每年最高气温SAS程序,纯随机序列的定义纯随
8、机性的性质纯随机性检验,时间序列数据的预处理,3 纯随机性检验,3.1 纯随机序列的定义,纯随机序列也称为白噪声序列,它满足如下两条性质,时间序列数据的预处理,标准正态白噪声序列时序图,时间序列数据的预处理,3.2 白噪声序列的性质,纯随机性 各序列值之间没有任何相关关系,即为“没有记忆”的序列 方差齐性 根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的线性无偏估计,时间序列数据的预处理,3.3 纯随机性检验,检验原理假设条件检验统计量 判别原则,时间序列数据的预处理,Barlett定理,如果一个时间序列是纯随机的,得到一个观察期数为 的观察序列,那
9、么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布,时间序列数据的预处理,假设条件,原假设:延迟期数小于或等于 期的序列值之间相互独立备择假设:延迟期数小于或等于 期的序列值之间有相关性,时间序列数据的预处理,检验统计量,Q统计量 LB统计量,时间序列数据的预处理,判别原则,拒绝原假设当检验统计量大于 分位点,或该统计量的P值小于 时,则可以以 的置信水平拒绝原假设,认为该序列为非白噪声序列接受原假设当检验统计量小于 分位点,或该统计量的P值大于 时,则认为在 的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定,时间序列数据的预处理,样本自相
10、关图,例4 随机生成的100个服从标准正态的白噪声序列纯随机性检验,时间序列数据的预处理,检验结果,由于P值显著大于显著性水平,所以该序列不能拒绝纯随机的原假设。换句话说可以认为该序列的波动没有任何统计规律可循,因此可以停止对该序列的统计分析。,时间序列数据的预处理,数据预处理部分的小结:序列平稳性与纯随机性检验的基本步骤:1.绘制该序列时序图;2.自相关图检验;3.该序列若是平稳序列,进行纯随机性检验.实例:对1950年1998年北京市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进行检验。,时间序列数据的预处理,时间序列数据的预处理,data a;input year prop;cards
11、;/*数据省略*/;proc gplot;plot prop*year=1;/*所画的图记为图1*/symbol1 v=diamond i=join c=red;proc arima data=a;identify var=prop;run;,相应的SAS程序,时间序列数据的预处理,1.绘制时序图,该序列显示北京市城乡居民定期储蓄所占比例序列波动“貌似”比较平稳,时间序列数据的预处理,2.自相关图进一步检验平稳性,样本自相关图延迟3阶后,自相关系数都落在2倍标准差范围以内,而且自相关系数向零衰减的速度非常快。综合前两个步骤,可知北京市城乡居民定期储蓄所占比例为平稳序列,时间序列数据的预处理,3
12、.序列纯随机性检验,结论:由于统计量的P值0.0001,远远小于 0.05,即拒绝序列为纯随机序列的假定。因而认为京市城乡居民定期储蓄所占比例的变动不属于纯随机波动,各序列值之间有相关关系。这说明我们可以根据历史信息预测未来年份的北京市城乡居民定期储蓄所占比例,该平稳序列属于非白噪声序列,可以对其继续进行研究。,时间序列数据的预处理,平稳时间序列数据分析方法性工具与两种相关系数自回归(AutoRegression,AR)模型移动平均(Moving Average,MA)模型ARMA模型平稳序列建模,平稳时间序列数据分析,1.1 方法性工具,差分运算,一阶差分 阶差分 步差分,平稳时间序列数据分
13、析,1.方法性工具与两种相关系数,延迟算子,延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻 记 B为延迟算子,有,平稳时间序列数据分析,延迟算子的性质,平稳时间序列数据分析,则有(用延迟算子表示差分):,1.2 两种样本相关系数的基本概念与计算,样本自相关系数,样本偏自相关系数,平稳时间序列数据分析,所谓滞后k阶偏自相关系数就是指在给定中间k-1个随机变量 xt-1,xt-2,xt-k+1的条件下,或者说,在剔除了中间k-1个随机变量的干扰之后,xt-k对xt影响的相关度量。,样本偏自相关系数的计算,平稳时间序列数据分析,2.AR模型的定义
14、,具有如下结构的模型称为 阶自回归模型,简记为特别当 时,称为中心化 模型,平稳时间序列数据分析,均 值,如果AR(p)模型满足平稳性条件,则有根据平稳序列均值为常数,且 为白噪声序列,有推导出,平稳时间序列数据分析,AR(P)序列中心化变换,称 为 的中心化序列,令,平稳时间序列数据分析,中心化AR(P)模型,引进延迟算子,中心化 模型又可以简记为 自回归系数多项式,平稳时间序列数据分析,AR模型自相关系数的性质,拖尾性呈负指数衰减,平稳时间序列数据分析,例5 考察如下AR模型的自相关图,平稳时间序列数据分析,自相关系数按复指数单调收敛到零,平稳时间序列数据分析,自相关系数正负相间的衰减,平
15、稳时间序列数据分析,自相关系数呈现出“伪周期”性,平稳时间序列数据分析,自相关系数不规则衰减,平稳时间序列数据分析,偏自相关系数的截尾性,AR(p)模型偏自相关系数P阶截尾,平稳时间序列数据分析,例5续 考察如下AR模型的偏自相关图,平稳时间序列数据分析,理论偏自相关系数,样本偏自相关图,平稳时间序列数据分析,理论偏自相关系数,样本偏自相关图,平稳时间序列数据分析,理论偏自相关系数,样本偏自相关图,平稳时间序列数据分析,理论偏自相关系数,样本偏自相关系数图,平稳时间序列数据分析,3.MA模型的定义,具有如下结构的模型称为 阶移动平均模型,简记为特别当 时,称为中心化 模型,平稳时间序列数据分析
16、,移动平均系数多项式,引进延迟算子,中心化 模型又可以简记为 阶移动平均系数多项式,平稳时间序列数据分析,MA模型的统计性质,常数均值常数方差,平稳时间序列数据分析,MA模型的统计性质,MA模型的偏自相关系数拖尾,平稳时间序列数据分析,例6 考察如下MA模型的相关性质,平稳时间序列数据分析,MA模型的自相关系数截尾,平稳时间序列数据分析,MA模型的自相关系数截尾,平稳时间序列数据分析,MA模型的偏自相关系数拖尾,平稳时间序列数据分析,MA模型的偏自相关系数拖尾,平稳时间序列数据分析,4.ARMA模型的定义,具有如下结构的模型称为自回归移动平均模型,简记为特别当 时,称为中心化 模型,平稳时间序
17、列数据分析,系数多项式,引进延迟算子,中心化 模型又可以简记为 阶自回归系数多项式 阶移动平均系数多项式,平稳时间序列数据分析,ARMA(p,q)模型的统计性质,均值协方差自相关系数,平稳时间序列数据分析,ARMA模型的相关性,自相关系数拖尾偏自相关系数拖尾,平稳时间序列数据分析,例7 考察ARMA模型的相关性,拟合模型ARMA(1,1):并直观地考察该模型自相关系数和偏自相关系数的性质。,平稳时间序列数据分析,自相关系数和偏自相关系数拖尾性,样本自相关图,样本偏自相关图,平稳时间序列数据分析,自相关系数和偏自相关系数拖尾,ARMA模型相关性特征,平稳时间序列数据分析,平稳时间序列数据分析,平
18、稳时间序列的理论基础,对于任何一个离散平稳过程 它都可以分解为两个不相关的平稳序列之和,其中一个为确定性的,另一个为随机性的,不妨记作 其中:为确定性序列,为随机序列,它们需要满足如下条件(1)(2)(3),Wold分解定理(1938):,平稳时间序列数据分析,ARMA模型分解,确定性序列,随机序列,5.平稳序列建模,建模步骤模型识别参数估计模型检验模型优化序列预测,平稳时间序列数据分析,建模步骤,平稳非白噪声序列,计算样本相关系数,模型识别,参数估计,模型检验,模型优化,序列预测,Y,N,平稳时间序列数据分析,模型定阶的困难,因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,
19、本应截尾的 或 仍会呈现出小值振荡的情况由于平稳时间序列通常都具有短期相关性,随着延迟阶数,与 都会衰减至零值附近作小值波动当 或 在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?,平稳时间序列数据分析,样本相关系数的近似分布,BarlettQuenouille,平稳时间序列数据分析,模型定阶经验方法,95的置信区间模型定阶的经验方法如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎95的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,
20、通常视为(偏)自相关系数截尾。截尾阶数为d。,平稳时间序列数据分析,例8 选择合适的模型ARMA拟合1950年1998年北京市城乡居民定期储蓄比例序列。,平稳时间序列数据分析,序列偏自相关图,平稳时间序列数据分析,拟合模型识别,自相关图显示延迟3阶之后,自相关系数全部衰减到2倍标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾 偏自相关图显示除了延迟1阶的偏自相关系数显著大于2倍标准差之外,其它的偏自相关系数都在2倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 时间 序列 分析

链接地址:https://www.31ppt.com/p-5738349.html