SAS讲义 第四十课平稳时间序列分析.docx
第四十课 平稳时间序列分析对时间序列数据的分析,首先要对它的平稳性和纯随机性进行检验。根据检验的结果可以将序列 分为不同的类型,对不同类型的序列将会采用不同的分析方法。如果一个时间序列被识别为平稳非白 噪声序列,那就说明该序列是一个蕴涵着相关信息的平稳序列。在统计上,我们通常是建立一个线性 模型来拟合该序列的发展,借此提取该序列中被蕴涵着有用信息。目前,最常用的拟合平稳序列的模 型是 ARMA (Auto Regression Moving Average)模型。一、平稳性检验1. 严平稳和宽平稳平稳时间序列有两种定义,根据限制条件的严格程度,分为: 严平稳时间序列(strictly stationary)指序列所有的统计性质都不会随着时间的推移而发生 变化。 宽平稳时间序列(week stationary)指序列的统计性质只要保证序列的二阶矩平稳就能保证 序列的主要性质近似稳定。如果在任取时间,、s和*时,时间序列乂弋满足如下三个条件:(40.1)(40.2)(40.3)EX 2 <8tEX =pE(X -口)(X -口)= E(Xk - k )(X.- k)则称为宽平稳时间序列。也称为弱平稳或二阶平稳。对于正态随机序列而言,由于联合概率分布仅由 均值向量和协方差阵决定,即只要二阶矩平稳,就等于分布平稳了。2. 平稳时间序列的统计性质根据平稳时间序列的定义,可以推断出两个重要的统计性质:常数均值。即式(40.2 )的条件。自协方差只依赖于时间的平均长度。即式(40.3)的条件。如果定义自协方方差函数(autocovariance function)为:Y (t, s) - E(Xt-斗)(Xs s)(40.4)那么它可由二维函数简化为一维函数y(s-t),由此引出延迟k自协方差函数:Y (k) =Y (t,t + k)(40.5)容易推断出平稳时间序列一定具有常数方差:Dx = E(X 口)2=Y (t, t)(40.6)=Y (0)如果定义时间序列自相关函数(autocorrelation function),简记为ACF:p(t,s)=E(X 口)(X 口 )1 t s s、;DX - DX(40.7)由延迟k自协方差函数的概念可以等价得到延迟k自相关函数的概念:p(k) = E(X 丁,)(七 土)(DX DX_ : (k)'二辿VY (0)y (0),(0)(40.8)容易验证自相关函数具有几个基本性质: P (0) = 1 ; p(-k) = p(k); 自相关阵为对称非负定阵; 非惟一性。注意区分:协方差函数和相关函数一一度量两个不同事件彼此之间的相互影响的程度。自协方差函数和自相关函数一一度量用一事件在两个不同时期之间的相互影响的程度。3.样本的估计值在平稳序列场合,序列的均值等于常数意味着原本含有可列多个随机变量的均值序列变成了只含 有一个变量的常数序列,所以常数均值H的估计值为(40.9)同样可以根据平稳序列二阶矩平稳的性质,得到基于样本计算出来的各种估计值。延迟k自协方 差函数的估计值:x )(x X)t+kn 一 k(40.10)总体方差的估计值:t=in 一 k(40.11)延迟k自相关函数的估计值:P (k)=y (k)y(0)(40.12)4.平稳性检验的方法对序列的平稳性检验有两种方法:一种是根据时序图和自相关图显示的特征做出判断的图检验方 法;一是构造检验统计量进行假设检验的单位根检验(unit root test)方法。时序图和自相关图检验 单位根检验(unit root test)所谓单位根检验就是通过检验时间序列自回归特征方程的特征根是在单位圆内还是在单位圆外 (包括在单元圆上),来检验时间序列的平稳性。单位根检验统计量中最常用的是ADF检验统计量,又称增广DF检验(augmented Dickey-Fuller)。 对任一 p阶自回归AR(p)过程(40.13)工=©工 H©工 +8t 1 t -1p t - pt它的特征方程为(40.14)Xp -© Xp-1 。=01p如果该方程所有的特征根都在单位圆内,即七I <1,,'=1,2,,p则序列Xt平稳。如果至少存在一个特征根不在单位圆内,不妨设人广1,则序列X.非平稳,且自回归系数之和恰好等于1。即(40.15)© +© +.+© = 1因而,对于AR(p)过程可以通过检验自回归系数之和是否大于等于1来考察该序列的平稳性。设 p=©1+©2 + © p -1,那么原假设气:P> 0(序列Xt非平稳),ADF检验统计量:(40.16)T- P式中,S(p)为参数P的样本标准差。1979年,Dickey和Fuller使用蒙特卡洛模拟方法算出了,检验统计量的临界值表。二、纯随机性检验如果序列值彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的数据序列,即过去的 行为对未来的发展没有丝毫影响,这种序列我们称之为纯随机序列。从统计分析的角度而言,纯随机 序列是没有任何分析价值的序列。因此,为了确保平稳序列还值不值得分析下去,需要对平稳序列进 行纯随机性检验。1. 纯随机序列如果在任取时间t和,时,时间序列Xt满足如下三个条件:(40.17)r(t,s) =。2当,=s时(40.18)r(t, s) = 0当t。s时(40.19)称此序列为纯随机序列,也称为白噪声(white noise) 序列,简记为XtWN(R,b2)。之所以称之 为白噪声序列是因为人们最初发现白光具有这种特性。比较平稳时间序列的定义,可看出白噪声序列 一定是平稳序列,且是一种最简单的平稳序列。见图40-1所示是随机生成的1000个服从标准正态 分布的白噪声序列观察值。标准正态分布白噪声序列Xt43 2 10 声噪白001±002003008O70O60009O O图40-1标准正态白噪声序列时序图根据白噪声序列的定义,白噪声序列具有三个重要的性质: 常数均值(EX = u); 纯随机性(r(t, s) = 0); 方差齐性(,0, s) =。2 )。2. 纯随机性检验Barlett证明,如果一个时间序列是纯随机的,得到一个观察期数为n的观察序列Xt,那么该序 列的延迟非零期的样本自相关系数将近似服从均值为零、方差为序列观察数倒数的正态分布,即p (k) N(0, )(40.20)n式中k为延迟期数,n为样本观察期数。根据Barlett定理,可以构造Q 检验统计量和Q 检验统计量来检验序列的纯随机性。原假设:延迟期数小于或等于m期的序列值之间相互独立, 即 H。: p(l) = p(2) = =P(m); 备选假设:延 迟期数小于或等于m期的序列值之间有相关性,即H1:至少存在某个p (k)丰。1) Qbp检验统计量由Box和Pierce推导出的Qp检验统计量为:(40.21)Q =汕 p2(k)X2(m)BPk=1式中,n为序列观察期数,m为指定延迟期数。2) Qlb检验统计量因为QBp检验统计量在小样本场合时不太精确,所以Ljung和Box又推导出。场检验统计量为:Q = n(n + 2)« P 2(?X2 (m)(40.22)LB n - k )k=i'/式中,n为序列观察期数,m为指定延迟期数。m一般取值为6、12。为什么只需要检验前6期和前 12期延迟的Qlb检验统计量就可以直接判断序列是否为白噪声序列呢?这是因为平稳序列通常具有 短期相关性,只要序列时期足够长,自相关系数都会收敛于零。所以,如果序列值之间存在显著的相 关关系,通常只存在在延迟时期比较短的序列值之间,而如果短期延迟的序列之间都不存在显著的相 关关系,那么长期延迟之间就更不会存在显著的相关关系。三、方法性工具1.差分运算差分运算分为两种:k步差分和P阶差分。1) k步差分相距5的两个序列值之间的减法运算称为k步差分运算,记为v k,表示气与气一.之间的减法运算,即:(40.23)记为Nx,表示%与% |之间的减法ttt -1(40.24)Vk=气气-k2) P阶差分相距一期的两个序列值之间的减法运算称为1阶差分运算, 运算,即:Vx = x - x对1阶差分运算后序列Vx再进行一次1阶差分运算称为2阶差分,记为V2x,表示Vx与Vx 11之间的减法运算,即:(40.25)依此类推,对p-1阶差分后序列VpH再进行一次1阶差分运算称为P阶差分,记为为吐, 表示Vp-1 x与Vp-1 x |之间的减法运算,即:1(40.26)Vpx =Vp-ix -Vp-ix 12.延迟算子延迟算子类似于一个时间指针,一个延迟算子乘以当前序列值,就相当于把当前序列值的时间向 过去拨了一个时间刻度,记B为延迟算子,有Bx = xB 2 x = xBpx = xB 0 = 1(40.27)B(c - x) = c - x 1,c 为常数(1- B)n =和(-1) nCiBi ,其中Cn =而Ri=0,(用延迟算子表示的k步差分为:Vk = x t - x =(1- Bk )xt(40.28)用延迟算子表示的p阶差分为:Vpx = (1-B)px =况(-1)pCi x .(40.29)i =0四、ARMA模型ARMA模型的全称是自回归移动平均(auto regression moving average)模型,它是目前最常用的 拟合平稳时间序列的模型。ARMA模型又可细分为AR模型、MA模型和ARMA模型三大类。1.AR( p)模型具有如下结构的模型称为p阶自回归模型,简记为AR( p):(40.30)x =© +© x +© x + +© x +801 t-12 t-2p t-p t其中包含三个限制条件:模型的最高阶数为p,即4 p丰0;随机干扰序列8 t为零均值的白噪声序列, 上海财经大学经济信息管理系IS/SHUFEPage 6 of 32即8WN(0,6);当期的随机干扰与过去的序列值无关,即Ex e = 0,s < t。t8s t1)中心化的AR( p)模型当40 = 0时,式(40.30)又称为中心化的AR(P)模型。非中心化的AR(P)序列都可以通过假设满 足平稳性条件,在式(40.30)两边取期望E,根据平稳时间序列均值为常数的性质,有 Ex,=此Ex,=此,Ex_p =口,且因为8.为零均值的白噪声,有E t = 0,所以:Ex E(4 +4 x +© x + +© x +8 )t01 t -12 t-2p t - pt(40.31)n=4 +4+4 r+4 n012pn =401 -4 -4 -4如果把非中心化的AR(p)序列减去上式(40.31)中的n,则转化为中心化AR(p)序列。特别地,对于 中心化AR( p)序列,有Ex= 0。引进延迟算子,设中)=1 -4 B-4 B24 Bp,又称为p阶自回归系数多项式,则中心12p化AR( p)模型可以简记为:xt=e t(40.32)2) AR( p)模型的方差要得到平稳AR(p)模型的方差,需要借助于Green函数的帮助。下面以求AR(1)模型的方差为例来说明:x =4 x +8x =4x +8将第二式代入第一式,有x =8 +4 8 + 42x t t 1 t-11 t-2当我们继续将x。=4x +8。代入上式,一直到气=4 x +8,可得到 t-21 t-3t-21101x =8 + 48 + 4 28 + + 41-18 +4 txt t 1 t-11 t-21 10=尸 4i8 +4txi =0如果t T8,设Green函数为G =4 j,j = Q1,上式可改为j 1对气求方差为x =* 们 8j=000 八G 8j=0(40.33)Var(x )=艾 G2Var(8 ) tjt-jj=0=b 2(1 + © 2 +© 4 + . + © 2 j + . + M) 81111b 21-$ 21(40.34)3) AR( p)模型的协方差对中心化的平稳模型在等号两边同乘xtk,再求期望得到E(x x ) =© E(x x ) +© E(x x ) +© E(x x ) + E(8 x )ttk1t1tk 2t2tkptptkttk(40.35)由AR( p)模型的限制条件,有e(8 txtk) = 0,再根据平稳时间序列的统计性质依赖于时间的平均长度而与时间的起止点无关,于是可由(40.35)式得到自协方差函数的递推公式:y (k) = ©y (k 1)+© y (k 2) + +© y (k p)12p有自协方差函数只(40.36)例如,对于AR(1)模型的自协方差函数的递推公式为:y (k) =©y (k1)1=y (k 2)1 1=© k y (0)1. b 2=© kr51 1 ()2(40.37)4) AR(P)模型的自相关函数由于平稳时间序列有自相关函数p(k) =y(k)/y(0),在自协方差函数的递推公式(40.36)等号两边同除以方差函数y(0),就得到自相关函数的递推公式:p(k) = © P(k -1) + © p(k - 2) + + © p(k - p)12p(40.38)例如,对于AR(1)模型的自相关函数的递推公式为:数系关相自AR(1)模型的自相关函数ACF(k) x = 0.8 x + £延迟kp(k)5p(si)1= gp(k - 2)或 p(0)(4039)=。左根据式(40.38)可以推出,平稳AR(P)模型的自相关函数有两个显著的性质:拖尾性指自相关函数P(k)始终有非零取值,不会在k大于某个常数之后就恒等于零。负指数衰减一一随着时间的推移,自相关函数P(k)会迅速衰减,且以负指数人:(其中为 自相关函数的差分方程的特征根)的速度在减小。1.000.900.800.700.600.500.400.300.200.100.00-0.10-0.20-0.30-0.40-0.50-0.60-0.70-0.80-0.90-1.00见图40-2和图40 3所示是两个平稳AR(1)模型的理论自相关图。图40 2 ACF按负指数单调收敛到零数系关相自1.000.900.800.700.600.500.400.300.200.100.00-0.10-0.20-0.30-0.40-0.50-0.60-0.70-0.80-0.90-1.00AR(1)模型的自相关函数ACF(k)x =一 0.8 x + £延迟k图40 3 ACF按正负相间地衰减到零5) AR(P)模型的偏自相关系数对于一个平稳AR(P)模型,求出滞屏自相关系数p(k)时,实际上得到的并不是气与气k之间单纯的相关关系。因为这个p(k)还会受到中间k 1个随机变量XX,X的影响,即这k 1个随机变量既与Xt又与xtk具有相关关系。为了能单纯测度X与X,之间的相关关系,引进了时间序 列偏自相关函数(partial autocorrelation function),简记为PACF。它是在剔除了中间k 1个随机变 量的干扰之后的滞后k自相关系数,计算公式为:E(x 一 Ex )(x一 Ex )111一ktkE(x Ex )2tktktk1 xt1,xtk+1)=ttk(40.40)式中Ex = E xtIr 会ei| x ,x ,Ex = Ex | x ,xtk-1-kt-1t-k+1。如果我们用过去的顷序列值,与Xtk+1,X-k对xt 作 k阶自回归拟合即1 t2tk+1(40.41)X =0 X +0 X +0 X +£t k1 t1k 2 t2kk tkt'=p(x,xx,,x 。这说明滞后k偏自相关系数实际上等于k阶自回归模型第k kkttkt1tk+1个回归系数的值。根据这个性质很容易计算PACF的值。在公式(8.1.41)中等号两边同乘Xtk,求期望 并除以y(0),得到P =。P +。P +。P , t = 1,2,k, nt k1 t -1k 2 t-2kk t-k(40.42)取前k个方程构成的方程组:P=©P+©P +©p1 k10k 21kkk -1P=©P+©P + ©P2 k11k 22kkk -2(40.43)P =e P +e P + +e Pk k1k-1k 2 k-2kk 0该方程组被称为Yule-Walker方程。根据线性方程组求解的Gramer法则,有D=k-kk D(40.44)式中:P1 Pk-1 P1k-2P1 P1-P21:Pk -1Pk -2Pk-1Pk-2可以证明对于平稳AR( p)模型有Dk这样、=0。也就是说平稳AR( P)模型 kk的偏自相关系数具有P步截尾性。见图40-4和图405所示是两个平稳AR(1)模型的样本偏自相关图。数系关相自偏AR模型的偏自相关函数PACF(k) x = 0.8 x + £56 7 8 9 1 -198765432101234 00o0cs0o0csa°a0-图40-4 一个AR(1)模型n=101样本偏自相关函数PACF(k)图数系关相自偏AR模型的偏自相关函数PACF(k) x = 一 0.8 x19 8 7 6 5 4 3 2 101234567891 -图405 一个AR(1)模型n=101样本偏自相关函数PACF(k)图由于样本的随机性,样本偏自相关系数不会和理论偏自相关系数一样严格截尾,但可以从图40 4和图405中看出,两个平稳AR(1)模型的样本偏自相关系数1阶显著不为零,1阶之后都近似为零。样本偏自相关图可以直观地验证平稳AR(p)模型偏自相关系数具有p步截尾性。2. MA(q)模型具有如下结构的模型称为q阶移动平均,简记为MA(q):x = 口 + £ 0 £ 0 £tt 1 t-12 t-20 £(40.45)其中包含两个限制条件:模型的最高阶数为q,即0q丰0;随机干扰序列£ ,为零均值的白噪声序列,即 £ ”(0,6)。t£1)中心化的MA(q)模型当H= 0时,式(40.45)又称为中心化的MA(q)模型。非中心化的MA(q)序列都可以通过假设满足平稳性条件,在式(8.1.45)两边取期望E,根据平稳时间序列均值为常数的性质,有E疽,且因为£.为零均值的白噪声,有E£ t = 0,E£ t-1=0, E£ t2= 0,E£. q = 0,所以:Ex = E(k + £ _0£ 1 -02£ 20 £ ) = (40.46)如果把非中心化的MA(q)序列减去上式(40.46)中的H,则转化为中心化MA(q)序列。特别地,对于中心化MA(q)序列,有Ex= 0。引进延迟算子,设。(8) =1-01B -02 B20qBq,又称为q阶自移动平均系数多项式,则中心化MA(q)模型可以简记为:x =。(办tt(40.47)2) MA(q)模型的方差平稳MA(q)模型的方差为:Var(x ) = Var( + 8 -0 8 -0 8- 0 8 )=(1 +0 2 +0 2 + . + 0 2)。12q 8q t-q(40.48)3) MA(q)模型的自协方差平稳MA(q)模型的自协方差只与滞后阶数k相关,且q阶截尾。当k = 0时,y (0) = Va (x ) = (1+02 +02 + 02)。2 ;当 k > q 时y (k) = E( x x )t tk=E(n + 8 -0 8 -0 8=(-0 +tk 00 )。i=14) MA(q)模型的自相关系数y (k) = 0;当 1 < k < q 时,有)( + 8-牛 k 1一°q£tkq)(40.49)平稳MA(q)模型的自相关系数为1-0 +引如ki k+1(40.50)i=11 +0 2 + 0 25) MA(q)模型的偏自相关系数在中心化的平稳MA(q)模型场合,滞后k阶偏自相关系数为:(40.51)E(xxI x,,x )Var(xI x ,.,x)容易证明平稳MA(q)模型的偏自相关系数拖尾性。见图40-6和图40-7所示是一个平稳MA(1)模 型的样本自相关图和样本偏自相关图。MA(1)模型的自相关函数ACF(k)x = £ + 0 .8 £数系关相自1.0000.9000.8000.7000.6000.5000.4000.3000.2000.1000.000-0.100-0.200-0.300-0.400-0.500-0.600-0.700-0.800-0.900-1.000数系关相自偏延迟k图40-6 一个MA(1)模型n=101样本自相关函数截尾图MA(1)模型的偏自相关函数PACF(k)x = £ + 0 .8 £1.0000.9000.8000.7000.6000.5000.4000.3000.2000.1000.000-0.100-0.200-0.300-0.400-0.500-0.600-0.700-0.800-0.900-1.000图40-7 一个MA(1)模型n=101样本偏自相关函数拖尾图6) MA(q)模型的可逆性容易验证当两个心(1)模型具有如下结构时:模型1: % =£ -0 8模型2:1广8(40.52)1根据公式(40.50)计算,"=-°/(1+0:),它们的自相关系数正好相等。即不同的模型却拥有完全相 同的自相关系数。这种自相关系数的不惟一性将会导致拟合模型和随机时间序列之间不会是一一对应 关系。为了保证一个给定的自相关函数能够对应惟一的MA(q)模型,我们需要给模型增加约束条件。这个约束条件称为MA(q)的可逆性条件。把上式(40.52)中两个MA(1)模型表示成两个自相关AR模 型形式:模型K 1模型2:1 二 £(45注意表示成自相关AR模型时运用公式(1 -a)-1 =1 + a + a2 + a3 +,其中a =B或a = B/。 显然,当0 J <1时,模型1收敛,而模型2不收敛;当0 J1时,则模型2收敛,而模型1不收敛。 若一个MA(q)模型能够表示成收敛的AR模型形式,那么该MA(q)模型称为可逆模型。一个自相关系数惟一对应一个可逆MA(q)模型。3. ARMA( p, q)模型0 8 0 8(40.54)具有如下结构的模型称为自回归移动平均模型,简记为ARMA( p, q):X =© +© % +© % + © X + 8 0 801 t1t2 t2p tpt 1 t1若n0 = 0,该模型称为中心化ARMA(p,q)模型。模型的限制条件与AR(p)模型、MA(q)模型相同。引进延迟算子,中心化ARMA(p, q)模型简记为:(40.55)中(B) x =08tt式中:中(B) = 1。B。B2。Bp,称为p阶自回归系数多项式,12p。-1 -01B-92B2 - -BqBq,称为q阶自移动平均系数多项式。显然,当q = °时,ARMA.p, q)模型就退化成AR(p)模型;当p = 0时,ARMAp, q)模型就 退化成MA(q)模型。所以,AR(p)模型和MA(q)模型实际上是ARMA.p,q)的特例,它们统称为 ARMA模型。而ARMA,p, q)模型的统计性质也正是AR(p)模型和MA(q)模型统计性质的有机组 合。由于ARMA(p,q)模型可以转化为无穷阶移动平均模型,所以ARMA(p,q)模型的自相关系数不 截尾。同理,由于ARMA( p, q)模型也可以转化为无穷阶自回归模型,所以ARMA( p, q)模型的偏自 相关系数也不截尾。总结AR(p)模型、MA(q)模型和ARMA(p,q)模型的自相关系数和偏自相关系 数的规律,见表40.1所示。表40.1拖尾性和截尾性模型自相关系数Pkk偏自相关系数'kkkkAR( p)拖尾p阶截尾MA(q)q阶截尾拖尾ARMA( p, q)拖尾拖尾假如某个时间序列观察值可以判定为平稳非白噪声序列,计算出样本自相关系数(ACF)和样本 偏自相关系数(PACF)之后,就要根据它们表现出来的性质,选择阶数适当的ARMA模型拟合观察 一 一、一 AA值序列。即根据样本的自相关系数和样本偏自相关系数性质估计自相关阶数p和移动平均阶数q。因 此,这个过程也称为模型定阶过程或模型识别过程。由于样本的随机性,样本的自相关系数和偏自相关系数不会呈现出理论截尾的完美情况,本应截 尾处仍会呈现出小值震荡的情况。同时,由于平稳时间序列通常都具有短期相关性,随着延迟阶数变 大,自相关系数和偏自相关系数都会衰减至零值附近作小值波动。那么,如何判断自相关系数和偏自 相关系数是截尾还是拖尾呢?以及如果为截尾那么相应的阶数为多少?通常分析人员是依据样本的自相关系数和偏自相关系数近似分布来作出尽可能合理的判断。 Jankins和Watts已经证明样本自相关系数是总体自相关系数的有偏估计:(40.56).(k ) E(P ) = 1-k Pk k n J k式中k为延迟阶数,n为样本容量。根据Bartlett公式计算样本自相关系数的方差近似等于:V(P k 性 1 £ Pm=-j(40.57)当延迟阶数k足够大时,E"0;当样本容量充分大时,的叽1/n。所以样本自相关系数近似服从正态分布:(40.58)(40.59)# k N(0,n)Quenouille证明,样本偏自相关系数也同样近似服从这个正态分布:& N(0,1)kkn设显著水平取a =5%。如果样本自相关系数和样本偏自相关系数在最初的k阶明显大于2倍标准 差,而后几乎95%的系数都落在2倍标准差的范围内,且非零系数衰减为小值波动的过程非常突然, 通常视为k阶截尾;如果有超过5%的样本相关系数大于2倍标准差,或者非零系数衰减为小值波动 的过程比较缓慢或连续,通常视为拖尾。五、参数估计和检验对于一个非中心化ARMA(p,q),有(40.60)。(B) 口 + q8中(B) t 一一 AA 通过样本的自相关系数和偏自相关系数的性质,估计出自相关阶数p和移动平均阶数q。为模型定阶后,该模型共含有p+q+2个未知参数:史厂4 ,9厂° Mb:。参数用样本均值来估计 1 p 1 q 8总体均值(矩估计法)。对原序列中心化后,待估参数减少一个。对p+q+1个未知参数的估计方法有三种:矩估计、极大似然估计和最小二乘估计。1.参数的矩估计用时间序列样本数据计算出延迟1阶到p+q阶的样本自相关系数C,延迟k阶的总体自相关系 k数为P,9"通),公式中包含p + q个未知参数变量©"© ,。"通。如果用计算出的k 1 k 1 q1 p 1 q样本自相关系数来估计总体自相系数,那么有p+q个联立方程组:'P (奴。,9,9 ) = p11 p 1 q 1.< P 部,。,9,9 ) = p(40.61)k 1 p 1 q kp (奴项,9,9 ) = Pp+q 1 p 1 qp+q从中解出p+q个未知参数变量的值作为模型的参数估计值«,6,句,§。这种方法称为参数的 1 p 1 q矩估计。 . . . 白噪声序列的方差b 的矩估计,是用时间序列样本数据计算出样本方差。2来估计总体方差b28xx求得。ARMA,p,q)模型的两边同时求方差,并把相应参数变量的估计值代入,可得白噪声序列的方差估计为:1 + 6 2 + . + 6 2 木b 2 =必b 2£ 1 +02 + 02 x(40.62)2.参数的极大似然估计当总体分布类型已知时,极大似然估计ML(maximum-likelihood)是常用的估计方法。极大似然 估计的基本思想,是认为样本来自使该样本出现概率最大的总体。因此,未知参数的极大似然估计,就是使得似然函数(即联合密度函数)达到最大值的参数值。即:乙(6 ,§ ,6 ,© ;x ,x ) = max)p(x ,1 P 1 q 1 n1 i沛,。,0 ,.0 )n 1 P 1 q(40.63)在时间序列分析中,序列的总体分布通常是未知的。为了便于分析和计算,通常假设序列服从多 元正态分布,它的联合密度函数是可导的。当似然函数关于参数可导时,常常可以通过求导方法来获 得似然函数极大值对应的参数值。在求极大似然估计时,为了求导方便,常对似然函数取对数,然后 对对数似然函数中的未知参数求偏导数,得到似然方程组。理论上,只要求解似然方程组即可得到未 知参数的极大似然估计。但是在实际上是使用计算机经过复杂的迭代算法求出未知参数的极大似然估 计。极大似然估计与矩估计的比较:矩估计的优点是不要求知道总体的分布,计算量小,估计思想简 单直观。但缺点是只用到了样本自相关系数的信息,序列中的其他信息被忽略了,这导致矩估计方法 是一种比较粗糙的估计方法,它的估计精度一般较差。因此,它常被作为极大似然估计和最小二乘估 计的迭代计算的初始值。极大似然估计的优点是充分应用了每一个观察值所提供的信息,因而它的估 计精度高,同时,还具有估计的一致性、渐近正态性和渐近有效性等优良统计性质,是一种非常优良 的参数估计方法。3.参数的最小二乘估计参数的最小二乘估计ULS(unconditional least squares)是使ARMA(p,q)模型的残差平方和达到最小的那组参数值。即:Q(6,.§) = minjZ (x -。x 。X+0 £ + + 0 £)2t 1 t-1p t - p1 t -1q t-qt=1(40.64)同极大似然估计一样,未知参数的最小二乘估计通常也是使用计算机借助迭代方法求出的。由于 充分利用了序列的信息,因此最小二乘估计的精度最高。在实际运用中,最常用的是条件最小二乘估 计CLS (conditional least squares)方法。它假定时间序列过去未观察到序列值等于序列均值,如果是 中心化后的序列,则序列过去未观察到序列值等于零(xt= 0,t < 0)。根据这个假定可以的得到残差的有限项表达式:中(B)x0(B) t=x -E 兀 xZ=1(40.65)于是残差平方和达到最小的那组参数值为:(40.66)Q(4 , © ,0 , 0 ) = min在实际运用中,条件最小二乘估计CLS也是通过迭代法求出参数的估计值。4.模型检验和参数检验在拟合好模型的参数之后,一般来说,都要对该拟合模型进行必要的显著性检验。包括:模型的 显著性检验和参数的显著性检验。在ARMA模型场合,我们都使用QL笋计量检验残差序列的自相关性。为了克服DW检验的有 偏性,Durbin在1970年提出了 DW统计量的两个修正统计量:Durbin,和Durbin h统计量,这两个 统计量渐近等价。Durbin h统计量为:_ n(40.67)h = W1 - no 2P式中,n为观察值序列的长度;0 2为延迟因变量系数的最小二乘估计的方差。修正后的Dh有效地提 高了检验精度,成为延迟因变量场合常用的自相关检验统计量。参数的显著性检验是要检验每一个模型参数是否显著非零。因为如果某个参数为零,模型中包含 这个参数的乘积项就为零,可以简化模型。因此,这个检验的目的就是为了使模型最精简。原假设为: 某个未知参数P . = 0;备选假设为:P.。0。可以构造出检验未知参数显著性的t(n-m)检验统计量,其中m为参数的个数。如果某个参数不显著,即表示P.所对应的那个自变量对因变量的影响不明显,该自变量就可 以从拟合模型中剔除。剔除不显著参数对应的自变量后应重新拟合模型,最终模型将由一系列参数显 著非零的自变量表示。六、模型优化当一个拟合模型在指定的置信水平a下通过了检验,说明了在这个置信水平a下该拟合模型能有 效地拟合时间序列观察值的波动。但是这种有效的拟合模型并不是惟一的。如果同一个时间序列可以 构造两个拟合模型,且两个模型都显著有效,那么应该选择哪个拟合模型用于统计推断呢