非线性时间序列第六章.docx
《非线性时间序列第六章.docx》由会员分享,可在线阅读,更多相关《非线性时间序列第六章.docx(49页珍藏版)》请在三一办公上搜索。
1、第六章 时间序列的平滑6.1 引论 上一章我们引进非参数函数估计的基本概念,现在将它应用到时间序列别的重要平滑问题上. 对估计慢变化时间趋势,平滑技术是有用的图示工具,它产生了时域平滑(6.2). 对将来事件和与之相联系的现在与过去变量之间的关系的非参数统计推断导致了6.3的状态域平滑. 6.4 引入的样条方法是对6.3引入的局部多项式方法的有用替代. 这此方法能够容易地推广到时间序列的条件方差(波动性)的估计,甚至整个条件分布的估计,参阅6.5.6.2 时域平滑6.2.1 趋势和季节分量 分析时间序列的第一步是画数据图. 这种方法使得人们可以从视觉上检查一个时间序列是否像一个平稳随机过程.
2、如果观察到趋势或季节分量,在分析时间序列之前通常要将它们分离开来. 假定时间序列能够分解成 , (6.1)其中表示慢变函数,称为“趋势分量”,是周期函数,称为“季节分量”,是随机分量,它被假定是零均值的平稳序列. 在使用这种分解之前,可以先用方差稳定变换或Box-Cox变换. 这类幂变换有如下以参数为指标的形式 (6.2)或具有在点处连续的变换形式.这类变换由Box和Cox(1964)给出. 注意,由在幂变换中数据必须是非负的,因此,在使用幂变换之前,可能必须先实施平移变换. 我们的目的是估计和提取确定性分量和. 我们希望残差分量是平稳的,且能够用线性和非线性技术做进一步的分析. 通过推广Bo
3、x和Jenkins(1970)而发展的一个替代方法是对时间序列重复应用差分算子,直到被差分的序列表现为平稳为止. 这时,被差分的序列可以进一步平衡时间序列技术来处理. 作为说明Box和Jenkins方法的一个例子,我们先取S&P500指数的对数变换,然后计算一阶差分. 图6.1给出了这个预处理序列. 所得序列基本上是该指数中变化的每日价格的百分比. 除了几个异常值(即1987年10月19日20.47%的市场崩盘,金融市场称之为“黑色星期一”)外,这个序列显示出平稳性. 这个变换与金融工程中常用资产定价的几何布朗运动模型的离散化有关. 图6.1 1972年1月3日至1999年12月31日(上图)
4、和1999年1月4日至1999年12月31日(下图)S&P500指数对数变换的差分 我们首先把注意力集中在没有季节分量的情形,即 . (6.3)然后,我们再在6.3.8中估计趋势和季节分量.6.2.2 滑动平均 平均是最常用的消除随机噪声的技术. 假定趋势是慢变化的,使得其能够在大小为的局部时间窗中用常数来逼近,即 . (6.4)这时能够用该窗周围的局部平均来估计: , (6.5)随着中心的改变,局部窗也在移动. 例如,在图6.2中,处所得的估计是落在第一个窗内的那些数据的平均. 窗的中心移动到新的点处以构成在这些点处的估计. 随着局部窗从左向右滑动,它的轨迹就是所得的滑动平均曲线. 这是滑动
5、平均平滑的最简单的例子. 它常常被用来验证时间序列的趋势. 图6.2描绘的是从1999年1月4日到1999年12月1日S&P500指数一个月和两个月的滑动平均. 图6.2 1999年1月4日至12月31日S&P500指数和它的21个交易日(粗线) 和41个交易日(虚线)的滑动平均 在边界处,滑动平均估计的习惯做法是忽略超出观察时间范围的那些数据. 例如,是用数据的平均所得的简单估计(时间点2右边的数据比左边更多). 这种不对称平均可能会产生边界偏倚. 当边界处趋势陡峭且带宽又大时,这种边界效应更为明显. 正如图6.2所示那样,在右边界处的滑动平均低估了趋势. 该问题能够通过使用局部线性平滑.
6、(参见6.2.6)或别的边界改善方法,比如,边界核方法(Gasser和Mller 1979;Mller 1993)和数据削尖方法(Choi, Hall和Bousson 2000)来减弱. 滑动平均数列(6.5)利用了时间周围两边的数据. 这样它还依赖于时间之后的数据. 为便于预报,单变滑动平均数列 (6.6)也常被用来验证时间趋势. 数列仅用直到时间的过去的数据.6.2.3 核平滑 滑动平均估计的一个改善方法是引进一个加权设计. 这允许对所给时间点附近的数据给予较大的权数. 这也就得到了核回归估计,定义为 . (6.7)这个估计还被称为Nadaraya-Watson估计. 参阅Nadaraya
7、(1964)和Watson(1964). 当我们使用均匀核时,上述核估计就变成滑动平均估计(6.5). 当核函数有有界支撑时,核回归估计就是一个局部数据的加权平均. 当核是模在零点的单峰函数时,附近的数据点获得更多的权. 一般地,核函数不要求有一个有界的支撑,只要它薄尾的(如它是一个有二阶矩的密度函数). 的非负性要求还能被减弱. 带宽也不必是整数. 注意,在高斯核定义中的标准化常数和核的对称Beta族只是用来保证函数是一个概率密度函数. 在核回归估计中它们并不起作用. 在计算时,我们常常标准化各种核函数使得它们如图5.2那样有相同的最大值1. 由于这种标准化,(6.7)可以直观地理解为数据点
8、的有效平均. 当核函数有在中的支撑时(这样的核还可看作是单边核),核回归估计所使用的数据仅到时间. 这是单边滑动平均(6.6)的推广. 如同在核密度估计中那样,在核回归估计中带宽是一个重要参数. 如同在图6.2中所显示的那样,大的带宽产生过度平滑的估计,遗漏趋势和所估计的峰和谷的度量上的一些可能的细节. 特别地,当使用大的带宽时,估计可能产生大的偏差. 当使用小的带宽时,仅有几个局部的数据被使用,降低了估计的方差,却导致所得估计是一条波动的曲线. 例如,用带宽,滑动平均估计(6.5)简单地复制原始数据. 为了得到满意的结果需要反复尝试和修正. 带宽的数据驱动选择能够帮助我们确定所要的平滑度.
9、正如在6.2.9所看到的那样,渐近方差本质上依赖于所研究的过程的相关结构. 因此,针对独立数据的由数据驱动选择的带宽在时域平滑中效果不佳. 实际上,Altman(1990),Chu和Marron(1991a)以及Hart(1991)指出,对相依数据,通常的留一在外(leave-one-out) 交叉核实方法效果不好. 这些作者提出了几个修正的方法. 对带宽选择的嵌入方法由Ray和Tsay(1997)以及Beran和Feng(2000)提出. 以上考虑能够通过计算核回归估计的偏倚和方差得到理解. 经过直接计算,在模型(6.3)下,核估计得偏倚为.它不依赖于误差过程. 它实际上是一个逼近误差. 当
10、带宽取得小时,逼近误差小,从而偏倚也小. 另一方面,当取得大时,大多数逼近误差是大的归因于和间的距离是大的,因此,偏倚可能是大的. 这个线性估计的方差还能够被计算. 令是过程的自协方差函数,则 . (6.8)该方差依赖于自相关函数. 进一步简化需要渐近分析. 我们将在6.2.9中讨论. 在那里我们将看到当时方差的渐近行为. 但我们现在可以指出,当带宽小时,核平滑的方差增大,这归因于在局部领域中数据点数太小的缘故.6.2.4 核平滑的变种 核平滑有许多变种. (6.7)中的分母对相对于求导数和数学上的分析是不方便的. 代替用核函数的高度作为权,我们还可用核函数下方的面积作为权. 由于核函数下方的
11、总面积是1,分母不需要. 这就是隐含在Gasser-Mller估计中的基本思想. 在现在的框架下,令,其中和. Gasser和Mller(1979)提出了以下的估计:.由于总的权,所以没有分母. Gasser-Mller估计是对Priestley和Chao(1972)早期版本的一种修正. Priestley和Chao(1972)给出的估计定义为.这个估计简单地去掉了Nadaraya-Watson估计的分母. 通过积分和变量变换逼近黎曼和,对适当选择的,我们得到总的权,如果不太接近边界,且相对于小,并使得和大,则上述积分近似地等同于.事实上,只要的支撑限制在区间内,等式就精确地成立. 换句话,对
12、不在边界区域的点,总的权近似于1. 以上观点依赖于设计点为等间隔的. 事实上,Priestley和Chao估计仅能用于等间隔情形. 它不能用于6.3所讨论的状态域平滑.6.2.5 滤波 核回归是用于工程的卷积滤波的一种特殊形式. 一般地,一个长度为的线性滤波定义为 . (6.9)当有支撑时,核回归对应. 滤波能够被设计为拥有各种性质. 例如,它能够被设计成可以去掉高频信号(低通滤波),或低频信号(高通滤波)或超出某个频率范围的信号(带通滤波);见2.3.3.核平滑是一种低通滤波. 线性滤波变换可以用递推方式来定义. 例如,单边滑动平均可以对某个,利用下式来定义,这等价于用的如下的加权滑动平均:
13、.由于权以指数速度快速衰减,以上滤波实际上仅用了时刻附近的局部数据. 平滑的有效性依赖于参数. 这种方法称为指数平滑. 指数平滑是用的的一种特殊的核平滑. 这是一种单边平滑. 它仅使用直到现大时刻的数据. 关于这方面内容的进一步讨论可参见Gijbels、Pope和Wand(1999).6.2.6 局部线性平滑 局部常数逼近(6.4)能够通过使用局部线性逼近来改善. 我们把趋势通过如下线性函数局部地近似为的函数.这样,就近似地看做上述局部线性模型的截距. 可见图6.3中时刻处的图示. 窗内的数据用一个线性回归来拟合. 对局部窗附件的数据用最小二乘方法,我们通过相对于和极小化下式可得到局部截距的估
14、计.这里引进核权是为了减少距离给定时间点较远的数据的贡献. 令和是最小二乘解. 这里用下标是为了表示所得的解依赖于给定的时间点. 这时,用局部截距来估计,它有如下的精确表示 , (6.10)其中. 当从1取到时就得到整个趋势函数. 这样,局部线性平滑实际上是一种移动线性回归方法. 正如图6.3所示那样,在处的估计由一个新的局部最小二乘问题得到. 在每个数据窗中拟合的直线用实线表示. 估计的局部截距的值位于虚垂直线和局部直线的交叉处. 局部斜率是时间趋势导数的估计. 此外,这些局部窗还可以互相重叠(见图6.2). S-Plus函数“lls.s”已写成程序差可用于计算图6.3中的平滑曲线. 这个S
15、-Plus函数能够从本书的网址获得. 图6.3 使用Epanechnikov核和带宽所得的1999年1月4日至1999年12月31日S&P500指数局部线性拟合. 在每个窗中的虚抛物线表示每个局部数据点所得的权 局部线性平滑能够很容易地堆广到局部多项式平滑. 局部多项式拟合和它的应用的全面介绍可参阅Fan和Gijbels(1996). 局部多项式拟合的优点总结在6.3.3中. 注意,(6.11)中的权满足 (6.11)这就蕴涵了如果趋势是线性的,则局部线性平滑是无偏的:.换句话,无论趋势函数多以陡峭,只估计线性趋势时,局部线性平滑就是无偏的. 这对在内部以及边界处的点的同样成立. 也就是说对于
16、估计陡峭趋势,局部线性估计将有小的偏倚. 另一方面,因为类似于(6.11)的方程即便是近似地也都不成立,因此,对估计边界区域附近的点估计陡峭趋势,核平滑将有较大的偏差.6.2.7 其他的平滑方法 核局部线性平滑有许多别的方法. 例如,Gasser和Mller(1979)使用了不同于核和局部线性平滑的权形式,Jones(1997)介绍了局部线性平滑的各种形式. Fan和Gijbels(1996)给出了各种平滑技术的概述,包括样本和正交级数方法. 核回归和局部多项式建模是基于在许多格子点上的局部近似. 诸如样条这样的全局逼近方法还能够用于对时间域的平滑. 这些思想将在关于状态域平滑的6.4中介绍.
17、 对诸如时域平滑这样的等间隔设计,正交级数方法也非常容易使用. 其基本思想是先用正交矩阵对数据进行变换,然后,在高频点向零点有选择地调整系数(或向零点收缩它们). 平滑估计能够通过tapered系数的逆变换来获得. 常用的正交变换包括傅里叶变换和小波变换. 它们的统计应用可参阅Ogden(1997)、Efromovich(1999)和Vidakovic(1999)等近期出版的专著.6.2.8 季节分量修正 有许多实用的修正季节分量的方法. 在此我们概要地介绍一个方法以说明其基本大意. 假定(6.1)中的季节分量的周期是,即 . (6.12)后一个约束是一个可识别条件. 若此约束不成立时,只要加
18、一个常数到趋势分量,并在季节分量修正中减去相同的常数. 归因于约束(6.12),当是一个奇数时,趋势能够方便地用具有的滑动平均(6.5)来估计. 在(6.5)中季节分量平均掉,因而对趋势估计没有贡献. 当周期是偶数时,用如下稍加修改的形式估计趋势.季节分量能够按如下步骤来估计. 就一个例子来说,我们假定要处理的月度数据,且周期. 在3月的季节分量的值能用在3月所得一切观测值的移去趋势分量后的平均来很好地近似. 这就得到估计,其中表示的整数部分,. 在上述求和中对上下限所作的限制是为了保证数据不要太接近边界使得在趋势估计中边界影响达到最小. 这种初步估计可能不能精确地满足约束(6.12). 但这
19、能够容易地通过用下式估计季节分量来作修正. 以上方法还被用于没有趋势分量的情形. 在这种情形,不需要移去趋势,即令6.2.9 理论概况* 问题(6.3)的理论表述应该得到注意. 一个简单的方式是把所得的时间序列看作是来自如下连续过程的离散化样本路径这种表述常常被用在金融时间序列建模中. 时间单位通常取年,每星期数据被看作是以的速度抽自连续过程. 对金融中的期权定价和风险管理,这种表述是非常有效的. 然而,在时域平滑方面,这种述有一些缺点. 首先,为了能够相容地估计,我们需要在给定的时间的周围用大小为的窗局部化数据. 但是,只要过程是连续的,所有的局部数据都是高度相关的,且当时,相关系数趋于1.
20、 这就蕴涵了局部数据变化不大,因而也就不需要局部平滑. 正如在图6.2中所看到的那样,局部数据变化很大,局部平滑就能改善趋势估计. 这样,以上表述从理论的观点来看似乎是病态的. 其次,在以上的表述下,趋势和随机误差有相似的光滑度(两者都是连续的). 因此,在中没有希望将随机部分与趋势部分分离开来. 一个代替的表述是推广等间隔设计的非线性回归模型到时间序列框架. 假定所得到的时间序列是来自模型 (6.13)其中是平滑时间趋势函数,是随机过程,. 在这种表述下,我们现在能够利用平滑技术从随机噪声中分离出平滑趋势. 一个小的缺点是平滑趋势依赖于观测数量. 这个问题早就出现在具有固定设计的非参数回归文
21、献中. 实际上它不是一个严重问题. 渐近理论毕竟只是一个工具,为我们理解理论性质提供简化的结构. 用建模趋势是捕捉趋势比噪声变化更慢这一特征的简单的技术手段. 在以上两种表述之间选择哪一个依赖于所研究的问题. 在纵向数据和泛函数据分析中,Hart和Wehrly(1986)以及Silverman(1996)基本上是用前一种表述:人们通过模型观测到大量独立序列. 这种表述对他们的问题是适合的. 对时域平滑,模型(6.13)常被假定. 例如见Hall和Hart(1990),Robinson(1997),以及Johnstone和Silverman(1997). 这就保证了能捕捉到时间趋势比随机噪声更光
22、滑这一特征. 进一步,它也保证了能相容地估计时间趋势. 由公式(6.13)能够获得核和局部线性平滑的渐近性质. 估计的偏倚与具有均匀设计的独立样本情形是相同的. 核和局部线性平滑的方差经繁琐的计算也可得到. 它们依赖于噪声过程的协方差结构. 一般地,我们假定的自方差函数满足, (6.14)其中是常数. 在2.5.2中定义的分式ARIMA过程就满足(6.14). 我们将估计(6.10)重写为. 对任何,使用和(6.11),我们得到偏倚. (6.15)注意,这个偏倚不依赖于误差过程. 它完全是局部线性拟合的近似误差. 为理论叙述的简单,我们假定有有界支撑. 这个假定可以冗长的叙述为代价而得到减弱.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 非线性 时间 序列 第六
链接地址:https://www.31ppt.com/p-1744395.html