应用时间序列分位数回归.docx
《应用时间序列分位数回归.docx》由会员分享,可在线阅读,更多相关《应用时间序列分位数回归.docx(22页珍藏版)》请在三一办公上搜索。
1、目录一、为什么需要分位数回归二、总体分位数三、样本分位数四、分位数回归的估计方法五、分位数回归模型的估计六、R软件操作分位数回归一、为什么需要分位数回归?1、一般的回归模型着重考察x对y的条件期望E(y|x)的影响,如 果y|x不是对称分布,则E(y|x)难以反映条件分布的全貌。如果能够 估计条件分布y|x的若干重要的条件分位数,比如中位数等,能够更 加全面的描述被解释变量条件分布的全貌,而不是仅仅分析被解释变 量的条件期望(均值)。不同分位数下的回归系数估计量常常不同, 即解释变量对不同水平被解释变量的影响不同。2、使用OLS进行“均值回归”,由于最小化的目标函数为残差平 方和,容易受极端值
2、影响。“分位数回归”,使用残差绝对值的加权平 均作为最小化的目标函数,不易受极端值影响。而且,分位数回归对 误差项并不要求很强的假设条件,因此对于非正态分布而言,分位数 回归系数估计量则更加稳健。二、总体分位数假设Y为连续型随机变量,其累积分布函数为Fy()。Y的“总体q 分位数”,记为yq,满足以下定义式:q=P (YWyq)=Fy(yq)总体q分位数正好将总体分布分为两部分,其中小于或等于yq的 概率为q,而大于yq的概率为(l-q)o如果q=l/2,则为中位数,正好将总体分为两个相等的部分。如果Fy()严格单调递增,则有yq=Fy1 (q)对于回归模型,记条件分布y |x的累积分布函数为
3、Fy|x()。条件分布y|x的总体q分位数,记为yq,满足以下定义式:q二 f y | x M)假设F y | x ()严格单调递增,则有Vq=Fy|X(q)由于条件累积分布函数F y|X ()依赖于x ,故条件分布y | x的总 体q分位数yq也依赖于x,记为yq(x),称为“条件分位数函数”。对于线性回归模型,如果扰动项满足同方差的假定,或扰动项的 异方差形式为乘积形式,则yq (x)是x的线性函数。证明如下:y=x,P + uu=x a eiid(O, 0 2)不失一般性,假设/ a 0o如果x为常数,则扰动项u为同方差;反之,则为乘积形式的 异方差。根据定义,条件分位数函数yq(x)满
4、足q=P 3Wyq(x)(条件分位数的定义)=P x B + uWyq (x)=P uWyq (x) - x,B =P x a e Wyq (x)-x B =P e W(yq(x)-x璀)/(x )=Ff(yq(x)-x)/( x,a)其中,FJ)为e的累积分布函数。因此,(yq(x)-x6)/(xa)=FL(q)yq(x)= x?p+ x,a*F/1(q),故 yq (x)是 x 的线性函数。在同方差的情况下,x,a为常数,所有条件分位数函数yq(x),Oq 史条件的观测值只得到1/4的权 重,而满足“ 广 条件的其余观测值则得到3/4的权重。因为估计的是1/4分位数(位于总体的底部),故较
5、大的观测值得到 的权重较小,而较小的观测值得到的权重较大。证明:将目标函数中的绝对值去掉可得min Z命斗 q(H P)+ 富”(1 q)(p 一 yd对U求一阶导数可得Zunq(-1)+(1 - q) = 0假设y(k) p. fitl = rqCfoodexp income, tau = 0.5, data = engel fmethod=,br)#进行分位数回归 fitl #直接显示分位数回归的模型和系数Call:rq(formula = foodexp income, tau = 0.5, data = engel, method = ,fb r)Coefficients: (Inte
6、rcept) income81.4822474 0.5601806Degrees of freedom: 235 total; 233 residual说明:以食物支IB (foodexp)为因变量及家庭收A(income)为自变量 拟合中位数回归模型,得到的常数项系数为81.48,自变量系数为0.56o 由此可知即使家庭没有收入来源,这个家庭也有食物支出81.48o家 庭收入每变动1个单位,食物支出同向变动0.56个单位。运行结果: summary(fitl) #得到更加详细的显示结果Call: rq(formula = foodexp 1 ncome, tau = 0.5, data =
7、engel v metho d = nbrn)tau: 1 0.5Coefficients:coefficients lower bd upper bd(Intercept) 81.4822553.25915 114.01156income0.560180.48702 0.60199说明:summary函数这里分别给出了中位数回归常数项系数和自 变量系数的上下限,相当于给出了(1-a)%的置信区间。中位数到上下 限的距离并不相等,可以看出食物支出和家庭收入的分布是偏态的。运行结果: rl = residCfitl) #得到残差序列,并赋值为变量rl acf(rl) pacf(rl) Box t
8、est (rl, type=”Ljung-Box”)# 对残差进行 LB 检验Box-Ljung testdata: rlX-squared = 18.762, df = lf p-value = 1.481e-05Series r1LagSeries r1LLOV 230.说明:通过rl = resid(fitl)命令得到中位数回归模型的残差,然后 对其画自相关图和偏自相关图,来直观的观察残差是否是白噪声序列。 根据自相关图可以看出,存在一阶自相关,其余的相关系数大部分在 两倍标准差以内。再观察偏自相关图的值,也存在一阶偏自相关,其 他滞后项大多都在两倍标准差以内,得出可能不是白噪声序列。下
9、面 进行LB统计量的检验,给出统计学的证据。LB统计量的原假设Ho: P1=P2=.二Pm,得到的P值=1.481e-05 summaryCfitip se = ,nidD #通过设置参数se,可以得到系数的假设检验Call: rq(formula = foodexp 1 ncome, tau = 0.5, data = engel, metho d = nbrn)tau: 1 0.5Coefficients:Value Std. Error t value Pr(l11)(Intercept) 81.48225 19.250664.23270 0.00003income 0.56018 0.
10、0282819.81032 0.00000说明:进行系数的显著性检验。由于残差项不是白噪声序列A.se=“rank”和B. se= iid”并不适用。选择C. se = nid” :表示按照 Huber方法逼近得到的估计量。Ho:系数与零没有显示出差异。由上 式结果知,常数项的P值为0.000030.05拒绝原假设,说明系数是显 著的;自变量的P值为0.00000F)1 2703 15.557 2.449e-07 *Sigrrif, codes: 0 * 0.001 * 0.010.05 0.l 1说明:对三个不同分位点的回归模型进行方差分析。原假设H。: 三个回归模型拟合的值没有显著性差异。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 时间 序列 位数 回归
链接地址:https://www.31ppt.com/p-5283125.html