分位数回归方法及其应用.ppt
《分位数回归方法及其应用.ppt》由会员分享,可在线阅读,更多相关《分位数回归方法及其应用.ppt(50页珍藏版)》请在三一办公上搜索。
1、分位数回归(QR)方法及其应用,陈建宝厦门大学经济学院计统系厦门大学宏观经济研究中心,第一部分:方法介绍,主要包括分位数回归的概念,分位数回归系数的估计方法及其性质、分位数回归系数的检验方法、模型的拟合优度检验、分位数回归的优良性(与最小二乘法做比较)。,分位数回归(QR)产生的根源,Mosteller and Tukeys(1977)remark:What the regression curve does is give a grand summary for the averages of the distributions corresponding to the set of xs.
2、We could go further and compute several different regression curves corresponding to the various percentage points of the distributions and thus get a more complete picture of the set.Ordinarily this is not done,and so regression often gives a rather incomplete picture.Just as the mean gives an inco
3、mplete picture of a single distribution,so the regression curve gives a correspondingly incomplete picture for a set of distribution.,分位数回归的思想,How to“go further”?分位数回归的思想最早是由Koenker and Bassett(1978)提出的。它是对古典条件均值模型为基础的最小二乘的拓展。普通最小二乘法是利用因变量的条件均值来建模,通过使残差平方和达到最小来获得回归参数的估计。分位数回归则利用因变量的条件分位数来建模,通过最小化加权的
4、残差绝对值之和来估计回归参数。它可以称之为“加权的最小一乘回归法”。,分位数的概念,定义:设随机变量 Y 的分布函数为 则 Y 的第 分位数为 其中中位数可以表示为。,分位数回归思想的数学公式化,对于 Y 的一组随机样本,样本均 值是 的最优解。样本中位数是最小化残差绝对值和的解,即,对于其他的第 分位数,我们可以求解下式:等价的表示为:其中,为示性函数。,对于一般线性条件均值函数,通过求解 得到参数估计值。而一般线性条件分位数函数为,通过求解 得到参数估计值对于任意的,估计 称为第 分位数下的回归系数估计。,分位数回归参数的估计方法(点估计),求解 等价于求解以下个线性规划问题:其中 e 为
5、单位向量。目前对上式的算法主要有如下几种:,1.单纯形算法(Simplex Method):该算法估计出来的参数具有很好的稳定性,但是在处理大型数据时运算的速度会显著的降低(见Koenker and Orey,1993)。2.内点算法(Interior Point Method):内点算法对于那些具有大量观察值和少量变量的数据集运算效率很高(见Portnoy and Koenker,1997)。3.平滑算法(Smoothing Method):平滑算法在理论上比较简单,它适合处理具有大量观察值以及很多变量的数据集(见Chen,2004)。其他方法:如adaptive method 等。,依据目
6、前的文献,区间估计方法也可分为三种:1.直接估计法(Direct Estimation Method),见Koenker和Bassett(1982)以及Koenker和Machado(1999)。该方法依据估计出来的回归分位系数的渐进正态性来计算置信区间。比较有代表性的是Sparsity算法,它是一种最直接且运算速度也最快的算法,但该算法得到的估计值对于随机项为独立同分布这一假设十分敏感。2.秩得分法(Rank Score Method),见Koenker(1994)。秩得分法算法比较简单,但是对于大型数据处理效率较慢。3.重复抽样法(Resampling method),见He和Hu(200
7、2)。该方法使用了MCMB(Markov Chain Marginal Bootstrap)算法,这种算法能够进行高效率的运算,大大节省了运算时间。重复抽样法能够克服直接法和秩得分法的缺陷,但是对于小样本时计算出的参数估计值不够稳定。,分位数回归参数的估计方法(区间估计),分位数回归参数的显著性检验方法,在分位数回归模型中,设 Koenker与Machado(1999)提出了检验假设(其中)的两个统计量:和 在原假设下都服从 从而,它们都可能用来检验回归系数的显著性。,分位数回归模型的拟合优度,Koenker与Machado(1999)依据最小二乘回归中拟合优度 的计算思想,提出了分位数回归中
8、拟合优度的计算方法,定义为,且。最小二乘回归中的 依据残 差平方和度量了回归平方和占总离差平方和的比重,而 则按照残差绝对值的加权和,度量了在某个分位数 下分位数回归的拟合效果。因此不像 反映的是整个分布的拟合情况,描述的是在某个分位数下的局部拟合效果。,线性分位数回归模型的估计,分位数回归的基本性质,分位数回归的渐近性质,分位数回归的渐近性质,与普通线性最小二乘回归方法的比较,1.在模型假设方面:OLS法要求满足经典假设的几个条件;QR法只要求扰动项 的条件下。2.在计算方面:OLS法求解简单;QR法复杂,但由于计算机技术的发展,其不难完成。3.在估计的优良性方面:两者都有各自的优良性。由于
9、QR法在模型的假设方面要求较少,较容易得到满足。特别是其估计方法(加权最小一乘估计方法)决定了其估计具有较强的稳键性。,第二部分:应用实例分析,主要结合应用实例,介绍如何利用统计软件实现分位数回归,如何对研究结果进行解释和分析。,分位数回归模型的软件计算,目前,计算分位数回归的统计软件主要有SAS以及R。Estimation in SAS:,Estimation in R(http:/www.r-project.org),Example Risk factors for low birthweight,Low birthweight is known to be associated with
10、*Higher infant mortality(Abreveya,2001).*Higher health-care cost(Lewit et al.1995).*a Wide range of subsequent health problems(Hack et al.,1995).*long-term educational attainment and even labor market outcomes(Corman and Chaikind,1998).Investigate the facotrs influencing birthweight,especially the o
11、nes that may help reduce the incidence of low birthweight infants.,Example Risk factors for low birthweight,The research question can be rephrased as exploring the covariate effects on the lower quantiles of birthweight.Potential covariates include Mothers education Mothers prenatal care Mothers age
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 位数 回归 方法 及其 应用
链接地址:https://www.31ppt.com/p-6244257.html