分位数回归方法及其应用.ppt
分位数回归(QR)方法及其应用,陈建宝厦门大学经济学院计统系厦门大学宏观经济研究中心,第一部分:方法介绍,主要包括分位数回归的概念,分位数回归系数的估计方法及其性质、分位数回归系数的检验方法、模型的拟合优度检验、分位数回归的优良性(与最小二乘法做比较)。,分位数回归(QR)产生的根源,Mosteller and Tukeys(1977)remark:What the regression curve does is give a grand summary for the averages of the distributions corresponding to the set of xs.We could go further and compute several different regression curves corresponding to the various percentage points of the distributions and thus get a more complete picture of the set.Ordinarily this is not done,and so regression often gives a rather incomplete picture.Just as the mean gives an incomplete picture of a single distribution,so the regression curve gives a correspondingly incomplete picture for a set of distribution.,分位数回归的思想,How to“go further”?分位数回归的思想最早是由Koenker and Bassett(1978)提出的。它是对古典条件均值模型为基础的最小二乘的拓展。普通最小二乘法是利用因变量的条件均值来建模,通过使残差平方和达到最小来获得回归参数的估计。分位数回归则利用因变量的条件分位数来建模,通过最小化加权的残差绝对值之和来估计回归参数。它可以称之为“加权的最小一乘回归法”。,分位数的概念,定义:设随机变量 Y 的分布函数为 则 Y 的第 分位数为 其中中位数可以表示为。,分位数回归思想的数学公式化,对于 Y 的一组随机样本,样本均 值是 的最优解。样本中位数是最小化残差绝对值和的解,即,对于其他的第 分位数,我们可以求解下式:等价的表示为:其中,为示性函数。,对于一般线性条件均值函数,通过求解 得到参数估计值。而一般线性条件分位数函数为,通过求解 得到参数估计值对于任意的,估计 称为第 分位数下的回归系数估计。,分位数回归参数的估计方法(点估计),求解 等价于求解以下个线性规划问题:其中 e 为单位向量。目前对上式的算法主要有如下几种:,1.单纯形算法(Simplex Method):该算法估计出来的参数具有很好的稳定性,但是在处理大型数据时运算的速度会显著的降低(见Koenker and Orey,1993)。2.内点算法(Interior Point Method):内点算法对于那些具有大量观察值和少量变量的数据集运算效率很高(见Portnoy and Koenker,1997)。3.平滑算法(Smoothing Method):平滑算法在理论上比较简单,它适合处理具有大量观察值以及很多变量的数据集(见Chen,2004)。其他方法:如adaptive method 等。,依据目前的文献,区间估计方法也可分为三种:1.直接估计法(Direct Estimation Method),见Koenker和Bassett(1982)以及Koenker和Machado(1999)。该方法依据估计出来的回归分位系数的渐进正态性来计算置信区间。比较有代表性的是Sparsity算法,它是一种最直接且运算速度也最快的算法,但该算法得到的估计值对于随机项为独立同分布这一假设十分敏感。2.秩得分法(Rank Score Method),见Koenker(1994)。秩得分法算法比较简单,但是对于大型数据处理效率较慢。3.重复抽样法(Resampling method),见He和Hu(2002)。该方法使用了MCMB(Markov Chain Marginal Bootstrap)算法,这种算法能够进行高效率的运算,大大节省了运算时间。重复抽样法能够克服直接法和秩得分法的缺陷,但是对于小样本时计算出的参数估计值不够稳定。,分位数回归参数的估计方法(区间估计),分位数回归参数的显著性检验方法,在分位数回归模型中,设 Koenker与Machado(1999)提出了检验假设(其中)的两个统计量:和 在原假设下都服从 从而,它们都可能用来检验回归系数的显著性。,分位数回归模型的拟合优度,Koenker与Machado(1999)依据最小二乘回归中拟合优度 的计算思想,提出了分位数回归中拟合优度的计算方法,定义为,且。最小二乘回归中的 依据残 差平方和度量了回归平方和占总离差平方和的比重,而 则按照残差绝对值的加权和,度量了在某个分位数 下分位数回归的拟合效果。因此不像 反映的是整个分布的拟合情况,描述的是在某个分位数下的局部拟合效果。,线性分位数回归模型的估计,分位数回归的基本性质,分位数回归的渐近性质,分位数回归的渐近性质,与普通线性最小二乘回归方法的比较,1.在模型假设方面:OLS法要求满足经典假设的几个条件;QR法只要求扰动项 的条件下。2.在计算方面:OLS法求解简单;QR法复杂,但由于计算机技术的发展,其不难完成。3.在估计的优良性方面:两者都有各自的优良性。由于QR法在模型的假设方面要求较少,较容易得到满足。特别是其估计方法(加权最小一乘估计方法)决定了其估计具有较强的稳键性。,第二部分:应用实例分析,主要结合应用实例,介绍如何利用统计软件实现分位数回归,如何对研究结果进行解释和分析。,分位数回归模型的软件计算,目前,计算分位数回归的统计软件主要有SAS以及R。Estimation in SAS:,Estimation in R(http:/www.r-project.org),Example Risk factors for low birthweight,Low birthweight is known to be associated with*Higher infant mortality(Abreveya,2001).*Higher health-care cost(Lewit et al.1995).*a Wide range of subsequent health problems(Hack et al.,1995).*long-term educational attainment and even labor market outcomes(Corman and Chaikind,1998).Investigate the facotrs influencing birthweight,especially the ones that may help reduce the incidence of low birthweight infants.,Example Risk factors for low birthweight,The research question can be rephrased as exploring the covariate effects on the lower quantiles of birthweight.Potential covariates include Mothers education Mothers prenatal care Mothers age Mothers weight gain.Covariate effects on lower quantiles may differ from those on the mean or median birthweight.Reference:Abreveya(2001)and Koenker and Hallock(2001).,Example:Exploring the risk factors of low birthweight,Example-Exploring the risk factors of low birthweight,A quantile regression model for birthweight,SAS codes for the birthweight model,Some conclusions for example,An Engel Curves for Food:This figure plots data taken from Ernst Engels(1857)study of the dependence of households food expenditure on household income,第三部分:分位数回归的发展和应用,分位数回归的发展,最小二乘方法最早是由Adrien-Marie(1806)提出的。QR法最早是由Koenker和Bassett(1978)提出的。从1978-1994年,从1994-1997年,从1997-2004年,,Less than 370 articles on QR published,446 articles on QR published,506 articles on QR published,HeteroscedasticityRobustnessCensoringSample selectionBinary response modelsPanel dataTime series,分位数回归的发展,分位数回归的发展,Noparametric modelsNon-linear modelsExtremesMultivariate quantile regression.,分位数回归的应用,在环境科学研究方面:Chock,Winkler和Chen(2000)使用非参数分位数回归法研究了匹兹堡这座城市中日死亡率和空气污染集中度的相互关系;Hilary和Andrzej(2002)运用分位数回归对天气数据进行了分析。在生态学研究方面:Koenker and Schorfheide(1994)分析了上世纪全球气候改变的过程;Dunham,Cade和Terrell(2002)研究了不同的河流对鲑鱼密度的影响。在生存分析研究方面:Koenker和Hallock(2001)研究了诸多因数对于新生儿出体重的影响;Cole和Green(1992)以及Royston和Altman(1994)还讨论了分位数回归在医学上的应用。,分位数回归的应用,在劳动力市场研究方面:Buchinsky(1996)研究了美国的劳动力市场;Schultz和Mwabu(1998)研究了南非的劳动力市场;Montenegro(1998)分析了智利的情况;Fithzenberger、Hujer、Macurdy 和 Schnabe(2001)讨论了德国劳动力市场的情况;值得一提的是Machado与Mata(2001)扩展了Oaxaca的分解法,并提出了一种依据分位数回归过程来模拟边际分布的方法来研究葡萄牙的劳动力市场;Yu,Philippe和Zhang(2005)使用贝叶斯分位数回归研究了英国1991-2001年间的工资结构的分布情况;Angrist,Chernozhukov 和Fernandez-val(2006)使用分位数回归方法研究了美国的工资结构的分布情况;Papapetrou(2006)则研究了希腊公私企业中的工资差距情况。,分位数回归的应用,在需求分析研究方面:Deaton(1997)利用分位数回归分析了巴基斯坦的Engel曲线;Hendricks与Koenker(1992)使用分位数回归研究了电力消费需求情况;Manning,Blumberg and Moulton(1995)讨论了酒精使用的需求情况;Taylor(2007)运用指数加权分位数回归来预测超级市场的日销售情况。,分位数回归的应用,在收入不平等问题研究方面:Gosling,Machin and Meghir(1996)研究了英国家庭的收入和财富的分布状况;Conley and Galenson(1998)探讨了美国的几个城市在19世纪中期财富的累积情况;Trede(1998)and Morillo(2000)比较了美国与德国的收入机动性。,分位数回归的应用,在金融资产组合研究方面:Bassett and Chen(2000,2001)运用分位数回归来评估共同基金的投资类型;Barnes和Hughes(2002)研究了美国资本市场的CAMP模型;Ma和Pohlman(2005)运用分位数回归讨论了资产收益预测与最优资产组合的构造。,分位数回归的应用,在金融风险研究方面:在金融市场的风险管理中,VaR已经成为其标志性指标。VaR能够将金融机构面临的所有种类各异、形式多样的风险加总成为一个简单的数字。Engle and Manganell(2004)首次在VaR的基础上提出了条件VaR模型(CAViaR),并使用分位数回归的方法来估计参数,通过对数据的模拟得出了这一模型对于厚尾数据的表现为最优的结论;Taylor(1999)使用分位数回归的方法来估计多期收益的风险值VaR;Chernozhukov and Umantsev(2001)使用分位数回归深入研究了CVaR的模型与估计方面的问题;Chen和Chen(2003)分别用分位数回归方法和方差-协方差法计算日经225指数的VaR值,实证结果为前者很大程度上优于后者;Georgios and Leonidas(2005)使用CAViaR 模型估计了美国和希腊证券市场中的市场风险值。,我们在分位数研究方面发表的论文,1.陈建宝、段景辉:中国性别工资差异的分位数回归分析,数量经济技术经济研究,2009.10,pp.87-97.2.段景辉、陈建宝:城乡家庭收入差异影响因素的分位数回归解析,经济学家,2009.9.No.129,pp.46-53.3.陈建宝、杜小敏:基于分位数回归的我国居民收入和消费的实证分析,统计与信息论坛,2009,Vol.24,No.7,pp.44-50.4.丁军军、陈建宝:基于CAViaR模型的股票风险实证分析.数据分析(台湾),2007,Vol.2,No.4:65-78.5.陈建宝、丁军军:分位数回归技术综述.统计与信息论坛,2008,Vol.23,No3:89-96.,6.陈建宝、王登凌、程婷婷:Empirical Study of Relations between Stock Returns and Exchange Rate Fluctuations in China.Communication in Computer and Information Science(35),2009,pp.447-454.7.陈建宝、徐燕萍、王荆杰:Empirical Analysis of Cross-section Returns in Chinese Stock Market,ICIS2010,IEEE Press(EI检索),2010.6.8.陈建宝、徐燕萍、程婷婷:Quantile Regression Analysis of Cross-section Returns in Chinese Stock Market.IFITA 2010,IEEE Press,2010.7(EI检索)9.陈建宝、程婷婷、王登凌:Are There any Influences of Oil Prices to Chinese and American Stock Returns?CSO2009,IEEE Press(EI检索),pp.524-428.10.陈建宝、程婷婷、王登凌:Quantile Regression Analysis of Cross Sectional Price-Volume Relation in Chinese Stock Markets.IFITA 2009,IEEE Press(EI检索),pp.119-122.,The end Many Thanks!,