北航金融计量学第二章.ppt
1,第二章 回归模型及应用,2.1 数据和模型2.2 线性回归模型的参数估计和统计检验2.3 不满足古典假设时的计量经济问题2.4 虚拟变量与模型的稳定性问题2.5 离散因变量模型2.6 面板数据模型,2,2.1 数据和模型,时间序列数据一定时间范围内,按时间先后排列的一批统计数据。横截面数据一批发生在同一时间截面上的调查数据。面板数据兼有时间序列数据和横截面数据的数据。,3,2.2 线性回归模型的参数估计和统计检验,一元线性回归模型:,式中:Y因变量(被解释变量)分析或预测的变量;X自变量(解释变量)与因变量密切关系的变量;总体参数:0,1;随机误差:,回归分析描述一个随机变量如何随着其他随机变量的变化而变化。,4,矩阵表示的最小二乘法,(如果X有线性独立列)通过QR分解求解.,5,b的期望值,所以,b是 的无偏估计值。,6,b的协方差,7,b的协方差,对一元线性回归:,8,的估计,这里:分母是n-2,因为有两个参数是要被确定的(和)。,9,和 的统计推断,10,平方和,总平方和(TSS)=残差平方和(ESS)=回归平方和(RSS)=以上三部分的自由度分别为T-1,T-K-1和K。其中,T为样本数,K为自变量数。,11,判定系数(),被X的回归所解释的y的方差占y总方差的比例越接近1越好,12,回归/偏回归系数检验-t检验,一元回归:多元回归:,自由度T-K-1反映自变量X与因变量Y之间是否存在关系。回归/偏回归系数是否意义,是否为零;对应的自变量是否有意义。,13,回归方程的检验-方差分析法,一元线性回归:H0:2=0 H1:2 0多元线性回归:H0:1=2=m=0H1:1,2,m中至少有一个不等于零方差分析的结论是线性回归方程是否显著,是否有意义。,14,常数项(截距)的检验-t检验,检验常数项(截距)是否为零一元线性回归:自由度T2,H0:=0 H1:0,15,多元线性回归:H0:0=0 H1:00 自由度T-K-1,16,计量经济学的古典假定,模型,满足古典假设:(1)随机误差项的均值为0,即E(t)=0;(2)同方差,即var(t)=2;(3)随机误差项之间无自相关,即对于任意tj有cov(j,t)=0;(4)自变量Xj(j=2,3,K)之间不存在多重共线性,设X为解释变量Xj(j=2,3,K)的观测值矩阵。X为nK阶数值矩阵,则rk(X)=K,KT。(5)解释变量同随机项t不相关,即 cov(Xjt,t)=0,(j=2,3,K)。,2.3 不满足古典假设时的计量经济问题,17,2.3.1 异方差问题,定义:若如果古典假设的其他条件满足,惟有:var(t)2,t 1,2,T不成立,则有,即随机误差项的方差不再是常数,而是互不相同,则认为出现了异方差问题。,18,异方差的类型:,同方差性假定的意义是指每个t围绕其零平均值的变差,并不随解释变量X的变化而变化,不论解释变量观测值是大还是小,每个t的方差保持相同,即 t2=常数 在异方差的情况下,t2已不是常数,它随X的变化而变化,即 t2=f(Xt),19,异方差一般可归结为三种类型:,(1)单调递增型:t2随X的增大而增大;(2)单调递减型:t2随X的增大而减小;(3)复 杂 型:t2与X的变化呈复杂形式。,Back,20,异方差产生的原因,1、学习误差模型。人们随着学习的进展,它们的特定行为的误差也随之减少。,21,2、有关收入的模型。随着可支配收入的增加,人们选择的余地较大,这就会产生异方差性。注意,异方差性经常出现在横截面资料中,在时间序列资料中比较少见。,22,图示:,a.等方差性 b.异方差性,23,异方差性的后果,在同方差下,在异方差下,,不妨假定:,24,异方差性的后果,对于大多数经济资料,有:故虽然无偏,但不具有最小方差!,25,对回归结果的影响,存在异方差,回归结果无偏,但不具有最小方差性!T 检验失效 只有在同方差的假定下,t检验方被证明是服从t分布的。如果不满足这个假定,t检验失去意义。降低预测的精度 由于在异方差下,差数的OLS估计的方差增大,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测的精度。,26,异方差性的检验,一、图示法对于异方差检验,可以画XY 散点图;或e2X 散点图;e2 散点图。,27,散点图图示,28,White检验,对多元线性回归,设定原假设为,备择假设为“H1:存在异方差”。,29,White检验,第一步:用OLS对原模型进行回归,得到残差的估计值;第二步:对模型 用OLS得到判别系数R2。因,在一定显著性水平下,如果,则拒绝原假设,认为存在异方差现象。,30,异方差的解决方法,加权最小二乘法(weighted least squares)广义最小二乘法(generalized least squares),31,加权最小二乘法(Weighted Least Squares),基本思想最小二乘法的基本原则是使残差平方和最小。在同方差的假定下,OLS的运用是每个残差平方有相同的权数(权数为1),也就是在最优化过程中,对各点的残差平方所提供信息的重要程度是一样看待的;在异方差的假定下,由于不同的解释变量使残差偏离均值的离散程度不一样,这样应该对不同的残差平方和赋予不同的权重。,32,加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。例如,在递增异方差下,对来自较小 的子样本,其真实的总体方差较小,与回归线拟合值之间的残差 的信度较大,应予以重视;而对较大 的子样本,由于真实总体的方差较大,残差反映的信息应打折扣。,详细说明,33,加权最小二乘法就是对加了权重的残差平方和实施OLS法:对较小的残差平方 赋予较大的权数,对较大的残差平方 赋予较小的权数。,34,加权最小二乘法具体步骤,35,例如,设原模型为 随机误差项 具有异方差性,即 不再是常数,而随X的变化而变化。其中 为常数,为解释变量 的函数。,36,当 时,为同方差;当 时,为异方差。用 去乘原模型的两端,得变换后的模型:记,则 具有同方差性。因为,37,所以,可以对新模型应用OLS方法,得到,。注意:1、若 未知,一般假设 或。2、变换后的模型,拟合优度会变小,这是对样本值加权的结果。3、异方差如果是由于略去重要解释变量引起的,盲目应用WLS方法消除异方差,其参数估计值仍可能是不妥的。应该将重要的解释变量列入模型。,38,在实际建模过程中,尤其是截面数据作样本时,人们通常并不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差性,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。,39,广义最小二乘法(Generalized Least Squares),概念:先对原模型进行变换,使变换后的模型满足假定,然后对变换后的模型应用OLS方法,叫GLS方法。普通最小二乘法和加权最小二乘法都是它的特例。,40,GLS方法的应用,普通最小二乘法(OLS)要求计量模型的随机误差项相互独立或序列不相关。如果在序列相关的情况下,仍使用OLS方法估计模型参数,会产生以下后果:1、参数估计量不再有效;2、变量的显著性检验失效;3、模型的预测失效。广义最小二乘法(GLS)就是一种处理序列相关的方法。,41,对于模型 用矩阵形式表示为:Y=XB+N如果存在自相关,同时存在异方差,即有:,不符合经典回归模型的基本假设!,42,如何得到矩阵?,通常是对原模型首先采用普通最小二乘法,得到随机误差项的近似估计值,以此构成矩阵的估计量,即,43,设 用 左乘式Y=XB+N两边,得到一个新的模型:即 该新模型具有同方差性和随机误差项互相独立性。因为(为单位矩阵),44,于是可以通过普通最小二乘法估计新模型,得到参数估计量为 这就是原模型的广义最小二乘法估计量,是无偏的,有效的估计量。,45,通常,人们并不对原模型进行异方差性检验和自相关性检验,而是直接选择广义最小二乘法。如果确实存在异方差性和自相关性,则被有效的消除了;如果不存在,则广义最小二乘法等价于普通最小二乘法。,46,2.3.2 序列相关问题,定义序列相关是指随机扰动项序列相邻期之间存在相关关系存在序列相关的随机扰动项不是独立的。自相关主要表现在时间序列中。数学表达式为:因随机误差项服从均值为0的正态分布,所以序列相关性可以表示为:,47,一阶序列相关可表示为:可以证明随机误差项的协方差矩阵为:,48,自相关产生的原因,1、经济惯性 由于经济发展存在一定的趋势,形成惯性,许多经济变量前后期总是相互关联的,相邻观察值之间或多或少有一定的联系。例:消费支出对收入的时间序列分析中,当期消费支出除依赖收入等变量外,还依赖前期的消费支出,即:2、遗漏有关变量3、数据处理,49,自相关的后果,1、参数OLS的估计的方差增大,不再具有最优性质。以一元回归的参数估计值为例:,50,51,在经济问题中的自相关,大多是正自相关,0;且一般经济变量X的时间序列也大多为正自相关。这样,当随机项自相关时,参数OLS估计量的方差较无自相关时增大。2、参数显著性t检验及回归方程显著性F检验失效 由于参数 OLS估计量的方差增大,标准差也增大,在参数显著性检验时,实际计算的t统计量变小,从而接受H。假设(b1=0)的可能性增大,这表明拒绝估计值 的机会就大大增加,t检验失效。同理F检验也失效。,52,3、降低预测精度 区间预测与参数估计量的方差有关。由于参数估计量的方差估计有偏,必然使预测区间估计不准确,预测精度降低。,53,自相关的检验,1、图示法 残差et可作为随机项t的估计。如果随机项序列t存在自相关,必然会由残差序列et 反映出来。故可以利用残差序列来判断t的自相关性。,54,两种不同的散点图均可判断自相关性.2、杜宾一瓦特森(DurbinWatson)检验 DurbinWatson检验,简称DW检验,它仅限于一阶自 回归形式。,55,这种检验的方法如下。提出原假设H0:=0,随机扰动项不具有一阶自相关;备择假设:,则随机扰动项具有一阶自相关。为检验原假设,构造DW统计量,记作DW或d,56,57,58,Breusch-Godfrey检验,Breusch-Godfrey检验适用于检验模型随机误差项是否存在高阶序列相关现象,即假定误差项有如下的q阶自回归模式产生的:其中q可事先自行选定。,59,第一步:用OLS对原模型进行回归,得到残差的估计值;第二步:用模型中所有的解释变量及事先选定的q阶残差滞后值对上一步得到的残差估计值进行OLS回归,即:得出R2,可以证明,若 则拒绝原假设,即存在自相关。,60,序列相关的解决办法,差分广义最小二乘法两步最小二乘法,61,(1)差分法以一元为例,设模型为Yt=b0+b1Xt+ut,t=1,2,n(1)随机项具有一阶自回归形式:ut=ut-1+,是随机变量,满足前述假定。将模型(1)减去(1)滞后一期并乘以 得:Yt-Yt-1=b0(1-)+b1(Xt-Xt-1)+(2)令Yt*=Yt-Yt-1 Xt*=Xt-Xt-1,t=2,n此种变换称为广义差分变换。这种变换损失了一个观测值,为避免损失,K.R.凯迪雅勒提出做如下变换:Y1*=Y1 X1*=X1(2)式写成:Yt*=b0(1-)+b1 Xt*+(3),62,这样就可对(3)应用OLS进行参数估计。如果是多元线性回归模型,处理方法类似。,63,(3)二步最小二乘法(2SLS)假设要估计的结构方程为Y1=b 12Y2+b 1mYm+r 11X1+r 1kXk+u1(1)相应的简化型方程为Y2=21X1+22X2+2kXk+v2Ym=m1X1+m2X2+mkXk+vm对上述简化型的每一个方程应用OLS,得Yi=+ei(ei 称残差)代入(1)得Y1=b 12 2+b 1m+r 11X1+r 1kXk+u1*(2)对(2)应用OLS,求得,64,2.3.3 多重共线性,多重共线性是指在多元回归中,两个解释变量之间高度相关甚至是完全线性相关。例:模型 模型系数估计值为:,65,多重共线性的原因,经济变量相关的共同趋势滞后变量的引入样本资料原因,66,多重共线性引起的后果,完全多重共线性的影响 无法估计模型参数 参数估计方差无穷大不完全多重共线性的影响 可以估计参数,但参数估计不稳定 估计值的方差变大 可能导致模型设定误差,67,多重共线性的检验检验方法主要有判定系数法、逐步回归法等。判定系数法:对于 k个解释变量,把其中一个解释变量对其他k-1个解释变量进行线性回归,然后根据其判定系数的大小,来判定是否存在多重共线性。即分别做以下回归:X1=a1X2+a2X3+ak-1Xk+utX2=a1X1+a2X3+ak-1Xk+utXk=a1X1+a2X2+ak-1Xk-1+ut各回归方程的判定系数为R12,R22,Rk2,从中找出最大者,如Rj2,若Rj2接近于1,则可判定Xj与其他解释变量中的一个或多个相关程度高。从而判定原模型中由于引进了解释变量Xj,而导致高度的多重共线性。,68,2.3.4 解释变量与误差项相关,线性回归的古典假设要求解释变量同随机项t不相关,即 cov(Xjt,t)=0,(j=2,3,K)。但在实际问题中,经常会遇到解释变量与误差项相关,即 cov(Xjt,t)0。产生原因:测量误差 遗漏有关随机变量后果:估计为有偏的,69,2.4 虚拟变量与模型的稳定性问题,虚拟变量(Dummy variable)是一种取值为0或1的变量。这些变量反映的是某种性质或属性。其实质是反映某种性质或属性是否存在,并且规定在变量值取1时表示存在,取0时表示不存在。虚拟变量对那些反映本质、属性或制度的因素加以量化,通过检验虚拟变量的显著性来分析这些制度或属性因素对被解释变量的影响。,70,用虚拟变量检验股票市场的“周内效应”,“周内效应”是指股票市场价格在一周内存在周期波动的现象,反映为日收益率在一周内的某些天显著为正,而在另外一些时间显著为负。奉立城,中国股票市场的周内效应,经济研究,2000年第11期。,Rt 上证综合指数/深圳成分指数的日收益率;Dit 一周中星期i的虚拟变量。,71,如果参数 在统计上显著不为零,就表明存在显著的“周内效应”或“星期i效应”。对1992年6月1日至1998年6月30日上证综合指数的日收益率进行星期二效应的检验,结果为 D2t前系数的p值为0.007,拒绝零假设,说明上海股市存在显著为负的星期二效应。,72,如果所有参数,j=1,2,3,4,5在统计上不同时为零,则表明存在显著的周内效应。奉立城,中国股票市场的“月份效应”和“月初效应”,管理科学,2003年第1期。,实证结果表明,中国股票市场并不存在绝大多数工业发达国家股票市场和其他某些新兴股票市场所普遍具有的“一月份效应”。但是实证分析显示,沪深两市均存在显著的“月初效应”。,73,用虚拟变量检验回归模型的稳定性,模型的稳定性检验是指当回归模型采用的样本期发生变化时,模型的回归系数是否发生变化。系数的稳定性检验:,上证B股市场在2001年2月前不对国内投资者开放,在其后对国内投资者开放,进而以2001年2月为分界点,检验系数的稳定性。,74,哑变量法 令 原模型变形为:,t=1,2,T(T为样本期数),75,Chow检验(邹至庄)Chows断点(Breakpoint)检验:对每个子样本单独拟合方程来观察估计方程是否有显著差异。零假设是两个子样本拟合的方程无显著差异;备择假设意味着关系中的结构发生改变。Chows预测(Forecast)检验:先对包含前T1个观察值的子样本建立模型,然后用这个模型对后T2个观察值的自变量进行预测,若实际值与预测值有很大变动,就可以怀疑这两个子样本估计关系的稳定性。,76,Chows Breakpoint检验:合并全部数据,用整个样本期内的数据估计模型,得到残差平方和RSS=S1。分别用不同子样本估计模型,得到残差平方和S2、S3。令S4=S2+S3,S5=S1-S4。计算统计量 若F大于临界值,则拒绝不同样本期下回归模型系数相同的假设,模型结构不稳定。反之亦反之。,77,沈艺峰、洪锡熙,我国股票市场贝塔系数的稳定性检验,厦门大学学报(哲学社会科学版),1999年第4期。,利用Chow检验方法对深圳交易所交易数据进行实证分析,结果表明,在我国证券市场上,无论是单个股票还是股票组合,贝塔系数都不具稳定性(见文章第4页)。这说明目前我国证券市场的市场风险是变动不定和难以预测的。,78,案例货币需求稳定性的实证检验,如果货币需求函数是稳定的,即货币需求和一些主要变量如规模变量(收入等)、机会成本变量(利率等)之间的关系是稳定的,那么货币供应量的变化对产出和物价的影响就比较容易预测,货币政策就能成为调节宏观经济的有效工具。货币需求的决定因素可表示为:设货币需求函数的形式为:,货币需求函数的稳定性意味着:从一个角度看,按照不同样本期数据进行回归,所得到的模型参数应该保持不变;从另一个角度看,利用某一样本期数据得到的回归模型,对下一阶段的货币余额进行估测时,误差应较小。,79,2.5 离散因变量模型虚拟变量作被解释变量的情况,离散因变量模型 令Yi取1的概率为Pi:上述模型不能作为实际研究二元选择问题的模型:条件 不满足;随机项不服从正态分布二点分布;随机项具有异方差性GLS。解决办法:回归式左边用观测值取1的概率Pi取代观测值。在实际操作中通过对数据进行分组,用Yi取1的相对频率作为概率Pi;右边用函数 取代原回归式。,80,根据函数 具体形式的不同,二元选择的离散因变量模型分为两类:Logit模型 Probit模型,f(z)为标准正态分布的概率密度函数。,81,案例中国上市公司股权融资偏好的分析,内部融资 自有资金企业资金来源 生产经营过程中的资金积累 IPO 股权融资 配股 外部融资 增发 债务融资 银行 非银行金融机构,西方理论和实证都表明,企业优先偏好内部融资,其次是债务融资,最后是股权融资。而中国上市公司存在显著的股权融资偏好,较多学者将此归因于股权融资成本偏低。,82,陆正飞、叶康涛,中国上市公司股权融资偏好解析偏好股权融资就是缘于融资成本低吗?,经济研究,2004年第4期。,i=1,2,N,陆正飞、高强,中国上市公司融资行为研究基于问卷调查的分析,会计研究,2003年第3期。,83,思考1股票市场的财富效应研究,财富效应是指股票所代表的虚拟财富的增长与下降会对人们的消费产生影响。研究股市财富效应的意义:提高预测经济走势的精度深入剖析财政货币政策的政策效果指导政府对股市的定位和调控,84,林琳采用中国在1996年1月至2001年9月共69个月的月度数据,用OLS研究收入及财富对消费的影响,其中财富分解为居民储蓄和所持股票的市场价值,收入则分解为劳动所得和投资收益。模型为:,85,思考2股利政策与公司股权结构的关系研究,股利政策是上市公司将税后收益在股东和留存收益之间进行合理配置的策略。从公司治理与股权结构这一角度来分析股利政策的影响因素,是指在股权分散情况下,公司治理的主要矛盾是管理层和外部分散的股东之间的利益冲突,经营者损害股东的利益。股权集中较多地派发现金股利,86,2.6 面板数据模型,面板数据(panel data)是横截面数据和时间序列数据相结合的数据。Chang&Lee,Using Pooled Time-Series and Cross-section Data to Test the Firm and Time Effects in Financial Analyses,The Journal of Financial and Quantitative Analysis,Vol 12,Issue 3,pp.457471.本文利用面板数据研究了股价Pit与每股股利(Div)it及税后收益Eit之间的关系,分别建立模型如下。,87,基本模型,对个股i:,将所有研究个体(n只股票)的数据叠加起来:,此模型中所有研究个体(每只股票)在整个研究期内(t=1,2,T)具有相同的截距项 和相同的斜率系 数。如果假定个体之间的随机干扰项 独立同方差,则可以直接应用OLS对整合后的数据进行模型参数的估计合并普通最小二乘法(pooled OLS)。,88,固定影响模型 将 分为两部分:,不同个体i具有不同的;同一个体在不同时点具有相同的,但 不同:,对个股i:,将所有研究个体(n只股票)的数据叠加起来:,其中D=d1 d2 dn,此模型称为最小二乘虚拟变量模型(LSDV),根据多元回归OLS得:,89,随机影响模型,将各组不同的截距项看作由共同均值 与不同的随机扰动项 相加组成:,对个股i:,将所有研究个体(n只股票)的数据叠加起来:,可以证明,扰动项 的斜方差矩阵存在异方差现象,只能采用GLS来估计模型系数 和,2.2,线性回归模型的参数估计和统计检验,一元线性回归模型,若随机变量Yt受另一变量Xt的影响,当对每一个变量给定T个观测值时,可建立如下一元线性回归模型:(2-1)其中,Yt为被解释变量;Xt为解释变量;t为随机误差项。,误差项的引入,之所以要引入误差项,是因为客观经济现象是十分复杂的,很难用有限个变量、某一种确定的形式来描述。随机误差项主要包括:在解释变量中被忽略因素的影响,变量观测值观测误差的影响,模型关系设定的误差的影响等等。,对于模型(2-1),在满足古典假设:(1)随机误差项的均值为零,即E(t)0;(2)同方差,即var(t)2;(3)随机误差项之间无自相关,即对于任意tj有Cov(j,t)=0;(4)自变量与误差项不相关,即Cov(Xt,t)=0 的情况下,对于T组样本观测值Yt,Xt(t=1,2,T),可以估计模型的有关参数,以得到变量之间的数量关系。对于模型(2-1)即是求得模型参数1和2的估计值 和,揭示出Yt和Xt之间的定量关系。,应用最多的参数估计方法是普通最小二乘法,简称OLS。,在使用该方法时得到的估计量称为最小二乘估计量。其基本思想是使被解释变量的观测值Yt与模型估计值 之差的平方和最小,即:解出由 和 组成的方程组,即得到估计值 和。,正规方程,标准方程,得到:(2-2)(2-3)其中,和 分别为X和Y的样本均值。此时模型被解释变量Yt的估计值可表示为:(2-4),相应地,记 为第t个样本观测点的残差,即被解释变量的估计值与观测值之差。由此可得随机误差项t的方差2的无偏估计值:(2-5),假设随机误差项t服从正态分布,即,则可以证明:解释变量Xt的系数估计值 也服从正态分布,即:(2-6)或化为标准正态分布形式:类似地,可证明:(2-7),在已知系数估计量概率分布的情况下,可以对有关回归模型系数的虚拟假设进行检验。但由于随机误差项t的方差2的真值未知,在用其无偏估计值 来代替的情况下,可以证明构造的统计量t服从自由度为T-2的t分布,即:(2-8)其中,T为样本观测点的个数;为参数 标准差的估计值。可由式(2-5)计算。,因此,对于虚拟假设H0:,及其备择假设H1:,其假设检验的程序与原理如第1章所述,在设定显著性水平后,通过样本数据计算出检验统计量t并同临界值相比较,以决定是否拒绝虚拟假设。,对于虚拟假设H0:20,根据式(2-8),此时计算的 t 统计量值为:这一指标由于可以反映解释变量X与被解释变量Y之间是否存在关系,因而几乎所有的统计软件中都会给出。另外,EViews统计软件还给出了虚拟假设H0:20成立时的概率,即p值。p值越小,越应该拒绝虚拟假设,意味着解释变量X对被解释变量Y的影响越显著。,衡量估计模型优劣的另一个重要指标是判断系数R2,它主要是从整体上衡量回归模型与样本观测值之间的拟合程度,对于模型Yt=1+2Xt+t,R2的计算方法是:或(2-9),R2测量了在观测值Y的方差 中,由回归模型解释的那个部分 所占的比例。显然有0R21;一般来说,R2越接近1,估计模型对实际值的拟合越好。但在实际应用中,R2达到多少才算模型通过了检验则没有绝对的标准,要视具体情况而定。特别是在金融资产价格或收益率变化规律的回归模型中,R2有时会很低,如在0.10.5之间,但为了符合模型的经济意义,较低是可以接受的。,2.2.2 多元线性回归模型,若因变量Y受多个自变量X2,X3,XK的影响,例如影响股票收益率的因素除了市场指数收益率外,还有其他因素,如债券收益率、个股本身的因素(如经营业绩,股本大小等等)。此时,对于多元线性回归,其一般形式为:,t1,2,T(2-10)或表示为:,令有 YX(2-11),同一元线性回归模型的思想类似,在满足古典假设的前提下,用向量表示普通最小二乘估计的有关结果为:模型系数的估计值(2-12)模型系数的方差(2-13)误差项方差的估计值(2-14),残差平方和(2-15)判定系数(2-16),有关变量显著性检验(t检验)的程序和原则同一元线性回归相同。另外,对于多元线性回归,还可以对方程进行总体的显著性检验,即推断模型中被解释变量与解释变量之间的线性关系在总体上显著成立,表现为检验模型(2-10)中各解释变量前的系数是否均为0。此时的虚拟假设为H0:2K0,备择假设为H1:2,3,K中至少一个不为0。,根据数理统计学的有关知识,可以证明对于构造的统计量(2-17)服从自由度为(Kl,TK)的F分布,即FF(Kl,TK)。,因此,根据变量的样本观测值,计算出F统计量,给定一个显著性水平,计算F分布的临界值F(Kl,TK)。相应地,若F F(Kl,TK),则表明在(1-)的置信水平下拒绝原假设H0,即模型线性关系显著成立。反之,则表明在(1-)的置信水平下接受原假设H0,意味着模型表示的解释变量和被解释变量之间的线性关系不显著。,金融相关点CAPM、股票系数及 系统风险占总风险的比例,马科维茨均值-方差模型将股票的投资收益率作为随机变量,用随机变量的数学期望来表示在一定时期内该种风险资产的平均收益水平,而用随机变量的方差或标准差(即实际收益率与期望值的偏离程度)来表示其风险水平。对于由多种证券组成的投资组合P,其收益率等于它所包括的各种证券的预期收益率的加权平均数,而其风险水平的计算则比较复杂。,其中心思想是:,认为股票 i 的预期收益率是由它所含有的系统风险唯一确定的,其数学形式是:(2-18),其中,E(Ri)为股票i的期望收益率;rf为无风险收益率,投资者能以这个利率进行无风险的借贷;E(Rm)为市场组合的期望收益率,通常用市场指数的收益率来代表。,夏普等人在马科维茨投资组合理论的基础上导出了资本资产定价模型(CAPM),解决了市场处于均衡状态时风险资产的确定问题。,其中,Cov(Ri,Rm)是股票 i 收益率与市场组合收益率的协方差,而Var(Rm)是市场组合收益率的方差。i作为衡量股票 i 的价格的变化率对市场指数变化率的敏感程度,用来表示该股票系统风险的大小。若i1,则这支股票被称为进取性股票(aggressive stock);反之如果i1,则这支股票被称为防守性股票。,CAPM模型描述的是均衡状态下的证券组合的期望收益率与由系数所测定的系统风险之间的线性关系。但在实证计量中只可得到事后的观察值,且均衡市场往往并不处于均衡状态,或者处于CAPM模型所未能描述的、而由其他因素所决定下的均衡状态。因此在实际计量中可以建立下面两个模型,采用OLS求得证券或证券组合的系数。,模型1:(又称为单指数模型)用市场中股票i的收益率Rit与市场组合收益率Rmt,建立一元回归模型:,t=1,2,T(2-19)模型2:用市场中股票i的超额收益率(Rit-rf)与市场组合的超额收益率(Rmt-rf),建立一元回归模型:,t=1,2,T(2-20),利用单指数模型还可以进一步的将证券或证券组合的风险结构加以分解。例如,对于一元线性回归模型(2-19),其被解释变量Rit的方差为:ESS为解释平方和 RSS为残差平方和,公式(2-21)可简写为:其含义是:用方差表示的股票 i 的总风险 分为系统风险和非系统风险两部分,其中 表示受整体市场变化的影响,即系统风险。它衡量的是整个市场大势运动引起的股票收益率波动性;为市场指数因素所无法解释的、由该股票自身因素决定的非系统风险的量度。,因此系统风险占总风险比例:(2-23)可见,一元线性回归模型Rit=ai+bi*Rmt+t的拟合优度R2就是系统风险占总风险的比重。由计量经济学的知识还可以知道拟合优度R2还是模型解释变量与被解释变量相关系数的平方。,为什么要研究系统风险占总风险的比例?,原因是这一指标在一定程度上反映了股市发展的成熟水平。例如在股市发展初期,政府的频繁干预和管理政策缺乏连续性和稳定性,使市场参与者难以形成稳定的政策预期,遇到利好消息就蜂拥买进,遇到利空消息则疯狂抛售。由于此种政策因素的影响会涉及几乎所有股票,因此它导致的系统风险是构成投资风险的主要来源。另一方面,股市投资主体的个人化现象十分严重。受能力、财力及时间的限制,个人投资者显然不可能对上市公司的经营及财务状况进行全面细致的分析,他们更多是关心政策、消息对股市市场大势的影响,而对导致非系统风险的企业自身特点则不甚敏感,股民的操作普遍存在跟风行为,盲从导致的个性迷失也使股市价格行为呈现涨跌一致现象。这两方面都导致系统风险在个股投资的总风险中比例较大。,如施东辉的研究表明,以上海证券交易所上市的50家A股为研究对象,利用1993年4月27日1996年5月31日的数据,得出的结果是在50只样本股票中,有42只股票的系统风险所占比例超过了70%,平均比例达81.37%,而西方股市中系统风险占总风险的比例如表所示:,从动态的角度看,随着上海股市规模的扩大和运作机制的逐步成熟,系统风险占总风险的比例呈现逐年下降的趋势,投资者在进行决策时更多的考虑公司本身的特点,逐步转变为“重个股,轻大盘”,公司特征正逐步得以体现。张人骥等用1993年月1日1998年12月31 日的日收益率数据,考察了上海股市风险结构的动态变化特征与趋势。,陶晋、李峰等分别给出了以月为考察时段、以周围考察时段和以日为考察时段的中国证券市场系统性风险占总风险比例的年度平均水平,整理结果如表所示。,考察系统风险占总风险的比率,对于股票市场投资组合规模和风险关系的实证研究也有较为重要的意义。通过研究投资组合系统风险占总风险的比例,可以说明如何建立一个合理规模的投资组合,以有效的降低风险,提高收益。,王新鸣利用1996年1月1999年1月184只样本股票的日收盘数据,通过随机抽取1,2,.,20只股票构成的组合,并对每一组合重复十次,以降低对单一样本的依赖,这样得到分别有1只直到20只股票组成的组合,通过对其与上海A股指数回归,得到各回归模型的判定系数R2,可见,作为评价系统风险占总风险比例的指标的判定系数R2由1只股票的0.43上升到6只股票的0.80,并且随着组合中股票数量的进一步增加,与市场相关的系统性风险占总风险的比例上升已十分缓慢,说明分散投资对消除非系统风险的效果已十分微弱。,实证案例2-1陆家嘴股份有限公司B股系数 及系统风险占总风险的比例,观察在上海证券交易所的陆家嘴股份有限公司B股的周收盘价格与上证B股指数的周收盘指数图。,观察个股的价格变化与指数的价格走势,会发现在多数情况下,当指数上升,个股的价格也随之上升;反之,当指数下降时,个股的价格也下降。如果我们用价格变化率来表示,即:(2-27)其中,Pit和It分别为股票i和市场指数在t时刻的价格;Rit和Rmt分别为陆家嘴B股的周收益率和市场指数的周收益率。,用一元线性回归模型对Rit和Rmt之间存在的相关关系,加以研究,形式为:Rit=i+iRmt+t,t=1,2,T(T为样本期数)其中,i衡量的是陆家嘴B股价格的变化率水市场指数变化率的敏感程度。,根据计量经济学的有关知识,用最小二乘法,得到:其中,,对陆家嘴B股的周收益率与上证B股指数周收益率的数据进行回归,结果如图所示。,综合结果为:Rit=-0.203+0.957Rmt可见,Rmt前的系数的估计值 为0.957,,虚拟假设“=0”成立的值p=0,因此市场指数收益率Rmt对陆家嘴B股的收益率的影响是显著的。模型拟合的判定系数R2=0.72,说明陆家嘴B股价格变化的72%可由上证B股指数(市场整体走势)的变化来解释,即对陆家嘴B股这只股票而言,系统风险在投资总风险中所占的比例为72%。,2.3.1 异方差问题,对于模型 t1,2,T同方差假设为var(t)2,t1,2,T 用协方差矩阵可表示为:,但如果古典假设的其他条件满足,惟有:var(t)2,t 1,2,T 相应的,残差的协方差矩阵为 即随机误差项的方差不再是常数,而是互不相同,则认为出现了异方差问题。,随机误差项的方差通常是随着某一个解释变量观测值的变化而变化。例如,在研究家庭收入与支出的关系时,收入越高,其可选性(消费的变化)越大,因此有理由认为低收入家庭的支出结构比较稳定,而高收入家庭的消费行为相对来讲波动较大。这种情况下,在以收入为解释变量,以消费为被解释变量的回归模型中,误差项的方差就与收入变量的观测值大小有关。此时,可以证明参数的最小二乘估计仍是无偏的,但已不具有最小方差。用于检验变量显著与否的t 检验也就是说失去了意义。如何诊断回归模型的误差项是否具有异方差性是计量经济学的一个重要课题。,诊断的方法有很多种,其基本思路是检验随机误差项的方差与解释变量观测值之间是否具有相关性。一种比较简单的方法是目测法。如果异方差的性质没有任何先验或经验的信息,可先在无异方差的假定下做回归分析,然后对残差的平方 做事后检验。看这些 是否与回归模型中的某些解释变量呈现相关关系。虽然 不等于,但可以作为替代变量,特别是在样本含量足够大时。对的检验可能出现如图2-4所示的情况。,另一个比较正式的方法是White检验。其基本过程是:对多元线性回归,var(t)2,t1,2,T设定原假设为H0:(t1,2,T),即同方差。备择假设为H1:存在异方差。,检验的第一步,对原模型用OLS得到的残差估计值,t1,2,T。,第二步,建立模型,其中模型中的变量Z2t,Z3t,Zqt包括第一步原模型中的解释变量X2t,Xkt;各解释变量的平方 以及每两个解释变量的乘积Xit Xjt。用OLS得出判定系数R2,则有。在一定的显著性水平下,如果,则拒绝原假设,即存在异方差。,例如,对于一元线性回归模型,t1,2,T,White异方差检验的第二步模型为,此时TR2服从自由度为2的 分布。,对于多元线性回归 White异方差检验的第二步模型为:此时TR2服从自由度为5的 分布。依此类推。,如果模型被检验存在异方差性,则可采用加权最小二乘法及广义最小二乘法等对模型进行估计。这些对异方差问题的检验及处理,在Eviews计量经济软件中均有相应的命令。,值得一提的是,对一些金融时间序列,如利率、汇率、通货膨胀率、股票收益率等建立回归模型并进行预测工作时,经常会发现残差的平方序列随时间的变化而变化。这一问题引出的自回归条件异方差模型(ARCH)将在第7章中详细介绍。,2.3.2 序列相关问题,对于模型 t1,2,T(2-39)随机误差项互相独立的基本假设表现为:Cov(,)=0;,i,j=1,2,T,如果古典假设的其他条件满足,但只有随机误差项互相独立不能满足,即随机误差项之间出现某种相关性,表示为:Cov(,)=0;,i,j=1,2,T 则认为出现了序列相关性。,由于随机误差项都服从均值为0的正态分布,所以序列相关性又可以表示为:,i,j=1,2,3T 比较简单的情况是误差项呈一阶序列相关,即:,则可证明模型(2-29)随机误差项的协方差矩阵为:,可见,与满足古典假设的情况相比,存在序列相关的随机误差项的协方差矩阵的的特点是矩阵非对角线上的元素不为0。,序列相关现象产生的原因是:经济时间序列数据本身往往呈现惯性的特点,相邻的观测值很可能相互依赖或出现某种滞后现象。例如在消费支出对收入的时间序列分析中,当期的消费支出除了依赖于收入等变量外,还依赖于前期的消费支出,即: