计量经济学的统计学基础.ppt
《计量经济学的统计学基础.ppt》由会员分享,可在线阅读,更多相关《计量经济学的统计学基础.ppt(95页珍藏版)》请在三一办公上搜索。
1、第二章 计量经济学的统计学基础,主要内容,2.1 总体、样本2.2 对总体的描述随机变量的数字特征2.3 对样本的描述样本分布的数字特征2.4 通过样本,估计总体(一)估计量的特征2.5 通过样本,估计总体(二)估计方法2.6 通过样本,估计总体(三)假设检验,2.1 总体、样本,一、总体和样本引入一个随机变量来描述总体 总体与样本间的联系在于具有相同的分布;总体就是一个随机变量,所谓样本就是n个相互独立的与总体具有相同分布的随机变量x1,xn,即n元随机变量。,二、对总体的描述:随机变量的数字特征 数学期望:方差:三、对样本的描述:样本分布的数字特征 样本平均数,描述样本的一般水平;样本方差
2、S2,描述样本的离散程度。可以采用Eviews软件计算相关的样本统计量。,四、如何用样本的数字特征估计总体的数字特征及数据生成过程中的各种参数1、估计量的优良性 无偏性、有效性、均方误差最小、一致性2、估计方法。见下图3、对估计量的检验假设检验,2、估计方法,3、对估计量的检验假设检验,(1)对总体分布特征的假设检验 一个正态总体的假设检验a 检验均值:已知方差和未知方差b 检验方差:未知均值(双尾和单尾)两个正态总体的假设检验a 检验均值:未知方差但可假设其相等b 检验方差:未知均值(双尾和单尾)总体分布的假设检验a 总体为离散型分布b 总体为连续型分布(2)对各种系数、参数估计值的假设检验
3、,(3)检验的显著性水平 原假设:H0;对立假设:H1。在假设检验中存在两类错误:拒绝一个其实是真的原假设,即第类错误;第 类错误是指H0实际上是错误的,但没有拒绝它。检验的显著性水平(significance level)则定义为第类错误的概率,用符号表示为:P(拒绝H0|H0)即当H0为真时拒绝H0的概率。(4)检验的p值 检验的p值(p-value)是指给定t统计量的观测值,能拒绝原假设的最小显著性水平。小的p值是拒绝原假设的证据。,如果用表示检验的显著性水平(小数形式),那么p值时,则拒绝原假设,否则在100%显著性水平下,不能拒绝H0。注意(1)对于线性回归方程,一般软件包报告了回归
4、系数及标准误,并且给出了针对双侧对立假设的p值,将其除以2,即可得到单侧对立假设的p值;(2)随着样本容量的扩大,一般使用较小的显著性水平,以作为抵偿标准误越来越小的一种办法;对于小样本容量,可以接受较大的显著性水平,可以让大到0.20,五、随机变量函数的概念和分布,1、随机变量函数的定义:设f(x)是定义在随机变量X的一切可能取值集合上的函数。如果对于X的每一个可能值x,都有另一个随机变量Y的取值y=f(x)与之相对应,则称Y为X的函数,记作Y=f(X)。常常遇到一些随机变量,它们的分布往往难于直接得到(例如滚珠体积的测量值等),但与它们有关系的另一个随机变量的分布却是容易知道的(如滚珠直径
5、的测量值)。因此,就要研究两个随机变量之间的关系,然后通过它们之间的关系,由已知随机变量的分布求出与之有关的其它随机变量的分布。其间的关系通常用函数关系表示。,2、几种重要的分布,(1)正态分布若连续型随机变量X的概率密度为则X服从正态分布,记为。正态分布的数学期望和方差分别为 标准正态分布:,正态分布的标准化,(1)如果,则(2)两个(或多个)正态分布随机变量的线性组合仍服从正态分布。(3)若Z1,Z2,,Zk为k个独立的标准正态变量,则其平方和服从自由度为k 的2分布,即,(2)分布,自由度为n的 分布的密度函数注:标准正态变量的平方服从自由度为1的 分布,即,分布的图象,定理:分布的和仍
6、然服从 分布。若X1,X2,Xn相互独立,且Xi服从具有ni(i=1,2,,n)个自由度的 分布,则它们的和X1+X2+Xn 服从具有 ni 个自由度的 分布。分布是斜分布,其偏度取决于自由度的大小,自由度越小,越向右偏,但随着自由度的增大,逐渐呈对称,接近于正态分布。分布的期望为k,方差为2k,k为 分布的自由度,(3)分布,(1)分布的定义。如果连续型随机变量x具有密度函数,则称其具有分布 记作,这里(2)定理 分布的数学期望和方差,(4)t分布,t分布的定义。如果连续型随机变量x具有以下密度函数,则称其具有自由度为n的t分布t(n)。t分布与正态分布类似具有对称性,其均值为0,方差为n/
7、(n-2),但t分布比正态分布略“胖”些。若ZN(0,1),y2(N),则,t分布和正态分布图像,(5)F分布,F分布的定义。若连续型随机变量X的分布密度函数由下式给出,则称X服从自由度分别为n1,n2的F分布,记为F(n1,n2)。若x2(N1),y 2(N2),则,F分布的图象,2.2 对总体的描述随机变量的 数字特征,一、数学期望二、方差三、数学期望与方差的图示,一、数学期望,1、离散型随机变量数学期望的定义 假定有一个离散型随机变量X有n个不同的可能取值x1,x2,xn,而p1,p2,pn是X取这些值相应的概率,则这个随机变量X的数学期望定义如下:数学期望描述的是随机变量(总体)的一般
8、水平。2、连续型随机变量数学期望的定义 若连续型随机变量X有分布密度函数,而积分 绝对收敛,则称 为X的数学期望。,数学期望是最容易发生的,因而是可以期待的。它反映数据集中的趋势。求离散型随机变量数学期望举例例1 甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下:试比较两射手的射击技术水平,并计算如果二人各发一弹,他们得分和的估计值。解 EX=1 0.4+2 0.1+3 0.5=2.1 EY=1 0.1+2 0.6+3 0.3=2.2 E(X+Y)=2.1+2.2=4.3 因为EXEY,所以乙射手射击水平比较高;二人各发一弹,得分总和最可能在4.3分左右(即4分或5分),例2:,
9、3、数学期望的性质,(1)如果a、b为常数,则 E(aX+b)=aE(X)+b(2)如果X、Y为两个随机变量,则 E(X+Y)=E(X)+E(Y)(3)如果g(x)和f(x)分别为X的两个函数,则 Eg(X)+f(X)=Eg(X)+Ef(X)(4)如果X、Y是两个独立的随机变量,则 E(X.Y)=E(X).E(Y),4、条件期望,条件期望值的定义:对于连续型随机变量的条件期望只要把加总符号换成积分号即可。,二、方差:离散程度的度量,1、随机变量方差的定义若X为连续型随机变量,则X的方差以下式给出 随机变量的方差记作Var(x)。方差的算术平方根叫标准差。,2、方差的性质,(1)Var(c)=0
10、(2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y为相互独立的随机变量,则 Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(a+bx)=b2Var(x)(6)a,b为常数,x,y为两个相互独立的随机变量,则(ax+by)=a2Var(x)+b2Var(y)(7)Var(x)=E(x2)-(E(x)2,例3 计算本节例1中甲射手的方差,例1 甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下:E(X)=2.1 Var(X)=(-1.1)2 0.4+(-0.1)2 0.1+0.92 0.5=0.89,三、数学期望与方差的图
11、示,数学期望描述随机变量的集中程度,方差描述随机变量的离散程度。1 方差同、期望变大 2 期望同、方差变小,5,四、相关系数与协方差,协方差和相关系数都是描述两个随机变量相互关联程度的参数或统计量。方差是度量一个随机变量变异程度的指标,而协方差则是度量两个随机变量协同变动的指标。要度量两个随机变量之间的关系,自然要考察两个变量同时变化协同变化的情况,于是需要定义协方差。为了弥补协方差的不足受计量单位和数量尺度的影响,进而定义了度量两个随机变量呈线性相关程度的指标相关系数。,1、协方差,(1)定义:令随机变量X和Y的期望分别为E(x),E(y),其协方差为:cov(X,Y)=E(X-E(x)(Y
12、-E(y)=E(XY)-E(X)E(Y)一般而言,两随机变量的协方差可正可负。若两变量同方向变动,则协方差为正,反之则为负。,(2)协方差的性质(1)若随机变量X,Y相互独立,则其协方差为0。(2)cov(a+bX,c+dY)=bdcov(X,Y)(3)cov(X,X)=var(X)(3)相关变量的方差若随机变量不是独立的,对于X+Y或X-Y的方差为:Var(X+Y)=var(X)+var(Y)+2cov(X,Y)Var(X-Y)=var(X)+var(Y)-2cov(X,Y),2、相关系数,相关系数用 表示,其计算公式为:从公式可看出两变量的相关系数等于它们的协方差与其各自的标准差之比。相关
13、系数介于-1到1之间。,五、偏度(skewness)与峰度(kurtosis),用于描述概率密度函数形状的数字特征。偏度(S)是对称性的度量。峰度(K)是概率密度函数高低或胖瘦的度量,1、偏度(S)的计算对于正态分布,S0;若偏度S的值为正,则其概率密度为正偏或右偏,分布函数有长的右尾;若S的值为负,则其概率密度为负偏或左偏,分布函数有长的左尾。,2、峰度(K)的计算概率密度函数的峰度K小于3时,成为低峰态的(胖的或短尾的),峰度K大于3时,称为尖峰态的(瘦的或长尾的)。对于正态分布的峰度为3,称为常峰态的。,2.3 样本分布的数字特征,一、样本平均数总体的数字特征是一个固定不变的数,称为参数
14、;样本的数字特征是随抽样而变化的数,是一个随机变量,称为统计量。样本平均数的定义:对于样本x1,x2,,xn,则样本平均数为样本平均数用来描述样本的平均水平(一般水平)。,二、样本方差和标准差,1、定义:对于样本x1,x2,,xn,则称分别为样本方差和标准差。2、样本序列的正态性检验偏度:峰度:,检验样本序列的正态性可采用Jarque-Bera检验。该检验的零假设是样本服从正态分布,检验统计量为在零假设下JB统计量服从2(2)分布。例如:样本序列取2002年我国30个地区以1978年为基衡量的实际人均GDP,采用Eviews软件计算有 S2.32 K=8.53 JB=65.29 p-value
15、=0.00 则2002年各地区人均GDP呈现右偏、尖峰的分布形态,并且在99%的置信水平下拒绝零假设,即序列不服从正态分布。,三、样本协方差,1、协方差的定义式若样本容量足够大,可用pij=1/n,那么,2、协方差的计算,3协方差的缺陷,(1)协方差是一个有单位的指标。例如,Y为身高(厘米),X为体重(千克),那么它们的协方差COV(Y,X)的单位为厘米.千克。所以不便于用作相互比较。(2)协方差受数据尺度的影响。例如,Y为身高(毫米),X为体重(克),那么它们的协方差COV(Y,X)的单位为毫米.克。同一组数据计算出来的协方差,(2)比(1)大了10倍。因此,也不便于用作相互比较。于是,需要
16、引入一个度量两个随机变量之间线性关系的指标相关系数,以克服单位与尺度的影响。,四、样本相关系数,1、相关系数的定义,2、相关系数的计算,3根据相关系数初步判定变量之间的关系,正相关:Y为我国人均消费,X为我国人均国民收入,相关系数:0.98,负相关,Y与X的相关,系数:-0.92,2.4 通过样本,估计总体 估计量的特征(点估计),对总体的数量特征可以提出若干估计量。所谓估计量的特性指的是衡量一个统计量用以估计总体参数的好坏标准。我们构造一个统计量时,它们就应当具有这些优良性,否则就不采用他来估计总体参数。估计量的优良性可从四个方面进行衡量:一、无偏性二、有效性三、均方误最小性四、一致性,一、
17、无偏性,1、无偏性的直观意义根据样本推得的估计值和真值可能不同,然而如果有一系列抽样依据同一估计方法就可以得到一系列估计值,很自然会要求这些估计的期望值与未知参数的真值相等。这就是无偏性的概念,无偏性的直观意义是:样本估计量的数值在真值周围摆动,即无系统误差。,2、无偏性的定义,例1,无偏性是估计量最重要的优良性,它只能保证估计量的期望等于真值。而且,对于总体某个待定参数,其无偏估计量不只一个。,二、有效性,总体某个参数的无偏估计量往往不只一个,而且无偏性仅仅表明 的所有可能的取值按概率平均等于,它的可能取值可能大部分与相差很大。为保证 的取值能集中于附近,必须要求 的方差越小越好。所以,提出
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 统计学 基础

链接地址:https://www.31ppt.com/p-6202963.html