计量经济学的统计学基础.ppt

上传人：牧羊曲112

文档编号：6202963

上传时间：2023-10-04

格式：PPT

页数：95

大小：927.11KB

《计量经济学的统计学基础.ppt》由会员分享，可在线阅读，更多相关《计量经济学的统计学基础.ppt（95页珍藏版）》请在三一办公上搜索。

1、第二章计量经济学的统计学基础,主要内容,2.1 总体、样本2.2 对总体的描述随机变量的数字特征2.3 对样本的描述样本分布的数字特征2.4 通过样本，估计总体（一）估计量的特征2.5 通过样本，估计总体（二）估计方法2.6 通过样本，估计总体（三）假设检验,2.1 总体、样本,一、总体和样本引入一个随机变量来描述总体总体与样本间的联系在于具有相同的分布；总体就是一个随机变量，所谓样本就是n个相互独立的与总体具有相同分布的随机变量x1,xn，即n元随机变量。,二、对总体的描述：随机变量的数字特征数学期望：方差：三、对样本的描述：样本分布的数字特征样本平均数，描述样本的一般水平；样本方差

2、S2，描述样本的离散程度。可以采用Eviews软件计算相关的样本统计量。,四、如何用样本的数字特征估计总体的数字特征及数据生成过程中的各种参数1、估计量的优良性无偏性、有效性、均方误差最小、一致性2、估计方法。见下图3、对估计量的检验假设检验,2、估计方法,3、对估计量的检验假设检验,（1）对总体分布特征的假设检验一个正态总体的假设检验a 检验均值：已知方差和未知方差b 检验方差：未知均值（双尾和单尾）两个正态总体的假设检验a 检验均值：未知方差但可假设其相等b 检验方差：未知均值（双尾和单尾）总体分布的假设检验a 总体为离散型分布b 总体为连续型分布（2）对各种系数、参数估计值的假设检验

3、,（3）检验的显著性水平原假设：H0；对立假设：H1。在假设检验中存在两类错误：拒绝一个其实是真的原假设，即第类错误；第类错误是指H0实际上是错误的，但没有拒绝它。检验的显著性水平（significance level）则定义为第类错误的概率，用符号表示为：P(拒绝H0|H0)即当H0为真时拒绝H0的概率。（4）检验的p值检验的p值(p-value)是指给定t统计量的观测值，能拒绝原假设的最小显著性水平。小的p值是拒绝原假设的证据。,如果用表示检验的显著性水平（小数形式），那么p值时，则拒绝原假设，否则在100%显著性水平下，不能拒绝H0。注意（1）对于线性回归方程，一般软件包报告了回归

4、系数及标准误，并且给出了针对双侧对立假设的p值，将其除以2，即可得到单侧对立假设的p值；（2）随着样本容量的扩大，一般使用较小的显著性水平，以作为抵偿标准误越来越小的一种办法；对于小样本容量，可以接受较大的显著性水平，可以让大到0.20,五、随机变量函数的概念和分布,1、随机变量函数的定义：设f(x)是定义在随机变量X的一切可能取值集合上的函数。如果对于X的每一个可能值x，都有另一个随机变量Y的取值y=f(x)与之相对应，则称Y为X的函数，记作Y=f(X)。常常遇到一些随机变量，它们的分布往往难于直接得到（例如滚珠体积的测量值等），但与它们有关系的另一个随机变量的分布却是容易知道的（如滚珠直径

5、的测量值）。因此，就要研究两个随机变量之间的关系，然后通过它们之间的关系，由已知随机变量的分布求出与之有关的其它随机变量的分布。其间的关系通常用函数关系表示。,2、几种重要的分布,（1）正态分布若连续型随机变量X的概率密度为则X服从正态分布，记为。正态分布的数学期望和方差分别为标准正态分布：,正态分布的标准化,（1）如果，则（2）两个（或多个）正态分布随机变量的线性组合仍服从正态分布。（3）若Z1,Z2,，Zk为k个独立的标准正态变量，则其平方和服从自由度为k 的2分布，即,（2）分布,自由度为n的分布的密度函数注：标准正态变量的平方服从自由度为1的分布，即,分布的图象,定理：分布的和仍

6、然服从分布。若X1,X2,Xn相互独立，且Xi服从具有ni（i=1,2,，n）个自由度的分布，则它们的和X1+X2+Xn 服从具有 ni 个自由度的分布。分布是斜分布，其偏度取决于自由度的大小，自由度越小，越向右偏，但随着自由度的增大，逐渐呈对称，接近于正态分布。分布的期望为k，方差为2k，k为分布的自由度,（3）分布,（1）分布的定义。如果连续型随机变量x具有密度函数，则称其具有分布记作，这里（2）定理分布的数学期望和方差,（4）t分布,t分布的定义。如果连续型随机变量x具有以下密度函数，则称其具有自由度为n的t分布t(n)。t分布与正态分布类似具有对称性，其均值为0，方差为n/

7、(n-2)，但t分布比正态分布略“胖”些。若ZN(0,1),y2(N),则,t分布和正态分布图像,（5）F分布,F分布的定义。若连续型随机变量X的分布密度函数由下式给出，则称X服从自由度分别为n1,n2的F分布，记为F(n1,n2)。若x2(N1),y 2(N2),则,F分布的图象,2.2 对总体的描述随机变量的数字特征,一、数学期望二、方差三、数学期望与方差的图示,一、数学期望,1、离散型随机变量数学期望的定义假定有一个离散型随机变量X有n个不同的可能取值x1,x2,xn，而p1,p2,pn是X取这些值相应的概率，则这个随机变量X的数学期望定义如下：数学期望描述的是随机变量（总体）的一般

8、水平。2、连续型随机变量数学期望的定义若连续型随机变量X有分布密度函数，而积分绝对收敛，则称为X的数学期望。,数学期望是最容易发生的，因而是可以期待的。它反映数据集中的趋势。求离散型随机变量数学期望举例例1 甲、乙两射手在一次射击中的得分（分别用X、Y表示）的分布率如下：试比较两射手的射击技术水平，并计算如果二人各发一弹，他们得分和的估计值。解 EX=1 0.4+2 0.1+3 0.5=2.1 EY=1 0.1+2 0.6+3 0.3=2.2 E(X+Y)=2.1+2.2=4.3 因为EXEY，所以乙射手射击水平比较高；二人各发一弹，得分总和最可能在4.3分左右（即4分或5分）,例2：,

9、3、数学期望的性质,（1）如果a、b为常数，则 E(aX+b)=aE(X)+b（2）如果X、Y为两个随机变量，则 E(X+Y)=E(X)+E(Y)（3）如果g(x)和f(x)分别为X的两个函数，则 Eg(X)+f(X)=Eg(X)+Ef(X)（4）如果X、Y是两个独立的随机变量，则 E(X.Y)=E(X).E(Y),4、条件期望,条件期望值的定义：对于连续型随机变量的条件期望只要把加总符号换成积分号即可。,二、方差：离散程度的度量,1、随机变量方差的定义若X为连续型随机变量，则X的方差以下式给出随机变量的方差记作Var(x)。方差的算术平方根叫标准差。,2、方差的性质,（1）Var(c)=0

10、（2）Var(c+x)=Var(x)（3）Var(cx)=c2Var(x)（4）x,y为相互独立的随机变量，则 Var(x+y)=Var(x)+Var(y)=Var(x-y)（5）Var(a+bx)=b2Var(x)（6）a,b为常数，x,y为两个相互独立的随机变量，则(ax+by)=a2Var(x)+b2Var(y)（7）Var(x)=E(x2)-(E(x)2,例3 计算本节例1中甲射手的方差,例1 甲、乙两射手在一次射击中的得分（分别用X、Y表示）的分布率如下：E(X)=2.1 Var(X)=（-1.1）2 0.4+（-0.1）2 0.1+0.92 0.5=0.89,三、数学期望与方差的图

11、示,数学期望描述随机变量的集中程度，方差描述随机变量的离散程度。1 方差同、期望变大 2 期望同、方差变小,5,四、相关系数与协方差,协方差和相关系数都是描述两个随机变量相互关联程度的参数或统计量。方差是度量一个随机变量变异程度的指标，而协方差则是度量两个随机变量协同变动的指标。要度量两个随机变量之间的关系，自然要考察两个变量同时变化协同变化的情况，于是需要定义协方差。为了弥补协方差的不足受计量单位和数量尺度的影响，进而定义了度量两个随机变量呈线性相关程度的指标相关系数。,1、协方差,（1）定义：令随机变量X和Y的期望分别为E(x),E(y),其协方差为:cov(X,Y)=E(X-E(x)(Y

12、-E(y)=E(XY)-E(X)E(Y)一般而言，两随机变量的协方差可正可负。若两变量同方向变动，则协方差为正，反之则为负。,（2）协方差的性质（1）若随机变量X，Y相互独立，则其协方差为0。（2）cov(a+bX,c+dY)=bdcov(X,Y)（3）cov(X,X)=var(X)（3）相关变量的方差若随机变量不是独立的，对于X+Y或X-Y的方差为：Var(X+Y)=var(X)+var(Y)+2cov(X,Y)Var(X-Y)=var(X)+var(Y)-2cov(X,Y),2、相关系数,相关系数用表示，其计算公式为：从公式可看出两变量的相关系数等于它们的协方差与其各自的标准差之比。相关

13、系数介于-1到1之间。,五、偏度(skewness)与峰度(kurtosis),用于描述概率密度函数形状的数字特征。偏度（S）是对称性的度量。峰度（K）是概率密度函数高低或胖瘦的度量,1、偏度（S）的计算对于正态分布，S0；若偏度S的值为正，则其概率密度为正偏或右偏，分布函数有长的右尾；若S的值为负，则其概率密度为负偏或左偏，分布函数有长的左尾。,2、峰度（K）的计算概率密度函数的峰度K小于3时，成为低峰态的（胖的或短尾的），峰度K大于3时，称为尖峰态的（瘦的或长尾的）。对于正态分布的峰度为3，称为常峰态的。,2.3 样本分布的数字特征,一、样本平均数总体的数字特征是一个固定不变的数，称为参数

14、；样本的数字特征是随抽样而变化的数，是一个随机变量，称为统计量。样本平均数的定义：对于样本x1,x2,，xn,则样本平均数为样本平均数用来描述样本的平均水平（一般水平）。,二、样本方差和标准差,1、定义：对于样本x1,x2,，xn,则称分别为样本方差和标准差。2、样本序列的正态性检验偏度：峰度：,检验样本序列的正态性可采用Jarque-Bera检验。该检验的零假设是样本服从正态分布，检验统计量为在零假设下JB统计量服从2(2)分布。例如：样本序列取2002年我国30个地区以1978年为基衡量的实际人均GDP，采用Eviews软件计算有 S2.32 K=8.53 JB=65.29 p-value

15、=0.00 则2002年各地区人均GDP呈现右偏、尖峰的分布形态，并且在99%的置信水平下拒绝零假设，即序列不服从正态分布。,三、样本协方差,1、协方差的定义式若样本容量足够大，可用pij=1/n,那么,2、协方差的计算,3协方差的缺陷,（1）协方差是一个有单位的指标。例如，Y为身高（厘米），X为体重（千克），那么它们的协方差COV（Y，X）的单位为厘米.千克。所以不便于用作相互比较。（2）协方差受数据尺度的影响。例如，Y为身高（毫米），X为体重（克），那么它们的协方差COV（Y，X）的单位为毫米.克。同一组数据计算出来的协方差，（2）比（1）大了10倍。因此，也不便于用作相互比较。于是，需要

16、引入一个度量两个随机变量之间线性关系的指标相关系数，以克服单位与尺度的影响。,四、样本相关系数,1、相关系数的定义,2、相关系数的计算,3根据相关系数初步判定变量之间的关系,正相关：Y为我国人均消费，X为我国人均国民收入，相关系数：0.98,负相关,Y与X的相关，系数：-0.92,2.4 通过样本，估计总体估计量的特征(点估计）,对总体的数量特征可以提出若干估计量。所谓估计量的特性指的是衡量一个统计量用以估计总体参数的好坏标准。我们构造一个统计量时，它们就应当具有这些优良性，否则就不采用他来估计总体参数。估计量的优良性可从四个方面进行衡量：一、无偏性二、有效性三、均方误最小性四、一致性,一、

17、无偏性,1、无偏性的直观意义根据样本推得的估计值和真值可能不同，然而如果有一系列抽样依据同一估计方法就可以得到一系列估计值，很自然会要求这些估计的期望值与未知参数的真值相等。这就是无偏性的概念，无偏性的直观意义是：样本估计量的数值在真值周围摆动，即无系统误差。,2、无偏性的定义,例1,无偏性是估计量最重要的优良性，它只能保证估计量的期望等于真值。而且，对于总体某个待定参数，其无偏估计量不只一个。,二、有效性,总体某个参数的无偏估计量往往不只一个，而且无偏性仅仅表明的所有可能的取值按概率平均等于，它的可能取值可能大部分与相差很大。为保证的取值能集中于附近，必须要求的方差越小越好。所以，提出

18、有效性标准。,1、有效性的定义,2、比较总体均值两个无偏估计的有效性,3、无偏有效估计量的意义,（1）一个无偏有效估计量的取值在可能范围内最密集于附近。换言之，它以最大的概率保证估计量的取值在真值附近摆动。（2）可以证明，样本均值是总体数学期望的有效估计量。,三、均方误差（Mean Square Error）最小性,在很多情况下，我们被迫在偏差的大小与方差的大小（即无偏与有效性）之间作出抉择。有时，一个方差极小的有偏估计比一个方差极大的无偏估计可能更为我们所追求。此时，估计量的均方误差为我们在两者之间的权衡提供了一个有效的尺度。,1、均方误差和均方误差最小性的定义,2、均方误差最小的意义,（1

19、）MSE分解为精确度与准确度之和。MSE最小就是使估计量方差与估计量偏误之和最小，给出了进行权衡的方法（见下图）（2）如果估计量为无偏估计量Bias=0，那么 MSE()=Var()即误差由精确度确定。此时，一个具有最小MSE的估计量一定具有无偏性和有效性，即 MinMSE()=MinVar()。,3、运用MSE权衡偏差与方差,准而不精,又精又准,精而不准,不精不准,例：重庆长安厂4支比赛用枪的抽样结果,一次射击就是一次抽样。试问：哪些是无偏估计？哪些是有偏估计？哪些是有效估计？哪些是无偏有效估计？,四、一致性,1、“依概率收敛”的定义,2、一致性一致性既是从概率又是从极限性质来定义的，因此只

20、有样本容量较大时才起作用。,一致性作为评价估计量好坏的一个标准，计量经济学家在无偏性和一致性之间更偏重选择一致性。虽然一个一致估计量可能在平均意义上与真值不同，但是当样本容量加大时，它会变得与真值十分接近，即有偏的一致估计量具有大样本下的无偏性。同时，根据大数定律，当n增大时，方差会变得很小，所以一致估计量具有大样本下的“无偏性”和“有效性”。,3、一致性的意义,显然，一个一致估计量比一个方差很大的无偏估计量优越得多。由于MSE()=Var()+Bias()2，所以估计量的一致性，实际上等价于当n=时，MSE()=0，亦即Var()=0和Bias()2=0，也就是随着样本加大，的方差变小；的偏

21、差接近于0，这就是一致性描述的情况。事实上一致性和MSE（）=0（当n=）这两条标准在计量经济学中往往是通用的。,2.5 通过样本，估计总体估计方法,一、点估计（1）矩法（2）最大似然法（3）最小二乘法二、区间估计（一）对总体期望值的估计（二）对总体方差的估计（三）关于区间估计的几点说明,关于区间估计的几点说明,（1）在进行区间估计时，应针对不同的情况，采用不同的方法。例如分清分布的形式是已知或是未知；是大样本或是小样本；小样本（估计总体数学期望时）又分清是已知方差或是未知方差等。充分利用分布信息可以得到较精确的估计。（2）一般地，越大置信度越低，置信区间越长；反之，则反。,2.6 通过样本

22、，估计总体假设检验,一、假设检验的概念二、两类错误三、置信区间法和显著性检验法四、假设检验的应用单正态总体的假设检验五、“小概率原理”在假设检验中的应用,一、假设检验的概念,定义：称对任何一个随机变量未知分布的假设为统计假设，简称假设。一个仅涉及到随机变量分布中未知参数的假设称为参数假设。一个仅涉及到随机变量分布的形式而不涉及到未知参数的假设称为非参数假设。提出一个统计假设的关键是将一个实际的研究问题用数学语言转换为统计假设。,例1.检验一个硬币是否均匀,抛掷一个硬币100次，“正面”出现60次，问此硬币是否均匀？分析：若用X描述抛掷硬币的试验，“X=1”和“X=0”分别表示“出现正面”和“

23、出现反面”。上述问题就是检验X是否可以被认为服从p=0.5的 01分布。问题是分布形式已知，检验参数p=0.5的假设。记作，H0:p=0.5 H1:p0.5,零假设与备择假设,在统计假设H0:p=0.5 H1:p0.5中，H0称为零假设或原假设，是我们进行统计假设检验欲确定其是否成立的假设体现我们进行假设检验的目的。H1称为备择假设，统计假设检验是二择一的判断，当不成立时，不得不接受它。,例2.检验1999年新生女婴体重是否等于某个既定值,从2003年出生的女婴中随机地抽取20名，测得平均体重=3160克，标准差=300克，根据已有的统计资料新生女婴的体重=3140克，问现在与过去新生女婴的体

24、重是否有变化？分析：把2003年出生的女婴视为一个总体，用X描述，问题就是判断：H0:EX=3140 H1:EX 3140因为通常可以假定经过量测得到的资料是服从正态分布的，无须检验总体的分布形式，显然这是一个关于参数的假设检验问题。,二、两类错误,（1）两类错误的概念（2）Neyman-Pearson方法（3）显著性水平,（1）两类错误的概念,由于我们作出判断的依据是一组样本，结论却是对于总体的，即由局部=全面，由特殊=一般，由个别=整体，因而假设检验的结果不可能绝对正确，它有可能是错误的。而且出现错误可能性的大小，也是以统计规律（小概率原理）为依据的。所可能犯的错误有两类：第一类弃真，原假

25、设符合实际情况，而检验结果把它否定了。设犯这类错误的概率为，那么=p(否定H0/H0实际上为真)。为显著性水平第二类取伪，原假设不符合实际情况，而检验结果却把它肯定下来。设犯这类错误的概率为，那么=p(接受H0/H0实际上不正确)。1-称为检验的功效。,（2）Neyman-Pearson方法,自然我们希望犯两类错误的概率都越小越好。但对一定的样本容量n，一般都不能做到犯这两类错误的概率同时都小。由于减小=增大，或者减小=增大，于是我们面临抉择，计量经济学中常常愿意使犯”第一类错误“的概率较小，则拒绝错了的概率就较小。而不考虑。因此，拒绝H0是坚决有力的（冒险率是确定的），而不拒绝H0则是无可奈

26、何的（冒险率是没有确定的）。Neyman-Pearson提出了一种方法：先固定犯“第一类错误”的概率，再考虑如何减小犯“第二类错误”的概率，也称Fix,Min 方法。当确定以后，让尽量的小，1-就越大，称不犯“第二类错误”的概率为“检验的功效（Power of test）。,（3）显著性水平,显著水平指的是犯“第一类错误”的可能性，即“冒险率”冒H0是真而我们抛弃了H0所犯错误的概率反之，而不接受H0，乃是因为客观事实与H0假设存在差异，且这种差异的程度已经太大了，在给定的小概率下，零假设几乎是不可能发生的，从而认为零假设H0是错的，必须抛弃它。同时，即使抛弃零假设H0，这时也只需冒的风险，抛

27、弃H0的可靠性则为1-。如果假设事关重大，譬如载人的宇宙飞船升空或药品试验，则必须减小显著性水平，使我们不能轻易地拒绝H0。,三、假设检验：置信区间法,（一）问题的提出（二）假设检验的置信区间法,（一）问题的提出,曾经提到“某甲成绩大概是80 分左右”可以看成一个区间估计问题。“大概80分左右”p(1 如：p(75(75,85)是某甲成绩的估计区间，某甲成绩落在此区间的概率在95%以上。类似地，对这个问题，也可举出一个假设检验的问题在允许你犯5%以下的错误，即以95%的正确性来回答：“某甲的成绩是80，对吗？”假设检验同样的问题又是一个假设检验的问题。,（二）假设检验的置信区间法的定义,对

28、比区间估计和假设检验两种情况，我们发现区间估计实际上给出了一种进行假设检验的方法。比如，当涉及“某甲成绩为80分”（=5%）后，首先对问题进行区间估计，得到成绩在7585之间的概率为95%。若原假设H0落在（75,85）内，显然应当接受H0，否则，则拒绝H0。这种利用区间估计法来进行假设检验的方法称为区间估计法。,（三）假设检验的检验水平=区间估计中的显著水平,对于给定的置信度95%，对成绩进行区间估计结果为（75,85)，若原假设落入该区间，我们便接受H0，认为甲的成绩是80分。如此（接受时），我们可能犯第二类错误，即甲的成绩实际上是72，不是80，而把错误的H0接受了（取伪了）。必须指出，

29、这里的置信度95%只保证了我们运用置信区间法进行假设检验时，在95%下，如果H0正确，我们不会拒绝它，即95%地防止了假设检验中第一类错误的发生，也就是显著水平达到了5%。由此可见，在利用置信区间法进行假设检验时，区间估计中的置信度1-中的，就是假设检验中的检验水平。,也就是、不可能同时减小的再探,在置信区间法下，随着检验水平的减小（第一类错误的概率减小），例如5%1%，区间估计的置信度就会增大（95%99%）；置信度的加大，导致置信区间长度变大，比如从（75，85）（70，90）；这样就加了大犯第二类错误的概率，换言之，我们不但可能把72 分成绩误认为80分，还可能把70分误认为80 分；所

30、以，也就是、不可能同时减小,通过求置信区间进行假设检验的例子,例3 根据长期经验和资料分析，某砖厂生产的砖的“抗断强度”服从正态分布，方差=1.21，今从该厂生产的砖中随机地抽取6块砖，测得强度如下（单位千克/cm2）：检验这批砖的平均抗断强度为32.50千克/cm2是否成立（=0.05）？解：H0:=32.50 H1:32.50首先求的置信区间：,显著性检验法,检验的步骤（检验均值，已知）,1、提出零假设 H0：=0 H1：0（双侧检验）2、根据抽样所得样本计算检验统计量3、确定显著水平=0.05（或0.01）和相应的临界值4、将计算的U与进行比较。如果U落在拒绝域内，则拒绝H0，否则接收

31、H0.；5、依据统计结论，作出专业（经济学）上的解释,采用显著性检验法重作例3,1、提出零假设 H0：=32.5 H1：32.52、根据抽样所得样本计算检验统计量3、确定显著水平=0.05和相应的临界值为1.964、将计算的U=3.05与临界值1.96进行比较5、下结论：因为U=3.05 1.96，故 P=0.05小概率事件发生，则拒绝H0。不认为抗断强度为32.5。6、依据统计结论，作出专业（经济学）上的解释,四、假设检验的应用单正态总体的假设检验,设总体N（，2），对于其参数，2的假设检验，讨论3种情况：已知方差2，检验假设H0：=0（前面已讲）未知方差2，检验假设H0：=0未知期望，检

32、验假设H0：2=20其中，H0中的0和20均是已知的数。,例4 未知总体方差，检验总体均值等于定值,从2003年出生的新生女婴中随机抽取20 个，测得其平均体重为3160克，样本标准差为300克，根据过去的资料，新生女婴平均体重等于3140 克，问现在女婴体重与过去有无差别（=0.01）？,例5 未知总体数学期望，检验总体方差等于定值,某铁厂的铁水含碳量在正常情况下服从正态分布，现对操作工艺进行改进，然后抽取5炉铁水测得含碳量数据如下：问是否可以认为新工艺炼出的铁水含碳量的方差为原先的0.1082(=0.05)?,五、“小概率原理”在假设检验中的应用,数理统计学中的“小概率原理”认为：概率很小

33、的事件在一次抽样试验中几乎是不可能发生的。在假设检验中，我们就是根据这一原理来拒绝各种H0。在H0成立的条件下，统计量大于临界值为一个小概率事件，因此，在一次抽样试验中，依据小概率原理，是不会发生的。但是，既然小概率事件（“统计量临界值”的事件）居然发生了。出错了，那么，错在那里呢？因为，在整个假设检验过程中，抽样是正确的、统计量的选择是正确的、根据显著水平确定的临界值是正确的、统计量的计算是正确的，统计量与临界值的比较也是正确的。因而，只能是提出的假设H0发生了错误，所以必须拒绝H0。,检验“大海里丢了一棵针”？,（1）提出假设：检验“大海里丢了一棵针”（2）进行抽样，并计算统计量计算打捞起

34、来的“针”的棵数（3）因为“大海里捞针一场空”是一小概率事件，依据小概率原理，在一次试验中几乎是不可能发生的，确定“临界值”认为大海里不只丢了一棵针。（针丢多了才可以捞到）B.得到了“0”棵针，大概率事件发生了（应该发生）=接受H0，认为“大海里只丢了一棵针”。,大海里捞针的错误之一“弃真”,1.提出假设H0：“大海里丢了一棵针”真实情况：大海里真的只丢了一棵针，2.如果假设为真，一次试验是不可能捞到一棵针的小概率事件3.打捞结果及下结论：在一次试验中捞到了一棵针，小概率事件居然发生了，而不得不拒绝H0，认为大海里不只一棵针。对比真实情况，那么，此时发生了第一类错误“弃真”,大海里捞针的错误之

35、一“取伪”,1.提出假设H0：“大海里丢了一棵针”。而真实情况是，大海里不是丢了一棵针，是很多很多。2.如果假设为真，一次试验是不可能捞到一棵针的小概率事件。3.打捞结果及结论：在一次试验中没有捞到了一棵针，大概率事件发生了，是完全应该发生，接受H0是顺理成章之事，认为大海里只丢了一棵针。那么，对比真实情况，此时发生了第二类错误“取伪”（把错误的假设接纳了）。,本章的几点注意点：,（1）数理统计学研究的核心问题是如何从样本来推断总体的性质。作为观察者，我们对总体的情况往往是不了解的，我们只能对总体进行随机抽样，获得一组样本，通过对一组样本的研究，进而估计总体的各种属性。所以，对总体的研究都是基于样本的。（2）为了描述总体引入了随机变量，只有随机变量这类特殊的变量，才能用以对总体进行全面描述。（3）总体就是一个随机变量。（4）我们通常遵循统计量三个优良性来构造各种统计量，而且利用假设检验来具体地评价关于总体参数的假设是否合理。（5）区间估计和假设检验是一个问题的两个方面。,