概率论与数理统计第六章(最新版).ppt
1,第一二节 随机样本与抽样分布,教学内容 1 总体和样本 2 统计量与经验分布函数 3 统计三大抽样分布 4 几个重要的抽样分布定理教学重点 统计量,几个重要的抽样分布定理,2,概率论与数理统计是研究和揭示随机现象统计规律性的一门学科,是重要的一个数学分支。概率论是研究随机现象发生可能性的大小的一门学科,而数理统计则是研究大量随机现象数量规律的一门学科。它们之间联系密切但也有根本差别,数理统计的方法在自然科学、工程技术研究及社会科学领域中应用极其广泛。,3,数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,甚至为采取一定的决策和行动提供依据和建议。,由于大量随机现象必然呈现它规律性,只要对随机现象进行足够多次观察,被研究的规律性一定能清楚地呈现出来.,客观上,只允许我们对随机现象进行次数不多的观察试验,我们只能获得局部观察资料.,4,数理统计是以概率论为理论基础,根据抽样信息,对研究对象(总体)作出合理的估计和判断的学科.数理统计的步骤:(1)收集、整理数据资料(2)对所得数据资料进行分析、研究(3)对所研究对象的性质、特点作出估计或判断.,5,一个统计问题总有它明确的研究对象.,1.总体,研究对象的所构成的一个集合全体称为总体,是一维随机变量(或多维随机变量),记为X.,总体,一、总体和样本,总体中所包含的个体的个数称为总体的容量.,总体中每个成员称为个体,,总体,有限总体,无限总体,6,在数理统计研究中,人们往往研究有关对象的某一项(或几项)数量指标和为此,对这一指标进行随机试验,观察试验结果全部观察值,从而考察该数量指标的分布情况.这时,每个具有的数量指标的全体就是总体.每个数量指标就是个体.,7,由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性.从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布.,这样,总体就可以用一个随机变量及其分布来描述.,8,而概率分布正是刻划这种集体性质的适当工具.因此在理论上可以把总体与概率分布等同起来.,从另一方面看,统计的任务,是根据从总体中抽取的样本,去推断总体的性质.,由于我们关心的是总体中的个体的某项指标(如人的身高、体重,灯泡的寿命,汽车的耗油量),所谓总体的性质,无非就是这些指标值的集体的性质.,9,例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.,某批灯泡的寿命,总体,寿命X可用一概率分布来刻划,鉴于此,常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x).,10,类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.,统计中,总体这个概念 的要旨是:总体就是一个 概率分布.,11,参数的分布,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.,2.样本,从国产轿车中抽5辆进行耗油量试验,样本容量为5,抽到哪5辆是随机的,总体分布一般是未知,或只知道是包含未知,12,一旦取定一组样本X1,,Xn,得到n个具体的数(x1,x2,xn),称为样本的一次观察值,简称样本值.,n称为这个样本的容量.,13,最常用的一种抽样叫作“简单随机抽样”,其特点:,1.代表性:X1,X2,Xn中每一个与所考察的总体有 相同的分布.,2.独立性:X1,X2,Xn是相互独立的随机变量.,3.同分布:样本与总体服从同一分布.,14,定义:,由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,X2,Xn表示.,15,简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.,=F(x1)F(x2)F(xn),若总体的分布函数为F(x)、概率密度函数为f(x),则其简单随机样本的联合分布函数为,其简单随机样本的联合概率密度函数为,=f(x1)f(x2)f(xn),16,事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.,3.总体、样本、样本值的关系,17,统计是从手中已有的资料-样本值,去推断总体的情况-总体分布F(x)的性质.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,18,由样本值去推断总体情况,在应用时,往往不是直接使用样本,需要对样本值进行“加工”,这就要构造一些依赖于样本的函数,它把样本中所含的(某一方面)的信息集中起来.,1.统计量,这种不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.,二、统计量与经验分布函数,19,定义,请注意:,注:统计量是随机变量。它不含任何未知参数.,20,+,21,几个常见统计量,样本平均值,它反映了总体均值的信息,样本方差,它反映了总体方差的信息,样本标准差,22,它反映了总体k 阶矩的信息,样本k阶原点矩,样本k阶中心矩,k=1,2,它反映了总体k 阶中心矩的信息,23,它们的观察值分别为:,样本均值,样本方差,样本标准差,样本k阶矩,样本k阶中心矩,24,请注意:,25,2.经验分布函数,26,27,三 统计三大抽样分布,记为,分布,1、,定义:设 相互独立,都服从正态分布N(0,1),则称随机变量:所服从的分布为自由度为 n 的 分布.,分布是由正态分布派生出来的一种分布.,28,来定义.,其中伽玛函数 通过积分,分布的密度函数为,记为,29,30,31,1.设 相互独立,都服从正态分布,则,这个性质叫 分布的可加性.,2设 且X1,X2相互独立,,32,E(X)=n,D(X)=2n.,4若,近似正态分布N(0,1).,(应用中心极限定理可得),33,34,概率密度函数为:,2、t 分布,35,t分布的性质,36,37,38,由定义可见,,3、F分布,F(n2,n1),39,即它的数学期望并不依赖于第一自由度n1.,1.F分布的数学期望为:,若n22,若FF(n1,n2),F的概率密度为,F分布的性质,40,2.F分布的分位数,41,三、几个重要的抽样分布定理,42,43,定理 1(样本均值的分布),44,n取不同值时样本均值 的分布,请注意:,45,定理 2(样本方差的分布),n取不同值时 的分布,46,定理 3(样本均值的分布),定理 4(两总体样本均值差、样本方差比的分布),分别是,50,六、小结,在这一节中我们学习了统计量的概念,几个重要的统计量及其分布,即抽样分布.要求大家熟练地掌握它们.,51,常用的统计量,样本平均值,样本方差,样本标准差,样本k阶原点矩,样本k阶中心矩,52,抽样分布,t 分布,F分布,53,抽样分布定理,1 样本均值的分布,2 样本方差、均值的分布,54,3 两总体样本均值差、样本方差比的分布,1.了解总体、个体、样本和统计量的概念,掌握样本均值和样本方差的计算及基本 性质。2.掌握 分布、t 分布、F 分布的定义,会查表计算。3 掌握正态总体的某些统计量的分布。,全章要求,