《样本及抽样分布》PPT课件.ppt
第六章 样本及抽样分布,内容提要,一总体与样本,二 样本分布函数,三统计量,四抽样分布,基本要求,1理解总体,个体,简单随机样本和统计量的概念。,2掌握样本均值,样本方差的计算。,3.了解 x2分布,t 分布,F 分布的定义和性质,了解分位点的概 念并会查表计算。,4.掌握正态总体的样本均值和样本方差的分布。,5.了解直方图的作法。,本章重点:常用统计量的概念及其分布。,6.1 总体与样本,一.总体与个体,.总体:被研究的对象的全体,例如:考察某工厂生产的电视机显象管的质量,即考察显象管的 寿命。,其中,总体:该厂生产的所有显象管的寿命;个体:每个显象管的寿命。,2组成总体的各个元素,由于受到人力,物力等的限制,特别是测定显象管的寿命是一个破坏性试验,即当得知显象管寿命时,该显象管的使用价值也消失了,于是我们采用从总体中抽取若干个体,由局部了解整体情况。,一般,代表总体的指标(如显象管寿命)是一个随机变量X,所以总体就是指某个随机变量X 可能取值的全体。,二样本,1抽样:从总体中抽取若干个体的过程。,2样本:从总体中抽取若干个体,观察得随机变量的一组试验 数据(观测值),样本中所含个体的数量称为样本容量。,从总体中抽取样本,一般假设满足下述条件:,(1)随机性:使总体中的每一个个体有同等机会被抽取到;,(2)独立性:每次抽样的结果既不影响其他各次抽样的结果,也不受其他各次结果的影响;,3.简单随机样本:由随机的,独立的抽样方法得到的样本,这种随机的,独立的抽样方法称为简单随机抽样。,注:今后凡是提到抽样与样本,都是简单随机抽样与简单随 机样本。,由于从总体中抽取容量为n的样本,即是对代表总体的随机变量X随机的,独立的进行n次试验,每次试验结果可以看作一个随机变量,n 次试验结果就是n个随机变量 X1,X2,X n,它们相互独立且与总体X同分布。,将样本X1,X2,X n看作一个n维随机变量(X1,X2,X n),则:,当总体X是离散型随机变量时,设,则(X1,X2,X n)分布律为:,(2)当总体X是连续型随机变量时,且概率密度为,则(X1,X2,X n)概率密度为:,测试题A,一.填空题。,1.X1,X2,X n 是总体X的简单随机样本的条件是)。,2.设X1,X2,X n是来自 分布的样本,为未知参数,则 的分布率为,设n=10时样本的一组观测值为(1,2,4,3,3,4,5,6,4,8),则样本均值为,方差为。,3.样本(Y1,Y2,Y3)是来自于正态总体N(0,1),又 则的联合概率密度为。,1.设X1,X2,X n是来自均匀分布总体U(a,b)的样本,求样本(X1,X2,X n)的联合概率密度。,二.计算题。,测试题B,一填空题。,设随机变量X服从正态分布,若X1,X2,X n可以看作一组简单随机变量,则它应满足的条件。,2.设X1,X2,X n是来自01分布的样本,且,p 为未知参数,则(X1,X2,X n)的分布率为,。,3.已知样本容量为8的一个样本值为(0,1,0,1,1,0,1,1),则样本的 均值为 _。(其中样本来自于01分布的总体 且),二计算题。,设 X1,X2,X n 是来自正态总体 的样本,求 样本X1,X2,X n的联合概率密度。,)X1,X2,X n 相互独立)X1,X2,X n 与总体 X 同分布。,测试题A答案:,一填空题。,2.,3.,二计算题。,解:因为X1,X2,X n来自均匀分布总体U(a,b),则X1,X2,X n相互独立.所以,测试题B答案:,一填空题。,1)满足X1,X2,X n独立且同分布 2),2.,3.5/8,二计算题。,6.2 样本分布函数与直方图,一.样本分布函数,从总体中抽取容量为n的样本,得到n个观测值,当n较大时,相同的观测值可能重复出现若干次,整理后得到样本频率分布表:,1总体分布函数:总体X的分布函数,其中:,2样本分布函数,定义:设函数 则称 为样本分布函数或经验分布函数。,其中 是对小于或等于 的一切 的频率 求和。,3.样本分布函数的性质,(1),(2)是非减函数,(3),在每个观测值 处是右连续的,点 是 的跳跃间断点,在点 的跃度就是频率,样本分布函数 的图形如下:,对于任意实数x,由样本分布函数定义知,表示事件 的频率,由伯努利大数定理知,当 时,对于,有,二.直方图,当总体X是连续型随机变量时,可用直方图来处理数据,即作出样本的频率直方图。,找出样本观测值x1,x2,x n中的最小值与最大值,分别 记为 与.即,步骤:,(2)适当选取略小于 的数a 与略大于 的数 b,得到适当的 作图区间a,b,并在区间a,b中插入分点 则得到子区间,以n i 表示落入第i个小区间 内样本观测值的频数 为频率.,在直角坐标系内,以各个小区间为底,以 为高作小 矩形,即使各个小矩形的面积 等于样本观测值落在该 子区间内的频率.所有小矩形的面积之和为1。,通常如此步骤作出的所有小矩形就构成了直方图。,注意:(1)各个区间长度可以相等,也可以不等。,(2)由大数定理知,当样本容量n充分大时,并按区间183.5,192.5),219.5,228.5)分成5组,列出毛坯重量的频率分布表,并作直方图。,解:我们把数据的分布区间确定为183.5,228.5,并等分为5 个子区间:183.5,192.5),192.5,201.5),201.5,210.5)210.5,219.5),219.5,228.5)。,例1.测得20个毛坯重量(单位:g)列成简单表如下:,由此得到毛坯重量的频率分布表如下:,直方图如下:,6.3 统计量,一统计量,定义:设X1,X2,X n是来自总体X的一个样本,若样本函 数g(X1,X2,X n)中不含任何未知量,则称这类样本函数 为统计量。,注:统计量是完全由样本确定的量,是样本的函数。,例如:,其中 已知,未知.为总体的一个样本,则 是一个统计量,不是统计量。,2常用统计量及其观测值,(1)样本均值:观测值为:,(2)样本方差:观测值为:,(3)样本标准差:观测值为:,(4)样本k阶原点矩:其观测值为:,(5)样本k阶中心矩:其观测值为:,显然,样本一阶中心矩恒等于零。,例1.已知X1,X2,X n 是来自总体X的一组样本,且总体X的 k阶矩 存在,记为,试证:,证明:由于X1,X2,X n 独立且与X同分布,所以X1k,X2k,X n k独立且与X k同分布.,于是,由辛钦大数定理知:对于,有,即:证毕。,由例1结论及依概率收敛的序列的性质知:对于连续函数 g,有,此为下章矩估计法的理论依据。,例2.设 及 为两个样本观察值,它们有 如下关系:a,b为常数,求样本 平均值 与,样本方差 与 之间的关系。,解:由,得,又,即:,又,例3.若样本观测值 的频数分别为,试写出计算样本均值 与样本方差 的公式,其中,若写出样本二阶中心矩,显见当充分大时,和 是近似相等的。,解:,测试题A,设 是来自总体的样本,则有()。(A)(B)(C)(D)都不对,2.设 是来自总体 的样本,其中,为未 知参数,问下列诸量哪个是统计量,哪个不是统计量?(1)(2)(3)(4)(5),3.已知样本观测值为:15.8,24.2,14.5,17.4,13.2,20.8,17.9,19.1,21.0,18.5,16.4,22.6;计算样本均值,样本方差及样本二阶中心矩的观测值。,测试题B,设 取自总体X的样本,为已知,为未知,则下列随机变量中不是统计量()。(A)(B)(C)(D),2.设(-2,-1,3,3,4)是容量为5的一个样本观测值,试求经验分 布函数,3.设从总体中抽取两组样本,其样本容量分别为n1和n2,设两 组的样本均值分别为 和,样本方差分别为 和,把 两组样本合并成一组容量为 的联合样本。证明:(1)联合样本的样本均值为:(2)联合样本的方差,测试题A答案,D 统计量:(3)(5);非统计量:(1)(2)(4),3解:即其观测值,测试题B答案,1.C,2.解:,3.证明:设两组样本为:,则,合并后的样本均值为:,样本方差:,6.4 抽样分布,统计量是样本的函数,它也是一个随机变量。统计量的分布称为抽样分布。,一.三个重要分布,1.x2 分布,设X1,X2,X n 是来自正态总体N(0,1)的样本,则称统计量 服从自由度为n的x2分布,记为。,此处自由度指 包含的独立变量的个数。,(1)分布的概率密度为:,f(y)图形如下所示:,(2)x2分布的性质,()设,且 相互独立,则,证略.此结论推广为:,设,且相互独立,则,()设,则,证明:由于,则 所以,而又,因为 相互独立,所以 也相互独立,于是,(3)分布的分位点,定义:设有分布函数F(x),对于给定的,若有,则称点 为F(x)的上分位点。,当F(x)有密度函数 f(x)时,于是得x2(n)分布的上分位点为:对于 称满足条件 的点 为分布 的上 分位点。,对于不同的,n,上 分位点可查表得。,当n充分大时,近似有 是标准正态分布的上 分位点。,表中列出了n=45内的上 分位点的值,n 45时,x2(n)分布的上 分位点的近似值由上式决定。,例如:若,则 若,则,2.t 分布,设,且X,Y相互独立,则称随机变量 服从自由度为n的t分布,记为,(1)t(n)分布的概率密度为:,h(t)图形如下图所示:,显见h(t)的图形关于t=0对称,当n充分大时,其图形类似于标准正态分布的概率密度的图形,事实上,当n足够大时,t分布近似于N(0,1)分布.即:,(2)t分布的分位点,对于给定的,称满足条件的点 为t(n)分布的上 分位点.如下图:,显见,t分布的上 分位点可由附表3查得,当n45时,有,3.F 分布,设,且相互独立,则称随机变量 服从自由度为(n1,n2)的分布,记为:,(1)F分布的概率密度:,的图形如下:,由定义知,若,则,(2)F分布的分位点,对于给定,称满足条件的点 为 分布的上 分位点。,F分布的上分位点见附表5。,由于若,则,于是,即,于是可得:所以,所以,二.正态总体统计量的分布,定理:设X1,X2,X n是来自正态总体 的一个简单 随机样本,与 分别为样本均值和样本,则有,(1),(2)与 相互独立,(3),证明:(1)由于X1,X2,X n是来自总体 的一个简单 样本,则X1,X2,X n相互独立,且与总体服从相同分 布。,由正态分布的性质知,也服从正态分布且,所以,(2)(3)的证明略。,例1.设X1,X2,X10是来自正态总体 的简单随机 样本,记 试确定a,b,c,d,使Y服从 x2(k)分布,并求出k 值。,解:因为,则,又,则,又,则,又,则,由x2分布的可加性知:,即:,所以,例2.设 是来自总体 的样本,则统计量,证:由于统计量,又因为,相互独立.所以 与 也相互独立。,于是,即:,例3.设,试确定 服从什么分布。,解:因为,存在有,且 相互独立.使,显见,于是,即:,例4.设 是来自,是来自 的两个独立样本(即 与 相互独立),设,则统计量,证明:由定理知,且 相互独立.,由正态分布的性质知:,即:,又因为:,所以,由于 与,与 相互独立,所以 与 也相互独立.于是,即:,例5.设 是来自,是来自 的两个独立样本,证明:,其中:,证明:由定理知:,则,注:当 时,即,例6.设总体X服从正态分布N(20,52),总体Y服从正态分布 N(10,22),从总体中分别抽取容量为n1=10,n2=8的样本。求:(1)样本均值差大于6的概率;(2)样本方差比小于23的概率。,解:(1)由例4知:,于是,查表2得:,即:,(2)由例5知:,即,于是:,查附表5得:,即:,例7.某市有100000个年满18岁的居民,他们中10%年收入超过1万,20%受过高等教育,今从中抽取1600人的随机样本,求:(1)样本中不少于11%的人年收入超过1万的概率;(2)样本中19%和21%之间的人受过高等教育的概率。,解:(1)引入变量,由题知:,又因为,故可近似看成放回抽样,相互独立。,则,(2)同(1)法:设 其中,由于n=1600 较大,故由中心极限定理得:且,即为样本中年收入超过1万的比例。,答:样本中不少于11%的人年收入超过1万的概率为0.0918。样本中19%至21%的人受过高等教育的概率为0.6826。,近似服从,且 为样本中受过高等教育的比例。,由题知:,测试题A,一填空题。,1.若,则 的概率密度是。,2.设随机变量,已知,则。,3.设随机变量X,Y相互独立,且均服从正态分布N(0,32),而X1,X2,X 9和Y1,Y2,Y9,分别是来自总体X和Y的简单随机样本,则 服从 分布。,二选择题。,设总体X服从自由度为k的 分布,X1,X2,X n是来自 总体X的样本,则 服从 分布,且自由度为()(A)n+k(B)n k(C)(n-1)(k+1)(D)k+n-2,2.设随机变量X服从分布F(n,n),则()(A)(B)(C)(D)无法判断,4.设随机变量X1,X2,X3,X4是来自正态分布N(0,22)的样本,则a=,b=时,统计量X服从 分布,其自由度为。,三.计算题。,当 时,可用近似公式(其中 是标准正态分布的上 分位点)来计算的值,试计 算,2.设 相互独立且都是来自正态分 布,求,设X1,X2,X16是来自总体 的一个样本,则 服从()分布。(A)(B)(C)(D),测试题A答案,一.填空题。,1.2.3.4.,二.选择题。,1.B 2.C 3.D,三.计算题。,2.,1.,测试题B,一.填空题。,1.已知随机变量 X 服从自由度为 n 的 t 分布,则随机变量 X2 服从分布。,2.假设随机变量,则 为 时满足,3.设 是来自正态总体N(0,1)的样本,和 分别为样本均值和样本方差,则统计量 服从。,设总体,而 是来自总体 的简 单随机样本,则 服从分布,参 数为。,二选择题。,设随机变量X 服从自由度为(n,n)的 F 分布,若已知 满 足,则()。(A)0.95(B)0.05(C)0.025(D)0.975,2.设 是取自总体 的样本,则 是服从()分布。(A)(B)(C)(D),3.设 是相互独立,且均服从,则 服从()分布。(A)(B)(C)(D),三计算题。,若随机变量X 是具有自由度为n1,n2的F 分布,求证:(1)是具有自由度为n2,n1的F 分布;(2)证明。,2.设总体X 服从正态分布N(60,22),是该总体的 一个样本,试求:(1)(2),测试题B答案,一填空题。,F(1,n)2.1.145 3.t(n-1)4.F(10,5)(10,5),二选择题。,1.A 2.A 3.B,三计算题。,证(1),即:于是,(2)因为 则,即:,所以,2.解:(1),(2),第六章 小结,本章介绍了数理统计的基本概念和基本结论。,一.总体和样本,对于X1,X2,X n为来自总体的简单随机样本有:,(1)X1,X2,X n相互独立;,(2)X1,X2,X n均与总体 X 同分布;,(3)X1,X2,X n为Y1,Y2,Y n的观察值,即为样本值。,样本均值 和样本方差 是两个最重要的统计量,对任何总体均有:,二统计量,三抽样分布,1.三个重要分布:分布,t 分布,F 分布。,2.常见结论:,对正态总体,来自总体,则,(1),(2),(3)相互独立,(4),第六章 测试题A,一填空题。,1.设总体 分布,是来自总体的样 本,又 为样本均值,则n 时才能使。,2.设,X,Y相互独立,X1,X2,X n是X 的样本,Y1,Y2,Y n是Y 的样本,则。,3.设总体,是来自总体的一个样本,则 服从的分布是。,4.已知:,则。,二选择题。,1.设,未知,已知,是的样本,则 下列是统计量的是()。(A)(B)(C),2.设随机变量,是X的样本,和 分别是样本均值和样本方差,则下列正确的是()。(A)(B)(C)(D),3.设 样本容量分别为,相互独立,则有()。(A)(B)不相互独立(C),4.设 是来自 的一个样本,则()。(A)(B)(C),三计算题。,1.设总体,是来自总体的样本,求:。,2.设 是来自正态总体X 的样本,证明统计量Z服从自由度为2的t分布。,3.设总体 是来自总体的样本,样 本均值为,样本方差为,欲使,则k 为何值。,测试题A答案,一填空题。,1.2.3.4.,二选择题。,1.A C 2.D 3.A 4.B,三计算题。,1.因为,所以,2.证:设,则,则 即:,由,(S1样本方差),知:时,.于是,即:由于 所以,测试题B,一填空题。,1.设,其样本均值,样本方差,则服从自由度为9的t 分布的统计量是T=。,2.设,相互独立,和 分别是其样本方差,则 服从的分布是。(样 本容量分别是n1,n2),3.设,则X2服从的分布是。,4.已知,则。,二选择题。,设,已知,未知,则下列是统计量的是()。(A)(B)(C),2.设 相互独立,样本容量分别 为n1,n2,方差已知,则有()。(A)(B)(C)(D),3.设 是来自总体 的样本,是样本 均值,记 则服从t(n-1)分布的统计量是()。,(A)(B)(C)(D),三计算题。,1.设总体,是来自总体的样本,求:(1)样本均值 的数学期望与方差;(2)样本均值 的概率分布。,2.设总体,是来自总体的样本,记:,求统计量 的分布。,4.设 是取自正态总体 的一个样本,则 服从的分布是()。(A)t(n)(B)t(n-1)(C)F(n-1,n)(D)F(n,n-1),测试题B答案,一填空题。,2.3.4.,二选择题。,3.设 是来自标准正态总体 的样本,求k使,2.解:相互独立,且,(1)(2),1.A 2.D 3.B 4.B,三计算题。,3.解:,所以,所以,所以,