数理统计课件全集.ppt
《数理统计课件全集.ppt》由会员分享,可在线阅读,更多相关《数理统计课件全集.ppt(355页珍藏版)》请在三一办公上搜索。
1、对随机现象进行观测、试验,以取得有代表性的观测值,对已取得的观测值进行整理、分析,作出推断、决策,从而找出所研究的对象的规律性,第一节 基本概念,一、总体和个体,二、样本 简单随机样本,一、总体和个体,一个统计问题总有它明确的研究对象.,研究对象的全体称为总体(母体),,组成总体的每个元素称为个体.,总体,然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.,所研究的对象的某个(或某些)数量指标的全体称为总体,它是一个随机变量(或多维随机变量),记为X.,X 的分布函数和数字特征称为总体分布函数和
2、总体数字特征.,总体:,例如:研究某批灯泡的寿命时,总体X是这批灯泡的寿命,而其中每个灯泡的寿命就是个体。,每个灯泡的寿命,个体,又如:研究某批国产轿车每公里的耗油量时,总体X是这批轿车每公里的耗油量,而其中每辆轿车的耗油量就是个体。,类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)来表示,而每个学生的身高和体重就是个体.,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.,
3、二、样本 简单随机样本,1)抽样和样本,样本的抽取是随机的,每个个体是一个随机变量.容量为n的样本可以看作n维随机变量,用X1,X2,Xn表示.,而一旦取定一组样本,得到的是n个具体的数(x1,x2,xn),称其为样本的一个观察值,简称样本值.,2.X1,X2,Xn相互独立.,由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:,1.样本X1,X2,Xn中每一个Xi与所考察的总体X有相同的分布.,2)简单随机样本,由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分
4、布的n个相互独立的随机变量X1,X2,Xn表示.,简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.,设X1,X2,Xn 是总体X的一个简单随机样本,,1)若X为离散型总体,其分布律是p(x),则X1,X2,Xn的联合分布律为,p(x1)p(x2)p(xn),2)若X为连续型总体,其概率密度是f(x),则X1,X2,Xn的联合分布律为,f(x1)f(x2)f(xn),事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值
5、而见不到随机变量.,3)总体、样本、样本值的关系,统计是从手中已有的资料 样本值,去推断总体的情况 总体分布F(x)的性质.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,4)经验分布函数,设X1,X2,Xn为取自总体X的样本,x1,x2,xn为其观察值.对于每个固定的x,设事件Xx在n次观察中出现的次数为vn(x),于是事件Xx发生的频率为:,显然Fn(x)为不减右连续函数,且,称 Fn(x)为样本分布函数或经验分布函数.,定理(格列文科)当n时,经验分布函数 Fn(x)依概率1关于x一致收敛与总体分布函数,即,定理表明:当
6、样本容量n充分大时,经验分布函数 Fn(x)几乎一定会充分趋近总体分布函数F(x),这是用样本来推断总体的理论依据.,第二节 统计量与抽样分布,一、统计量,二、统计学中三个常用分布和上分位点,三、抽样分布定理,一、统计量,由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)信息集中起来.,定义,若,2 已知,则,是统计量,而,例如:,不是统计量.,也是统计量.,是未知参数,几个常用的统计量,样本均值,样本方差,它反映了总体均值的信息,它反映了总体方差的信息,样本k阶原点矩,样本k阶中心矩,k=1,2,它反映了总体 k 阶矩的信息,它反映了总体
7、 k 阶中心矩的信息,它们的观察值分别为:,由大数定律可知:,依概率收敛于,例1.从一批相同的电子元件中随机地抽出8个,测得使用寿命(单位:小时)分别为:2300,2430,2580,2400,2280,1960,2460,2000,试计算样本均值、样本方差及样本二阶矩.,解:,抽样分布,统计量是样本的函数,而样本是随机变量,故统计量也是随机变量,因而就有一定的分布,它的分布称为“抽样分布”.,二、统计学中三个常用分布和上分位点,下面介绍三个来自正态总体的抽样分布.,定义:设 相互独立,都服从标准正态分布,N(0,1),则称随机变量:,所服从的分布为自由度为 n 的 分布,记为,分布的概率密度
8、为,处的值.,有所改变.,分布的概率密度图形如下:,性质1.,证 明:,设,相互独立,则,分布的性质:,这个性质称为 分布的可加性.,性质2.,设,且,与,相互独立,则,t 的概率密度为:,定义:设XN(0,1),Y,所服从的分布为自由度为 n 的 t 分布.记为tt(n).,2、t 分布,,且 X 与 Y 相互,独立,则称变量,n=4,n=10,n=1,t分布的概率密度函数关于t=0对称,且当n充分大时(n30),其图形与标准正态分布的概率密度函数的图形非常接近.但对于较小的n,t 分布与N(0,1)分布相差很大.,由定义可见,,3、F分布,则称统计量,服从自由度为n1及 n2 的F分布,n
9、1称为第一自由度,,F(n2,n1),定义:设,X 与 Y 相互独立,,n2称为第二自由度,记作 FF(n1,n2).,若XF(n1,n2),则X的概率密度为,注意:统计的三大分布的定义、基本性质在后面的学习中经常用到,要牢记!,4、上分位点,定义:设随机变量X的概率密度为 f(x),对于,任意给定的(01),若存在实数x,使得:,则称点x为该概率分布的上分位点,正态分布的上分位点,对标准正态分布变量ZN(0,1)和给定的,上分位数是由:,PZz=,即 PZz=1-,(z)=1-,确定点z.,如图:,例如,=0.05,而,PZ1.645=0.05,所以,z0.05=1.645.,说明:,1)除
10、标准正态分布外,分布、t分布、F分布的上 分位点都有表可查.,2)对于 分布,当n充分大时(n45),,其中Z是标准正态分布的上分位点,3)对于 t 分布,a)由其对称性,有:,b)当n充分大时(n45),,4)对于F分布,有:,例2.查表求下列值:,解:,,,例3.设总体X和Y相互独立,同服从,分布,而 X1,X2,,X9 和 Y1,Y2,,Y9,的分布.,分别是来自X和Y的简单随机样本,求统计量,解:,X1,X2,,X15是来自X的简单随机样本,求,解:,试确定常数 c,使,解:,故,因此,当总体为正态分布时,教材上给出了几个重要的抽样分布定理.这里我们不加证明地叙述.,三、抽样分布定理,
11、(1)样本均值,(2)样本均值 与样本方差 相互独立。,(3)随机变量,定理 2 设X1,X2,Xn是取自正态总体,则有,定理 3(两个总体样本均值差的分布),且X与Y独立,分别是这两个样本的样本方差,则有,定理 4(两个总体样本方差比的分布),且X与Y独立,分别是这两个样本的样本方差,则有,上述4个抽样分布定理很重要,要牢固掌握.,的概率不小于90%,则样本容量至少取多少?,解:设样本容量为 n,则,令,得,即,所以至少取,n=20的样本,解:(1),即,故,(2),故,3 掌握给出的四个抽样分布定理。,第六章 小 结,1.给出了总体、个体、样本和统计量的概念,要掌,2.给出了 分布、t分布
12、、F分布的定义和性质,要会,查表求其上分位点。,握样本均值和样本方差的计算及基本性质。,附:几种重要随机变量的数学期望和方差,一.二点分布,二.二项分布,三.泊松分布,四.均匀分布,五.正态分布,六.指数分布,一.二点分布,若随机变量X服从二点分布,其分布律为:,二.二项分布,随机变量XB(n,p),其分布律为:,由二项分布定义可知,X是n重贝努利试验中事件A发生的次数,且在每次试验中A发生的概率为p,设,则Xk服从二点分布,其分布律为:,若随机变量XB(n,p),则,即:,三.泊松分布,随机变量,其分布律为:,即:,若随机变量X(),则,四.均匀分布,设随机变量X在区间(a,b)上服从均匀分
13、布,其概率密度为,即,若随机变量XU(a,b),则,五.正态分布,随机变量,其概率密度为:,(令),(令),即,若随机变量XN(,2),则,六.指数分布,随机变量X服从参数为的指数分布,其概率密度为:,若随机变量X服从参数为的指数分布,则,即,例1.已知 求,解:,则,解:,X在区间(1,5)上服从均匀分布,例2.已知X和Y相互独立,且X在区间(1,5)上服从均匀分布,求(1)(X,Y)的概率密度;(2),由X和Y相互独立得:,概率论中用来阐明大量随机现象平均结果的稳定性的一系列定理,称为大数定律,第一节 大数定律,一个常数,若对于任给的正数0,总成立,随机变量序列依概率收敛于常数,定义,设,
14、是一个随机变量序列,a 是,则称 随机变量 序列,依概率收敛于a,,记为,性质,设n重贝努里试验中事件A发生的次数为n,A在每次试验中发生的概率为 p,则对任给的0,总成立,定理1(贝努利大数定律),即:,三个常见的大数定律,贝努里大数定律的意义,贝努里大数定律提供了通过试验来确定事件概率的方法.,定理2(契比雪夫大数定律的特殊情形),设随机变量序列X1,X2,相互独立,并且具有相同的数学期望和方差,E(Xi)=,D(Xi)=2,i=1,2,则对任给的0,总成立,即,定理2的意义,具有相同数学期望和方差的独立随机变量序列的算术平均值依概率收敛于数学期望.当 n 足够大时,实验结果的算术平均几乎
15、是一常数.,因此,在实际应用中,当试验次数足够大时,可用独立重复试验结果的算术平均数来估计随机变量的数学期望.,定理3(契比雪夫大数定律的一般情形),设随机变量序列X1,X2,相互独立,它们都具有数学期望:E(Xi)=i,并且都具有被同一常数C所限制的方差:D(Xi)=0,总成立,即,定理3的意义,设随机变量序列X1,X2,相互独立,服从同一分布,具有相同的数学期 望E(Xi)=,i=1,2,,则对于任给正数 0,总成立,定理4(辛钦大数定律),即,即,这一节我们介绍了大数定律,大数定律以严格的数学形式表达了随机现象最根本的性质之一:,它是随机现象统计规律的具体表现.在理论和实际中都有广泛的应
16、用.,平均结果的稳定性,第二节 中心极限定理,客观背景:客观实际中,许多随机变量是由大量相互独立的偶然因素的综合影响所形成,每一个微小因素,在总的影响中所起的作用是很小的,但总起来,却对总和有显著影响,这种随机变量往往近似地服从正态分布。,概率论中有关论证独立随机变量的和的极限分布是正态分布的一系列定理称为中心极限定理。,由于无穷个随机变量之和可能趋于,故我们不研究n个随机变量之和本身而考虑它的标准化的随机变量,的极限分布.,下面介绍常用的三个中心极限定理。,定理1(独立同分布下的中心极限定理),设X1,X2,是独立同分布的随机变量序列,且E(Xi)=,D(Xi)=2,i=1,2,,则,定理表
17、明:当n充分大时,标准化随机变量,近似服从标准正态分布.,由此可知:对于独立的随机变量序列,不管 服从什么分布,只要它们是同分布,且有有限的数学期望和方差,那么,当n充分大时,这些随机变量之和 近似地服从正态分布,解:设 X k 表示第 k 次轰击命中的炮弹数,,设 X 表示100次轰击命中的炮弹数,则,由独立同分布中心极限定理,有,则,(1),(2),例2.一食品店有三种蛋糕出售,由于售出哪一种蛋糕是随机的,因而售出一只蛋糕的价格是一个随机变量,它取1(元),1.2(元),1.5(元)各值的概率分别为0.3,0.2,0.5.某天售出300只蛋糕.求这天的收入至少达400(元)的概率,解:设第
18、i只蛋糕的价格为Xi,i=1,2,300,则Xi的分布律为,由独立同分布中心极限定理知:,即,定理2(德莫佛拉普拉斯中心极限定理),设n重贝努利试验中事件A发生的次数为n,事件A在每次试验中发生的概率为p,则对于任给实数x,总成立,定理表明:若 服从二项分布,当n很大时,,由此可知:当n很大,0p1是一个定值时(或者说,np(1-p)也不太小时),服从二项分布B(n,p)的随机变量 近似服从正态分布 N(np,np(1-p).,分布.,例3 某次课堂测验,有200道选择题,每一题有4个答案.试问一位完全不会的学生,想凭着猜测的方法回答此200题中的80题,而答对25题至30题的概率是多少?,设
19、答对的题数为X,则,解:,XB(80,0.25),例4 某电视机厂每周生产10000台电视机,但它的显像管车间的正品率为0.8,为了能以0.997的概率保证出厂的电视机都装上正品显像管,该车间每周应生产多少只显像管?,解:设该车间每周生产n只显像管,其中正品的个数为X,则,XB(n,0.8),即:,查表,知,从而得:,即该车间每周至少应生产12655只显像管,才能以0.997的概率保证出厂的电视机都装上正品显像管.,定理3(李雅普诺夫中心极限定理),则,第一节 参数估计的意义和种类,一、参数估计问题,二、未知参数的估计量和估计值,三、参数估计的种类,数理统计的基本问题是根据样本提供的信息,对总
20、体的分布以及分布的某些数字特征作出推断。这个问题中的一类是总体分布的类型为已知,而它的某些参数为未知,根据所得样本对这些参数作出推断,这类问题称为参数估计。如:,一、参数估计问题,已知显象管的使用寿命服从指数分布,但参数未知,现抽样得样本X1,X2,Xn,依据某理论(后述)用样本来估计参数.这就是参数估计问题.,二、未知参数的估计量和估计值,样本X1,X2,Xn,样本值x1,x2,xn.,设有一个总体X,其分布函数为 F(x,),其中为,未知参数(也可以是未知向量).现从该总体抽样,得,g(X1,X2,Xn)为的估计量,将样本值x1,x2,xn,若构造出适当的统计量 g(X1,X2,Xn)来估
21、计,则称,代入,则称g(x1,x2,xn)为的估计值.,估计未知参数的值,估计未知参数的取值范围,并使此范围包含未知参数真值的概率为给定的值.,三、参数估计的种类,设这5个数是:,1.65 1.67 1.68 1.78 1.69,若估计为1.68,,这是点估计.,这是区间估计.,若估计在区间(1.57,1.84)内,,现从该总体选取容量为5的样本,我们的任务是要,例如:我们要估计某队男生的平均身高.,且假定身高服从正态分布,根据选出的样本值(5个数)求出总体均值的估计值.,而全部信息就由这5个数组成.,一、矩估计法,第二节 点估计的求法,二、极大似然估计法,一.矩估计法,理论依据:,记总体k阶
22、矩为,样本k阶矩为,(辛钦大数定律及其推论),则样本 k 阶矩 依概率收敛于总体 k 阶矩.,方法:,出待估参数.,建立含有待估参数的方程,从而解,样本 X1,X2,Xn的前 k 阶矩记为,步骤:,设总体的分布函数的形式已知,待估参数为,总体的前 k 阶矩存在.,(1)求出总体的前 k 阶矩,一般是这 k 个参数的函,函数,记为:,7-12,(3)解此方程组,得 k 个统计量:,称为未知参数 1,k 的矩估计量,这是含未知参数 1,2,k 的k个方程构成的方程组,,(2)令,7-12,代入样本值,得 k 个数:,称为未知参数 1,k 的矩估计值,例1.设总体 X B(m,p),其中p 未知,X
23、1,X2,Xn为总体的样本,求p 的矩估计量.,解:,令,7-13,得,总体矩,样本矩,例2.设总体X的概率密度为,解:,X1,Xn为样本,求参数 的矩估计.,令,得,总体矩,样本矩,例3.设X1,X2,Xn是取自总体X的一个样本,其中0,求,的矩估计.,解:,令,解得,用样本矩估计总体矩,由课文本节例1知:,例4.设从某灯泡厂某天生产的灯泡中随机抽取10只灯泡,测得其寿命为(单位:小时)1050,1100,1080,1120,1200,1250,1040,1130,1300,1200,试用矩法估计该厂这天生产的灯泡的平均寿命及寿命分布的方差.,解:,7-14,二、极大似然估计法,即:在一次试
24、验中,概率最大的事件最有可能发生.,引例:有两个外形相同的箱子,各装100个球,一箱中,取得的球是白球.问:所取的球来自哪一箱?,答:第一箱.,中有99个白球1个红球,一箱中有1个白球99个红球。,现从两箱中任取一箱,并从箱中任取一球,结果所,一般说,若事件A发生的概率与参数有关,取值不同,P(A)也不同。则应记事件A发生的概率为P(A|).若一次试验,事件A发生了,可认为此时的 值应是在中使P(A|)达到最大的那一个。这就是极大似然原理.,(极大似然原理),极大似然估计法的理论依据:,X1,X2,Xn是取自总体X的样本,x1,x2,xn是样本值.,则样本的联合分布律为:,似然函数:,1.X是
25、离散型总体,其分布律为:,记,2.X是连续型总体,其概率密度为,为其样本的似然函数.,则称,该样本值出现的可能性大小.,极大似然估计的方法:,对于给定的样本值x1,x2,xn,选取,使得,7-22,称为未知参数 1,k 的极大似然估计值,这样得到的估计值,对应的统计量,称为未知参数1,k 的 极大似然估计量,(1)由总体分布和所给样本,求得似然函数,步骤:,同时取得最大值),(3)解方程组,7-12,(4)得未知参数1,k的极大似然估计值,及其对应的极大似然估计量,7-12,若待估参数只有一个,则似然函数是一元函数L(),此时,只须将上述步骤中求偏导改为求导即可。,说明:,布,求参数的极大似然
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 课件 全集
链接地址:https://www.31ppt.com/p-5356785.html