概率论与数理统计(柴中林)第15讲.ppt
《概率论与数理统计(柴中林)第15讲.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计(柴中林)第15讲.ppt(34页珍藏版)》请在三一办公上搜索。
1、,概率论与数理统计第十五讲,主讲教师:柴中林副教授,中国计量学院理学院,数理统计学是一门应用性很强的学科。它研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出正确的推断和预测,为采取正确的决策和行动提供依据和建议。,数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析。,第六章 样本与统计量,6.1 引言,由于大量随机现象必然呈现出其规律性,因而从理论上讲,只要对随机现象进行足够多次的观察,随机现象的规律性就一定能够清楚地呈现出来。,但是,客观上只允许我们对随机现象进行次数不多的观察或试验,也就是说:我们获得的只能是局部的或有限的
2、观察资料。,数理统计的任务就是研究怎样有效地收集、整理和分析所获得的有限资料,并对所研究的问题尽可能地给出精确而可靠的推断。,现实世界中存在着形形色色的数据,分析这些数据需要多种多样的方法。,因此,数理统计中的方法和支持这些方法的相应理论是相当丰富的。概括起来可以归纳成两大类。参数估计:根据数据,对分布中的未知参数 进行估计;假设检验:根据数据,对分布的未知参数的 某种假设进行检验。参数估计与假设检验构成了统计推断的两种基本形式,这两种推断渗透到了数理统计的每个分支。,6.2 总体与样本,在数理统计中,称研究问题所涉及对象的全体为总体,总体中的每个成员为个体。例如:研究某工厂生产的某种产品的废
3、品率,则这种产品的全体就是总体,而每件产品都是一个个体。,6.2.1 总体、个体与样本,实际上,我们真正关心的并不一定是总体或个体本身,而真正关心的是总体或个体的某项数量指标。如:某电子产品的使用寿命,某天的最高气温,加工出来的某零件的长度等数量指标。因此,有时也将总体理解为那些研究对象的某项数量指标的全体。,为评价某种产品质量的好坏,通常的做法是:从全部产品中随机(任意)地抽取一些样品(部分个体)进行观测(检测),统计学上称这些样品为一个样本。同样,我们也将样本的数量指标称为样本。因此,今后当我们说到总体及样本时,既指研究对象又指它们的某项数量指标。,例1:研究某地区 N 个农户的年收人。在
4、这里,总体既指这 N 个农户,又指我们所关心的 N个农户的数量指标他们的年收入(N 个数字)。如果从这 N 个农户中随机地抽出 n 个农户作为调查对象,那么,这 n 个农户以及他们的数量指标年收入(n个数字)就是样本。,注意:上例中的总体是直观的,看得见、摸得着的。但是,客观情况并非总是这样。,例2:用一把尺子测量一件物体的长度。假定 n 次测量值分别为X1,X2,Xn。显然,在该问题中,我们把测量值X1,X2,Xn看成样本。但总体是什么呢?,事实上,这里没有一个现实存在的个体的集合可以作为上述问题的总体。可是,我们可以这样考虑,既然 n 个测量值 X1,X2,Xn 是样本,那么,总体就应该理
5、解为一切所有可能的测量值的全体。,又如:为研究某种安眠药的药效,让 n 个病人同时服用这种药,记录服药者各自服药后的睡眠时间比未服药时增加睡眠的小时数 X1,X2,Xn,则这些数字就是样本。那么,什么是总体呢?设想让某个地区(或某国家,甚至全世界)所有患失眠症的病人都服用此药,则他们所增加睡眠的小时数之全体就是研究问题的总体。,对一个总体,如果用X表示其数量指标,那么,X的值对不同的个体就取不同的值。因此,如果我们随机地抽取个体,则X的值也就随着抽取个体的不同而不同。所以,X是一个随机变量!既然总体是随机变量X,自然就有其概率分布。我们把X的分布称为总体分布。总体的特性是由总体分布来刻画的。因
6、此,常把总体和总体分布视为同义语。.,6.2.2 总体分布,例 3(例 l 续):在例 l中,若农户年收入以万元计,假定 N户的收入X只取以下各值:0.5,0.8,l.0,1.2和1.5。取上述值的户数分别n1,n2,n3,n4和n5(n1+n2+n3+n4+n5=N)。则X为离散型分布,分布律为:,例4(例2续):在例2中,假定物体真实长度为(未知)。一般说来,测量值X就是总体,取 附近值的概率要大一些,而离 越远的值被取到的概率就越小。如果测量过程没有系统性误差,则X取大于 和小于 的概率也会相等。在这种情况下,人们往往认为X 服从均值为,方差为2 的正态分布。2反映了测量的精度。于是,总
7、体X的分布为 N(,2)。,说明:这里有一个问题,即物体长度的测量值总是在其真值 的附近,它不可能取负值。而正态分布取值在(-,)上。那么,为什么可以认为测量值X服从正态分布呢?回答这个问题,有如下两方面的理由。,(1).在前面讲过,对于XN(,2),P-3X+3=0.9974.即 X 落在区间(-3,+3)之外的概率不超过 0.003,这个概率非常小。X 落在(-4,+4)之外的概率就更小了。,例如:假定物体长度=10厘米,测量误差为0.01厘米,则2=0.012。这时,(-3,+3)=(9.97,10.03)。于是,测量值落在这个区间之外的概率最多只有0.003,可忽略不计。可见,用正态分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论 数理统计 柴中林 15
链接地址:https://www.31ppt.com/p-5992102.html