概率论与数理统计第六章.ppt
《概率论与数理统计第六章.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计第六章.ppt(62页珍藏版)》请在三一办公上搜索。
1、概率论与数理统计,计算机科学学院 裘国永,第六章 样本及抽样分布,引言随机样本抽样分布,本章转入课程的第二部分,数理统计,引言,数理统计是以概率论的理论为基础、通过试验所得数据来研究随机现象的一门数学分支,应用广泛,内容丰富。,概率论是数理统计的理论基础,数理统计是概率论的重要应用。,从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作。但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断。,到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科。,数理统计学是一门
2、应用性很强的学科。它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议。,例如:目前地震预测研究有3种不同的思路:地震地质。地震统计。对过去已发生的地震,运用数理统计方法,从中发现地震发生的规律,特别是时间序列的规律,根据过去以推测未来。此法把地震问题归结为数学问题。因需要对大量地震资料作统计,研究的区域往往过大,所以判定地震的地点有困难,而且外推常常不准确。地震前兆。,数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析。,由于大量随机现象必然呈现出它的规律性,因而从理论上讲
3、,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来。,但客观上只允许我们对随机现象进行,次数不多的观察试验,也就是说,我们获得的只是局部观察资料。,在概率论中所研究的随机变量,它的分布都是假设已知的,在这一前提下去研究它的性质、特点和规律性,例如求出它的数字特征,讨论随机变量函数的分布,介绍常用的各种分布等。,而在数理统计中的随机变量,它的分布是未知的,或者不完全知道,人们通过对所研究的随机变量进行重复、独立的观察,得到许多观察值,对这些数据进行分析,从而对随机变量的分布作出种种判断。,现实世界中存在着形形色色的数据,分析这些数据需要多种多样的方法。因此,数理统计中
4、的方法和支持这些方法的相应理论是相当丰富的,概括起来可以归纳成两大类:参数估计根据数据,用一些方法对分布的未知参数进行估计。假设检验根据数据,用一些方法对分布的未知参数进行检验。它们构成了统计推断的两种基本形式。这两种推断渗透到了数理统计的每个分支。,6.1 随机样本,总体和样本,在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断。,数理统计方法具有“部分推断整体”的特征。,实际上,我们真正关心的并不是研究对象本身,而是其某项数量指标。比如某家工厂的一种产品的使用寿命这样一项数量指标。,1.总体,对研究
5、对象上的某项数量指标进行观察。试验的全部可能的观察值称为总体。这些值不一定各不相同(可能重复),数目上也不一定有限。每一个可能的观察值称为个体。总体中所包含的个体的个数称为总体的容量。,总体,有限总体,无限总体,例6.1 研究某地区N个农户的年收入。,总体指他们的年收入的N个数字。,例6.2 用一把尺子去量一个物体的长度。,总体应该理解为一切所有可能的测量值的全体。,一般,我们所研究的总体的某项数量指标X是一个随机变量,其取值在客观上有一定的分布。因此,对总体的研究,就是对相应的随机变量X的研究。,今后,我们称X的分布函数和数字特征分别为总体的分布函数和数字特征,并不再区分总体与相应的随机变量
6、X。对总体的称呼:总体,总体X与总体F。,2.总体的分布,在例6.l中,若农户年收入以万元计,假定N户中收入X为以下几种取值:0.5,0.8,l,1.2和1.5。取这些值的农户个数分别为:n1,n2,n3,n4,n5,(这里n1+n2+n3+n4+n5=N)。,例6.3(例6.l续),则总体X的分布为离散型分布,其分布律为:,例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示。,寿命 X 可用指数分布来刻划,鉴于此,常用随机变量的记号或用其分布函数表示总体。如说总体X或总体F(x)。,寿命总体是指数分布总体,类似地,在研究某地区中
7、学生的营养状况时,若关心的数量指标是身高和体重,我们用X 和Y 分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数 F(x,y)来表示。,总体分布一般是未知,或只知道是包含未知参数的分布,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本。样本中所包含的个体数目称为样本容量。,3.样本,从国产轿车中抽5辆进行耗油量试验,样本容量为5,当n次观察一经完成,得到n个具体的数 x1,x2,xn,称为样本X1,Xn的一次观察值,简称样本值。,1.代表性:X1,X2,Xn中每一个与所考察的
8、总体有 相同的分布。,2.独立性:X1,X2,Xn是相互独立的随机变量。,对总体X在相同的条件下,进行n次重复、独立观察,其结果依次记为X1,X2,Xn,这样得到的随机变量X1,X2,Xn是来自总体X的一个简单随机样本,与总体随机变量具有相同的分布。n是样本的容量。,这种抽样,叫作“简单随机抽样”,其特点:,对有限总体,采用放回抽样可得简单随机样本,但放回抽样使用起来不方便,当个体总数N比要得到的样本的容量n大得多时,在实际中可将不放回抽样近似当作放回抽样来处理。,对无限总体,因抽取一个个体不影响它的分布,所以总是采用不放回抽样。,定义 设X是具有分布函数F的随机变量,若X1,X2,Xn是具有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论 数理统计 第六

链接地址:https://www.31ppt.com/p-5136169.html