概率论与数理统计第六章样本与抽样分布.ppt
《概率论与数理统计第六章样本与抽样分布.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计第六章样本与抽样分布.ppt(85页珍藏版)》请在三一办公上搜索。
1、Probability Theory and Mathematical Statistics,概率论与数理统计,2023年11月3日星期五,2,第六章 样本与抽样分布,本章主要内容1 总体与个体2 直方图与经验分布函数3 统计量及其分布,2023年11月3日星期五,3,1.定义1:一个统计问题总有它明确的研究对象.,一.总体与个体,研究对象的全体称为总体(母体),,总体中每个成员称为个体.,总体,6.1 总体与个体,2023年11月3日星期五,4,2.有限总体和无限总体,定义2:样本中所包含的个体数目n称为样本容量。,注:当有限总体包含的个体的总数很大时,可近似地将它看成是无限总体.,总体容量
2、有限的成为有限总体,总体容量无限的称为无限总体,6.1 总体与个体,2023年11月3日星期五,5,然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.,6.1 总体与个体,2023年11月3日星期五,6,由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性.从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布.,这样,总体就可以用一个随机变量及其分布来描述.统称总体X。,6.1 总体与个体,注意,2023年11月3日星期五,7,而概率分布正是刻划这种
3、集体性质的适当工具.因此在理论上可以把总体与概率分布等同起来.,统计的任务,是根据从总体中抽取的样本,去推断总体的性质.,由于我们关心的是总体中的个体的某项指标(如人的身高、体重,灯泡的寿命,汽车的耗油量),所谓总体的性质,无非就是这些指标值的集体的性质.,6.1 总体与个体,2023年11月3日星期五,8,例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.,某批灯泡的寿命,总体,寿命X可用一概率分布来刻划,鉴于此,常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x).,6.1 总体与个体,2023年11月3日星期
4、五,9,类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.,统计中,总体这个概念 的要旨是:总体就是一个 概率分布.,6.1 总体与个体,2023年11月3日星期五,10,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.,二.样本,6.1 总体与个体,2023年11月3日星期五,11,但是,一旦取定一组样本,得到的是n个具体的数(x1,x2
5、,xn),称为样本的一次观察值,简称样本值.,样本是随机变量.,抽到哪5辆是随机的,容量为n的样本可以看作n维随机变量.,6.1 总体与个体,2023年11月3日星期五,12,2.独立性:X1,X2,Xn是相互独立的随机变量.,由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.,最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:,1.代表性:X1,X2,Xn中每一个与所考察的总体有相同的分布.,6.1 总体与个体,2023年11月3日星期五,13,由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独
6、立的随机变量X1,X2,Xn表示.,若总体的分布函数为F(x),则其简单随机样本的联合分布函数为,三.样本的概率分布,6.1 总体与个体,2023年11月3日星期五,14,今后,若不特别说明,就指简单随机样本.,若连续总体的概率密度函数为f(x),则其样本的联合概率密度函数为,6.1 总体与个体,离散时,概率函数是指分布率p(x),则其样本的联合分布率为,注意,2023年11月3日星期五,15,事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值.,四.总体、样本、样本值的关系,6.1
7、总体与个体,2023年11月3日星期五,16,统计是从手中已有的资料-样本值,去推断总体的情况-总体分布F(x)的性质.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,6.1 总体与个体,2023年11月3日星期五,17,例1-1:已知总体X服从参数为 的泊松分布,求样本的联合分布律,6.1 总体与个体,2023年11月3日星期五,18,6.1 总体与个体,2023年11月3日星期五,19,一、直方图(自学),当取得一组样本值后,一般先根据样本的取值作出频率直方图对总体的分布情况作一个几何直观上的粗略了解,然后再进行进一步的分
8、析推断直方图是频数分布的图形表示,它的横坐标表示所关心变量的取值区间,纵坐标有三种表示方法:频数,频率,最准确的是频率/组距,它可使得诸长条矩形面积和为1。凡此三种直方图的差别仅在于纵轴刻度的选择,直方图本身并无变化。,6.2 直方图与经验分布函数,2023年11月3日星期五,20,6.2 直方图与经验分布函数,2023年11月3日星期五,21,6.2 直方图与经验分布函数,2023年11月3日星期五,22,6.2 直方图与经验分布函数,2023年11月3日星期五,23,例2-1 某工厂用自动包装机包装产品,为了考察每袋产品重量的波动情况,选取100袋产品测得其重量如下:(单位:kg),根据测
9、得的数据作出频率直方图97.894.698.9100.999.8102.797.9 98.7 97.195.599.0101.199.6102.997.795.7 99.3 102.199.5101.299.9103.198.295.899.1 100.3 98.8101.3100.0103.898.196.099.0101.4 99.9 98.9100.198.396.399.2101.5100.2104.5 99.8 100.998.596.699.3101.4100.397.898.4 102.2 99.896.799.4101.1100.496.999.5101.0 98.8 102.
10、4100.198.597.099.1101.2100.298.0 100.7 99.797.299.2101.6100.298.197.499.0 98.6 100.1101.6100.498.197.599.4101.8100.5 102.3 100.6102.0100.298.999.7100.6102.1 100.8 99.6 98.8100.4,6.2 直方图与经验分布函数,2023年11月3日星期五,24,6.2 直方图与经验分布函数,2023年11月3日星期五,25,6.2 直方图与经验分布函数,2023年11月3日星期五,26,6.2 直方图与经验分布函数,2023年11月3日星
11、期五,27,二、经验分布函数,6.2 直方图与经验分布函数,2023年11月3日星期五,28,为由x1,x2,xn确定的经验分布函数.,定义6,设x1,x2,xn是总体X的样本值,称函数,6.2 直方图与经验分布函数,2023年11月3日星期五,29,经验分布函数与理论分布函数的关系,6.2 直方图与经验分布函数,2023年11月3日星期五,30,这也是利用样本来估计和判断总体的基本理论和依据,6.2 直方图与经验分布函数,例2-2 从某总体中抽取容量为5的样本,其观测值依次为-1.2,2.6,1.8,-0.7,1.8求经验分布函数,并画出的图形,解 将数据由小到大排列得:-1.2,-0.7,
12、1.8,1.8,2.6,2023年11月3日星期五,31,则经验分布函数为:,6.2 直方图与经验分布函数,2023年11月3日星期五,32,的图形见下图,6.2 直方图与经验分布函数,2023年11月3日星期五,33,由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.,一、样本统计量,定义;设 x1,x2,xn 为取自某总体的样本,若样本函数T=g(x1,x2,xn)中不含有任何未知参数。则称T 为统计量。它是完全由样本决定的量.统计量的分布称为抽样分布。,6.3 统计量及其分布,2023年11月3日星期五,34,为什么要
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论 数理统计 第六 样本 抽样 分布
链接地址:https://www.31ppt.com/p-6475404.html