概率论与数理统计(浙大版)第五章第六章课件.ppt
第五章 大数定律和中心极限定理,关键词:契比雪夫不等式大数定律中心极限定理,1,.,第五章 大数定律和中心极限定理1.,1 大数定律,背景 本章的大数定律,对第一章中提出的 “频率稳定性”,给出理论上的论证为了证明大数定理,先介绍一个重要不等式,2,.,1 大数定律背景 本章的大数定律,对第一章中提出的2,3,.,3.,4,.,4.,例1:在n重贝努里试验中,若已知每次试验事件A 出现的概率为0.75,试利用契比雪夫不等式估 计n,使A出现的频率在0.74至0.76之间的概率不 小于0.90。,5,.,例1:在n重贝努里试验中,若已知每次试验事件A5.,随机变量序列依概率收敛的定义,6,.,随机变量序列依概率收敛的定义 6.,7,.,7.,辛钦大数定理(弱大数定理) 设X1,X2,Xn为独立、同分布的随机变量,且有相同的数学期望E(Xi)= (i=1,2,), 则对0,有,以概率收敛于,8,.,辛钦大数定理(弱大数定理) 设X1,X2,Xn为,03,3,4分,9,.,03,3,4分9.,大数定律的重要意义:贝努里大数定律建立了在大量重复独立试验中事件出现频率的稳定性,正因为这种稳定性,概率的概念才有客观意义,贝努里大数定律还提供了通过试验来确定事件概率的方法,既然频率nA/n与概率p有较大偏差的可能性很小,我们便可以通过做试验确定某事件发生的频率并把它作为相应的概率估计,这种方法即是在第7章将要介绍的参数估计法,参数估计的重要理论基础之一就是大数定理。,10,.,大数定律的重要意义:10.,2 中心极限定理,背景: 有许多随机变量,它们是由大量的相互独立的随机变量的综合影响所形成的,而其中每个个别的因素作用都很小,这种随机变量往往服从或近似服从正态分布,或者说它的极限分布是正态分布,中心极限定理正是从数学上论证了这一现象,它在长达两个世纪的时期内曾是概率论研究的中心课题。,11,.,2 中心极限定理背景:11.,12,.,12.,02,4,3分,13,.,02,4,3分13.,二项分布和正态分布的关系,14,.,二项分布和正态分布的关系14.,示意例图,15,.,示意例图15.,例2:设某种电器元件的寿命服从均值为100小时的指 数分布,现随机取得16只,设它们的寿命是相互 独立的,求这16只元件的寿命的总和大于1920小 时的概率。,16,.,例2:设某种电器元件的寿命服从均值为100小时的指16.,例3:某保险公司的老年人寿保险有1万人参加,每人每年交200元,若老人在该年内死亡,公司付给受益人1万元。设老年人死亡率为0.017,试求保险公司在一年内这项保险亏本的概率。,17,.,例3:某保险公司的老年人寿保险有1万人参加,每人每年交20,例4:设某工厂有400台同类机器,各台机器发生故障的概 率都是0.02,各台机器工作是相互独立的,试求机 器出故障的台数不小于2的概率。,18,.,例4:设某工厂有400台同类机器,各台机器发生故障的概,作业题,P95 :19,19,.,作业题P95 :1919.,第五章复习,20,.,第五章复习20.,21,.,21.,22,.,22.,辛钦大数定理(弱大数定理) 设X1,X2,Xn为独立、同分布的随机变量,且有相同的数学期望E(Xi)= (i=1,2,), 则对0,有,以概率收敛于,23,.,辛钦大数定理(弱大数定理) 设X1,X2,Xn为,大数定律的重要意义:贝努里大数定律建立了在大量重复独立试验中事件出现频率的稳定性,正因为这种稳定性,概率的概念才有客观意义,贝努里大数定律还提供了通过试验来确定事件概率的方法,既然频率nA/n与概率p有较大偏差的可能性很小,我们便可以通过做试验确定某事件发生的频率并把它作为相应的概率估计,这种方法即是在第7章将要介绍的参数估计法,参数估计的重要理论基础之一就是大数定理。,24,.,大数定律的重要意义:24.,25,.,25.,二项分布和正态分布的关系,26,.,二项分布和正态分布的关系26.,第六章 数理统计的基本概念,关键词: 总 体 个 体 样 本 统 计 量,27,.,第六章 数理统计的基本概念关键词:27.,补充统计图:直方图和箱线图,直方图:概念演示; 函数hist or imhist频率直方图(概率直方图)概念,28,.,补充统计图:直方图和箱线图直方图:概念演示;28.,29,.,29.,直方图,30,.,直方图30.,频率直方图,31,.,频率直方图31.,减少频率直方图的柱子数目(256 32),32,.,减少频率直方图的柱子数目(256 32)32.,箱线图(matlab-Boxplot),Outlier异常值,33,.,箱线图(matlab-Boxplot)Outlier33.,34,.,34.,求箱线图不存在异常值的流程示意图,第一步 第二步,35,.,求箱线图不存在异常值的流程示意图第一步,求箱线图不存在异常值的流程示意图,第三步 第四步,36,.,求箱线图不存在异常值的流程示意图第三步,求箱线图不存在异常值的流程示意图,第五步 第六步,37,.,求箱线图不存在异常值的流程示意图第五步,求箱线图不存在异常值的流程示意图,第五步 第六步,38,.,求箱线图不存在异常值的流程示意图第五步,求箱线图不存在异常值的流程示意图,第七步 (结束步),39,.,求箱线图不存在异常值的流程示意图第七步 (结束步),求箱线图存在异常值的流程示意图,第一步 第二步,40,.,求箱线图存在异常值的流程示意图第一步,求箱线图存在异常值的流程示意图,第三步 第四步,41,.,求箱线图存在异常值的流程示意图第三步,求箱线图存在异常值的流程示意图,第五步 第六步,42,.,求箱线图存在异常值的流程示意图第五步,求箱线图存在异常值的流程示意图,第七步 第八步,43,.,求箱线图存在异常值的流程示意图第七步,引言:数理统计学是一门关于数据收集、整理、分析 和推断的科学。在概率论中已经知道,由于大量的随机试验中各种结果的出现必然呈现它的规律性,因而从理论上讲只要对随机现象进行足够多次观察,各种结果的规律性一定能清楚地呈现,但是实际上所允许的观察永远是有限的,甚至是少量的。例如:若规定灯泡寿命低于1000小时者为次品,如何确定次品率?由于灯泡寿命试验是破坏性试验,不可能把整批灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验,以样本的信息来推断总体的信息,这是数理统计学研究的问题之一。,44,.,引言:数理统计学是一门关于数据收集、整理、分析 和推,1 总体和样本,总体:研究对象的全体。如一批灯泡。个体:组成总体的每个元素。如某个灯泡。抽样:从总体X中抽取有限个个体对总体进行观察的取值过程。随机样本:随机抽取的n个个体的集合(X1,X2,Xn), n为样本容量简单随机样本:满足以下两个条件的随机样本(X1,X2,Xn)称 为简单随机样本。1. 每个Xi与X同分布2. X1,X2,Xn是相互独立的随机变量说明:后面提到的样本均指简单随机样本,由概率论知,若总体X 具有概率密度f(x), 则样本(X1,X2,Xn)具有联合密度函数:,45,.,1 总体和样本总体:研究对象的全体。如一批灯泡。45.,样本:(1)从总体中随机抽取n个个体,n维随机变量 就是一个样本,,n为样本容量 。,(2) 对这n个个体 进行测试,得到一组数据 ,这组数据叫做样本值,样本值也简称为样本。,这就是样本的二重性。,样本概念的二重性,46,.,样本:(1)从总体中随机抽取n个个体n维随机变量,数理统计:利用样本 对总体X 的,做出推断(估计)。,47,.,数理统计:利用样本,二. 统计量,样本,统计量:,48,.,二. 统计量 如,考察物体a的长度,测量10次,得到数据总,2. 常见的统计量,估计,估计,弱大数定理,49,.,统计量:样本的函数,估计,估计,估计,估计,特别的,,(4)样本的k阶原点矩:,(5)样本的k阶中心矩:,50,.,估计估计估计估计特别的, (4)样本的k阶原点矩:(5)样本,51,.,51.,52,.,52.,理想信号,53,.,理想信号53.,测量信号,54,.,测量信号54.,55,.,55.,连续测量20次后求样本均值,56,.,连续测量20次后求样本均值56.,连续测量50次后求样本均值,57,.,连续测量50次后求样本均值57.,连续测量200次后求样本均值,58,.,连续测量200次后求样本均值58.,随机变量独立性的定理,返回,59,.,随机变量独立性的定理返回59.,2 常用的分布,60,.,2 常用的分布 n=4n=1n=1060.,-,61,.,-61.,62,.,62.,t-,63,.,t-63.,t分布的性质:(1) 即 分布的极限( 分布是标准正态分布,(2) ,则,64,.,t分布的性质:(1),65,.,65.,F-,66,.,F-66.,67,.,67.,例2:设X1,X2,X3,X4是来自正态总体N(0,22)的简单随机样本,则服从_分布 ;,68,.,例2:设X1,X2,X3,X4是来自正态总体N(0,22)的,例3:设X1,X2,X3,X4是来自正态总体N(0,22)的简单随机样本,则()()服从_分布。,69,.,例3:设X1,X2,X3,X4是来自正态总体N(0,22)的,70,.,70.,四. 正态总体统计量的分布,定理1 设总体,71,.,四. 正态总体统计量的分布定理1 设总体线性组合正,标准化,得到,72,.,标准化,得到72.,73,.,受到1个约束,独立的变量个数为n-1独73.,且相互独立,74,.,且相互独立74.,75,.,75.,76,.,76.,77,.,77.,78,.,78.,79,.,79.,80,.,80.,.,.,82,.,82.,其中,则,83,.,其中 则 83.,84,.,84.,85,.,85.,作业题,P95 :19,86,.,作业题P95 :1986.,作业题,P111 :8,87,.,作业题P111 :887.,复习,88,.,复习88.,2 常用的分布,89,.,2 常用的分布 89.,t分布的极限分布是标准正态分布,90,.,t分布的极限分布是标准正态分布90.,91,.,91.,四个定理. 正态总体统计量的分布,定理1 设总体,标准化,得到,92,.,四个定理. 正态总体统计量的分布定理1 设总体标准化,93,.,受到1个约束,独立的变量个数为n-1独93.,94,.,94.,返回,95,.,返回95.,返回,96,.,返回96.,97,.,97.,返回,98,.,返回98.,99,.,99.,