数理统计CH概率分布.ppt
2023/6/3,王玉顺:数理统计01_概率分布,1,第1章 概率分布Probability Distribution,2023/6/3,王玉顺:数理统计01_概率分布,2,事件和概率:讨论描述随机现象及其统计规律的术语及概念、现象发生可能性的计量、相互关系和运算;随机变量及分布:讨论随机现象的确定性数学表达,相同条件、大量重复观测下随机变量所遵循的取值规律;数字特征:讨论分布特征的数字表达;大数定律:讨论重复试验次数对频率和均值观测稳定性的影响。,1 概率分布,本章内容,2023/6/3,王玉顺:数理统计01_概率分布,3,1.1 事件与概率Event and Probability,1 概率分布,2023/6/3,王玉顺:数理统计01_概率分布,4,自然界存在两种现象,确定性现象:一定条件下必然发生;随机性现象:一定条件下可能发生,但结果不止一个,哪个结果发生预先并不知道。随机现象虽然表现为不确定性,但在大量、相同条件重复试验下,其观测结果会呈现出某种特定的规律,称作随机现象的统计规律。比如,多次抛掷一枚均质硬币,正面朝上的频率接近0.5。,随机现象(Random Phenomenon),1.1 事件与概率,2023/6/3,王玉顺:数理统计01_概率分布,5,数理统计学就是研究大量的随机现象,但限定为一类特定的随机现象,即在相同条件重复试验下所能观测到的随机现象。它研究随机现象的发生机制、统计规律和统计特征,研究解决工程实际问题的统计方法。,随机现象(Random Phenomenon),1.1 事件与概率,2023/6/3,王玉顺:数理统计01_概率分布,6,1.1.1 事件Random Event,1.1 事件与概率,2023/6/3,王玉顺:数理统计01_概率分布,7,满足下述三个条件的试验称为随机试验:(1)试验可在相同条件下重复进行;(2)试验的所有可能结果是明确可知的,并且不止一个;(3)每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定会出现哪一个结果。随机试验在统计学里可简称为试验。,1.1.1 事件,(1)随机试验(Random Experiment),2023/6/3,王玉顺:数理统计01_概率分布,8,1.1.1 事件,E1:一枚硬币抛一次,观察出现哪一面;E2:一枚硬币抛三次,观察正反面的排列;E3:一枚硬币抛三次,观察正面出现的次数;E4:一颗骰子抛一次,观察出现的点数;E5:在一批灯泡产品中,测定任一只的寿命;E6:在一批灯泡产品中,测定任一只的阻值。E7:在一超市里,观察每10分钟进来的人数;,(1)随机试验(Random Experiment),2023/6/3,王玉顺:数理统计01_概率分布,9,广义地讲,对任何一个特定对象的随机抽查或观测,均可看作是随机试验。比如,多次抛一枚均质硬币是随机试验,观测一个种族的身高、体重等是随机试验,观测某作物的株高是随机试验,观测条件近似动物对某种药物的生理反应是随机试验,小区测产是随机试验,等等。,1.1.1 事件,(1)随机试验(Random Experiment),2023/6/3,王玉顺:数理统计01_概率分布,10,1.1.1 事件,随机试验的每一个可能结果,称作基本事件(elementary event),亦称作简单事件(simple event),基本事件是描述随机试验不可能再分的事件。,(2)基本事件(Elementary Event),2023/6/3,王玉顺:数理统计01_概率分布,11,1.1.1 事件,抛硬币试验,正面朝上是一个基本事件,反面朝上也是一个基本事件。观测一个种族的身高状况,1.75米是一个基本事件,1.83米是一个基本事件,1.45米也是一个基本事件。小区测产,25.4kg是一个基本事件,26.7kg也是一个基本事件。花括弧括内容表达事件,常用于利用文字或表达式陈述事件的场合。,(2)基本事件(Elementary Event),2023/6/3,王玉顺:数理统计01_概率分布,12,1.1.1 事件,由若干个基本事件组合而成的事件,称作复合事件(compound event),也称作复杂事件。通常所说的随机事件(random event)是基本事件和复合事件的统称,即可指基本事件又可指复合事件。,(3)复合事件(Compound Event),2023/6/3,王玉顺:数理统计01_概率分布,13,事件A=HHH,HHT,HTH,HTT表示“第一次出现的是正面”用t表示灯泡的使用寿命(h),则 事件B1=t1000表示“灯泡是次品”事件B2=t1000表示“灯泡是合格品”事件B3=t1500表示“灯泡是一级品”,1.1.1 事件,(3)复合事件(Compound Event),2023/6/3,王玉顺:数理统计01_概率分布,14,1.1.1 事件,连续两次抛掷一枚硬币,均出现正面是一个复合事件,出现一正一反是一个复合事件,均出现反面也是一个复合事件。观测一个种族分区域的身高,平均1.77米、平均1.68米均是复合事件。小区测产,产量在10kg20kg之间是一个复合事件,产量在20kg30kg之间也是一个复合事件。,(3)复合事件(Compound Event),2023/6/3,王玉顺:数理统计01_概率分布,15,1.1.1 事件,每次试验中一定发生的事件称作必然事件(certain event),在任何一次试验中都不可能发生的事件称作不可能事件(impossible event)。随机事件简称作“事件”,而将不可能事件和必然事件视作随机事件的两个极端事件。,(4)必然事件与不可能事件(Certain and Impossible Event),2023/6/3,王玉顺:数理统计01_概率分布,16,掷一枚均质硬币试验,出现两个面之一是必然事件,两个面谁也不出现是不可能事件。小区测产,产量小于0kg是不可能事件,产量大于等于0kg是必然事件。,1.1.1 事件,(4)必然事件与不可能事件(Certain and Impossible Event),2023/6/3,王玉顺:数理统计01_概率分布,17,我们称一个随机事件发生,当且仅当它所包含的一个基本事件在试验中出现,1.1.1 事件,考察抛一枚硬币的试验,事件 A=出现正面若试验结果为出现反面,则事件A未发生若试验结果为出现正面,则事件A发生考察小区测产的事件 A=产量大于10kg若试验结果为11.2kg,则事件A发生若试验结果为5.4kg,则事件A未发生,(5)事件发生(Event come about),2023/6/3,王玉顺:数理统计01_概率分布,18,1.1.2 概率Probability,1.1 事件与概率,2023/6/3,王玉顺:数理统计01_概率分布,19,用于度量事件发生可能性大小的数值称作事件的概率(probability)。事件通常可用大写字母表示,如A、B等,相应的概率可用P(A)、P(B)等表示。,1.1.2 概率,(1)事件的概率,2023/6/3,王玉顺:数理统计01_概率分布,20,概率具有下述性质:设A为任一事件,则0P(A)1;对于必然事件,有P()=1;对于不可能事件,有P()=0。,1.1.2 概率,(2)概率的性质,2023/6/3,王玉顺:数理统计01_概率分布,21,不可能事件P()=0,必然事件P()=1。但反过来不成立,因为概率只代表“可能性”的大小,可能性为0的事件不一定总不发生,可能性为1的事件不一定总是发生比如小区测产,事件产量是25kg的概率等于0,但它不一定总不发生;事件产量不是25kg的概率等于1,但它不一定总是发生,1.1.2 概率,(2)概率的性质,2023/6/3,王玉顺:数理统计01_概率分布,22,在相同的条件下进行了n次试验,在这n 次试验中,事件A发生的次数nA 称为事件A发生的频数。比值nA/n 称为事件A发生的频率,并记成fn(A),即,1.1.2 概率,(3)概率的统计定义,2023/6/3,王玉顺:数理统计01_概率分布,23,历史上曾有几个著名的抛一枚均质硬币试验,试验者观测了抛掷次数、正面出现次数和正面出现频率等。结果发现,频率在0.5附近摆动,详见表1.1。试验重复次数愈大频率与0.5的偏差愈小,表现出向0.5稳定趋近的倾向,因此预测事件的概率为0.5。试验次数愈大,事件频率在某个定值两侧摆动的幅度愈小,称作事件频率具有稳定性。,1.1.2 概率,(3)概率的统计定义,2023/6/3,王玉顺:数理统计01_概率分布,24,251 249 256 253 251 246 2440.502 0.498 0.512 0.506 0.502 0.492 0.4880.002-0.002 0.012 0.006 0.002-0.008-0.012,nAfn(A),n=500时抛硬币试验,实 验 者 德摩根 蒲丰K 皮尔逊K 皮尔逊,n nH fn(H),2048 40401200024000,1061 2048 601912012,0.51810.50960.50160.5005,表1.1,1.1.2 概率,(3)概率的统计定义,2023/6/3,王玉顺:数理统计01_概率分布,25,1.1.2 概率,随试验次数n的增大,若事件A的频率fn(A)越来越幅度变小地在某一常数p两侧摆动,则称常数p为事件A的概率(probability),记作P(A)=p。称此陈述为概率的统计定义。(statistical probability)。,(3)概率的统计定义,2023/6/3,王玉顺:数理统计01_概率分布,26,1.2 随机变量及分布Random Variable and Probability Distribution,1 概率分布,2023/6/3,王玉顺:数理统计01_概率分布,27,前面事件与概率的研究仅仅实现了随机现象及其关系的概念描述,远没有达到工程应用的程度,难于解决复杂多样的实际问题;引入人们熟悉的微积分实现随机现象的数值化定量分析,使能用计算机高效地处理工程实际的统计学问题;随机变量及其分布的理论和方法,实质上就是利用确定性数学方法研究和解决随机数学(统计学)问题。,1.2 随机变量及分布,(1)随机现象定量分析的意义,2023/6/3,王玉顺:数理统计01_概率分布,28,实施某随机试验,若用实数变量X表示试验结果,则X的取值明确可知且不止一个,试验前并不知道X会取那个值,表征随机试验结果的实数变量X称作随机变量;X的值用实数x表示,即一次试验的结果,是所有可能试验结果中的一个,称x为X的观察值,简称观测(observation);,(2)随机变量(Random Variable),1.2 随机变量及分布,2023/6/3,王玉顺:数理统计01_概率分布,29,由于随机变量X量化(数值化或数字化)表达了随机试验结果,因此它也具有随机试验的三个基本特征:随机变量X可在相同条件下重复观测;随机变量X的所有可能值明确可知,并且不止一个;每次观测总是恰好获得X所有可能值中的一个,但观测前却不能肯定是哪一个。,1.2 随机变量及分布,(2)随机变量(Random Variable),2023/6/3,王玉顺:数理统计01_概率分布,30,掷一枚均质硬币试验:样本空间1=H,T,随机变量表达该问题,以“X=1”表示正面向上的事件,以“X=0”表示反面向上的事件;掷一枚骰子试验:样本空间=1,2,3,4,5,6,随机变量表达该问题,以“X=1”表示出现1点的事件,“X=2”表示出现2点,以此类推;作物育种试验:以“X4.5”表示产量大于4.5kg的事件,不等式表达一个基本事件的集合。,1.2 随机变量及分布,(3)随机事件(Random Event),2023/6/3,王玉顺:数理统计01_概率分布,31,用随机变量X和某指定观测x可定义下述3种随机事件:,试验结果为x的事件:X=x试验结果小于或等于x的事件:Xx试验结果大于x的事件:Xx,1.2 随机变量及分布,(3)随机事件(Random Event),2023/6/3,王玉顺:数理统计01_概率分布,32,概率分布是概率论的基本概念之一,它用函数和微积分描述随机变量取值的概率规律。考察随机变量X与某指定观测x的关系,用事件概率P(Xx)以及事件概率的变化速率P(Xx)/1或dP(Xx)/dx描述概率分布;离散随机变量用求和函数描述概率分布;连续随机变量用积分函数描述概率分布。,1.2 随机变量及分布,(4)概率分布(Probability Distribution),2023/6/3,王玉顺:数理统计01_概率分布,33,本节主要讨论下述几个问题:随机变量、随机变量的观测、事件、概率四者之间的关系;离散变量的分布函数和概率密度;连续变量的分布函数和概率密度;常见离散分布和连续分布;随机变量的标准化变换;正态分布的概率计算。,1.2 随机变量及分布,本节内容,2023/6/3,王玉顺:数理统计01_概率分布,34,1.2.1离散变量的概率分布Discrete Variable and Probability Distribution,1.2 随机变量及分布,2023/6/3,王玉顺:数理统计01_概率分布,35,若随机变量X或事件X=x的所有可能取值为有限个或可列个,即取值存在间隔,则称X为离散随机变量(discrete variable)。比如,抛硬币试验取值0,1,播种穴粒数取值0,1,2,,以及其它“计数”类的随机变量。为便于数学处理,经常将随机变量的取值范围扩展到离散无穷域0,1,2,+,只不过取某些值的概率等于0。,1.2.1 离散变量的概率分布,(1)离散随机变量(Discrete Variable),2023/6/3,王玉顺:数理统计01_概率分布,36,离散随机变量用X表示,它的观察值用实数x表示,则离散变量随机试验中所发生的随机事件用等式表示:,1.2.1 离散变量的概率分布,(2)随机变量、观察值和随机事件,随机事件,观察值,2023/6/3,王玉顺:数理统计01_概率分布,37,观察值x按大小顺序分别记作xi,xixi-1,i=1,2,,则离散随机变量X的分布函数F(xi)定义如下:,分布函数亦称作概率累积函数Cumulative Distribution Function,(3)分布函数(Distribution Function),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,38,事件X=xi的概率记作pi=P(X=xi)。则离散随机变量X的概率密度f(xi)定义分布函数的变化率:,(4)概率密度(Probability Density),1.2.1 离散变量的概率分布,概率密度记为,离散变量的概率密度Probability Density亦称作概率函数Probability Function,2023/6/3,王玉顺:数理统计01_概率分布,39,概率密度表征离散随机变量取值x与取该值概率的函数关系,即描述按观测值大小顺序排列的概率分布规律。按定义,概率密度可理解为观察值的一个单位增量所对应的分布函数增量,或者发生事件离散随机变量X等于某指定观测x的概率。,1.2.1 离散变量的概率分布,(4)概率密度(Probability Density),2023/6/3,王玉顺:数理统计01_概率分布,40,概率密度可表示成如下的矩阵形式,矩阵的第1行为随机变量的观察值,第2行为事件X=xi的概率pi,矩阵元素上下对应。,1.2.1 离散变量的概率分布,(4)概率密度(Probability Density),2023/6/3,王玉顺:数理统计01_概率分布,41,抛硬币试验,抛骰子试验,1.2.1 离散变量的概率分布,(4)概率密度(Probability Density),2023/6/3,王玉顺:数理统计01_概率分布,42,所谓离散随机变量X的概率分布,就是指分布函数F(xi)和概率密度f(xi)两个基本函数,它们提供了随机变量概率分布规律的完整信息。,(5)概率分布(Probability Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,43,概率值非负:,全概率和等于1:,两极端事件的分布函数值:,(6)离散变量概率分布的性质,1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,44,若离散随机变量X的随机试验仅有两个可能结果,可将其表述为X=1和X=0两个事件,则X服从0-1分布。抛硬币试验,出现正面为1,出现反面为0种子发芽试验,发芽为1,不发芽为0杀虫剂试验,有效为1,无效为0田间播种出苗试验,出苗为1,不出苗为0,(7)0-1分布(0-1 Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,45,0-1分布概要:,(7)0-1分布(0-1 Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,46,(7)0-1分布(0-1 Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,47,遵循0-1分布规律的试验称作贝努利试验(binomial experiment)做n次贝努利试验称作n重贝努利试验n次抛硬币试验,统计正面出现的次数发芽试验,统计n粒种子中发芽的种子个数杀虫剂试验,统计n条虫子中被灭杀虫口数播种试验,统计n粒种子中出苗的种子个数,(8)二项分布(Binomial Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,48,设贝努里试验随机变量仅取0和1两个观察值,对于n重贝努里试验,若每次试验中事件=1发生的概率记为p,那么用以描述n次试验中事件=1发生次数的随机变量X可用随机变量系之和表示:,(8)二项分布(Binomial Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,49,=1代表什么与我们所关心的问题有关,(8)二项分布(Binomial Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,50,随机变量系之和,服从参数为n,p的贝努利分布(binomial distribution),亦称二项分布,记作XB(n,p),其中0p1。二项分布的概率密度为:,(8)二项分布(Binomial Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,51,Binomial分布概要:,(8)二项分布(Binomial Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,52,(8)二项分布(Binomial Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,53,(8)二项分布(Binomial Distribution),1.2.1 离散变量的概率分布,事件X=x的概率等于n个0-1积事件的条件概率,2023/6/3,王玉顺:数理统计01_概率分布,54,P=0.3,0.5,0.7,(8)二项分布(Binomial Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,55,设Y=X/n,相当于X乘了一个常数1/n,它指n重贝努利试验中事件出现的频率。不难推论,频率Y仍服从二项分布。即,(8)二项分布(Binomial Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,56,二项分布是具有n重贝努里试验背景的一种重要分布当n=1时,二项分布转化成0-1分布。因此0-1分布可被视作二项分布的一个特例由于二项分布随机变量X是0-1分布随机变量的线性组合,因而X可被视作0-1总体抽样获得的统计量,(8)二项分布(Binomial Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,57,观察某作物田间出苗状况,若每穴粒数相同,则沿播行单位长度上(当作小区)的出苗数或出苗率服从泊松分布;对一个容器按等时间间隔(看作小区)观测细菌的存活数;公路交叉路口单位时间间隔内过往的汽车数;汽车站或理发馆单位时间间隔内到达的顾客数等均服从泊松分布。,(9)泊松分布(Poisson Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,58,Poisson分布概要:,(9)泊松分布(Poisson Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,59,以顾客去理发馆为例导出Poisson分布:设每人去理发馆的概率是p,则不去的概率是1-p;当顾客源容量n与理发馆容量处于供需平衡状态时,有np=,且n愈大p愈小顾客是否去理发馆是n重贝努利试验,设去理发馆的人数为X,则人数为x的概率为,(9)泊松分布(Poisson Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,60,顾客源容量n很大时则概率p很小,去理发馆人数X等于x的概率可用下述极限近似,(9)泊松分布(Poisson Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,61,1.2.2.1 离散随机变量的概率分布,(9)泊松分布(Poisson Distribution),2023/6/3,王玉顺:数理统计01_概率分布,62,分布函数,概率本质:,全概率和:,(9)泊松分布(Poisson Distribution),1.2.1 离散变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,63,1.2.2连续变量的概率分布Continuous Variable and Probability Distribution,1.2 随机变量及分布,2023/6/3,王玉顺:数理统计01_概率分布,64,1.2.2 连续变量的概率分布,若随机变量X或事件Xx的中的临界观测x可在一定范围内连续(无缝、不间断)取值,即值域为(,+)或任意指定区间;或者说某区间内的所有数值都是随机试验的可能结果;则称X为连续随机变量(Continuous Variable)小区产量在(10,65)内取值,是连续随机变量玉米株高在(135,195)内取值,是连续随机变量其它“计量”类变量也是连续随机变量。,(1)连续随机变量(Continuous Variable),2023/6/3,王玉顺:数理统计01_概率分布,65,随机事件,随机事件,(2)随机变量、临界观察值与事件,临界观察值,1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,66,若X为一连续随机变量,x为任意实数,x+,则X的分布函数或概率累积函数F(x)定义为:,若将X看作数轴上的随机点,那么分布函数F(x)的直观意义就是随机点X落在区间(,x)上的概率。定义域为整个数轴,值域在0,1上。,(3)分布函数(Distribution Function),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,67,不可能事件:事件 的概率F()=0;必然事件:事件 的概率F(+)=1,概率本质:,单调非减:,(3)分布函数(Distribution Function),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,68,连续随机变量的分布函数F(x)是事件的概率,是连续函数,其函数曲线呈现为“S”形。,(3)分布函数(Distribution Function),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,69,设F(x)是随机变量X的分布函数,如果存在非负函数f(x),即f(x)0,使对任意实数x有,则称f(x)为连续随机变量X的概率密度(probability density)或密度函数(density function)或分布密度(distribution density),(4)概率密度(Probability Density),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,70,密度非负:,全概积分:,导数关系:,1.2.2 连续变量的概率分布,(4)概率密度(Probability Density),概率密度是分布函数的变化速率,2023/6/3,王玉顺:数理统计01_概率分布,71,概率密度曲线与x轴所围面积等于1;分布函数F(x)值等于密度曲线f(x)、x轴和X=x直线三者所围区域的面积(图中阴影面积)。,1.2.2 连续变量的概率分布,(4)概率密度(Probability Density),2023/6/3,王玉顺:数理统计01_概率分布,72,即随机变量X落在区间(x1,x2)上的概率,等于分布函数F(x)在该区间上的增量。由公式可知,X取任一定值 x1=x2=x的概率为0,这说明,虽然不可能事件的概率等于0,但反过来一个概率等于0的随机事件未必是不可能事件,这一特点是连续随机变量所特有的。公式可用于连续随机变量的概率计算。,(5)区间事件的概率,1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,73,(5)区间事件的概率,1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,74,高斯(Carl Friedrich Gauss,17771855)发表于1809年的绕日天体运动的理论一书涉及了误差分布的确定问题;设某个物理量的真值为,它的n个独立测量值为x1,x2,xn,则可用最大似然法估计:,(6)正态分布(Normal Distribution),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,75,高斯(Carl Friedrich Gauss,17771855)认为n个独立测量值x1,x2,xn的算术平均是的合理估计,并证明误差概率密度仅在具有下面形式的条件下,的最大似然估计才是n个独立测量值的算术平均,亦即,(6)正态分布(Normal Distribution),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,76,拉普拉斯(Laplace,1749-1827)根据他所发现的中心极限定理推论,若误差可看成许多量的叠加,误差理应有Gauss分布。这是历史上第一次提到所谓的“元误差学说”;元误差学说:误差是由大量的、由种种原因产生的元误差叠加而成;1837年,海根(G.Hagen)在一篇论文中正式提出元误差学说。他把误差设想成由数量很多的、独立同分布的“元误差”叠加而成。,(6)正态分布(Normal Distribution),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,77,按照海根(G.Hagen)的元误差学说:,(6)正态分布(Normal Distribution),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,78,玉米株高观测和频数、频率统计,(6)正态分布(Normal Distribution),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,79,玉米株高分布,(6)正态分布(Normal Distribution),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,80,Normal分布概要:,(6)正态分布(Normal Distribution),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,81,固定则概率密度曲线位置不变,曲线形状随的增大而峰值降低及两尾变粗和拉长,(6)正态分布(Normal Distribution),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,82,固定则概率密度曲线形状不变,位置随 的增大而右平移,(6)正态分布(Normal Distribution),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,83,分布函数形状是S型曲线,(6)正态分布(Normal Distribution),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,84,分布函数与概率密度是积分关系,(6)正态分布(Normal Distribution),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,85,对称性:概率密度曲线关于x=对称,极值点:x=是概率密度的唯一极值点,其极值为,曲线形状:愈大密度曲线中心愈右移 愈大密度曲线愈低矮肥胖 反之,愈小密度曲线中心愈左移 愈小密度曲线愈高耸瘦峭,(6)正态分布(Normal Distribution),1.2.2 连续变量的概率分布,2023/6/3,王玉顺:数理统计01_概率分布,86,1.2.3正态分布的概率计算Calculating the Probability based on Normal Distribution,1.2 随机变量及分布,2023/6/3,王玉顺:数理统计01_概率分布,87,1.2.3 正态分布的概率计算,标准正态概率密度,标准正态分布函数,若 XN(,2),当=0和=1时,称X服从标准正态分布。为区分计,随机变量特别地记作Z,则ZN(0,1),概率密度函数特别地记作,分布函数特别地记作。,(1)标准正态分布,2023/6/3,王玉顺:数理统计01_概率分布,88,随机变量变换,分布函数变换,(2)正态随机变量的标准化变换,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,89,分布函数计算公式:,利用事件不等式的等价变换推导如下:,(3)正态变量分布函数的计算,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,90,区间事件概率计算公式:,(4)正态变量区间事件的概率计算,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,91,对称事件概率计算公式,(5)正态变量对称事件的概率计算,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,92,对立事件概率计算公式:,(6)正态变量对立事件的概率计算,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,93,示例:设ZN(0,1),试计算:P(Z1.38)P(|Z|3),(7)标准正态变量的事件概率计算,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,94,利用分布函数定义和对称事件概率计算,(7)标准正态变量的事件概率计算,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,95,利用对立事件概率、分布函数定义计算,(7)标准正态变量的事件概率计算,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,96,(7)标准正态变量的事件概率计算,绝对不等式展开区间事件概率分布函数定义对称事件概率,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,97,三个特殊区间事件及其概率在实际中很有用,应当熟记,(7)标准正态变量的事件概率计算,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,98,示例:设XN(3,9),试计算P(X7.14)P(|X-3|6),(8)一般正态变量的事件概率计算,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,99,(8)一般正态变量的事件概率计算,分布函数定义标准化变换对称事件概率,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,100,利用标准正态分布计算,(8)一般正态变量的事件概率计算,对立事件概率分布函数定义标准化变换,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,101,利用标准正态计算,(8)一般正态变量的事件概率计算,不等式变换标准化变换区间事件概率对称事件概率,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,102,利用标准正态分布计算,(8)一般正态变量的事件概率计算,对立事件概率不等式变换标准化变换区间事件概率对称事件概率,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,103,(9)计算X落入k区间的概率,示例:,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,104,利用标准化变换、区间事件概率、标准正态分布函数和对称事件概率推导算式,1.2.3 正态分布的概率计算,(9)计算X落入k区间的概率,2023/6/3,王玉顺:数理统计01_概率分布,105,1.2.3 正态分布的概率计算,(9)计算X落入k区间的概率,2023/6/3,王玉顺:数理统计01_概率分布,106,1.2.3 正态分布的概率计算,(9)计算X落入k区间的概率,2023/6/3,王玉顺:数理统计01_概率分布,107,1.2.3 正态分布的概率计算,(9)计算X落入k区间的概率,2023/6/3,王玉顺:数理统计01_概率分布,108,三个特殊区间事件及其概率在实际中很有用,应当熟记,1.2.3 正态分布的概率计算,(9)计算X落入k区间的概率,2023/6/3,王玉顺:数理统计01_概率分布,109,(10)概率0.95和0.99对应的中心区间,示例:,1.2.3 正态分布的概率计算,2023/6/3,王玉顺:数理统计01_概率分布,110,1.2.3 正态分布的概率计算,(10)概率0.95和0.99对应的中心区间,2023/6/3,王玉顺:数理统计01_概率分布,111,1.2.3 正态分布的概率计算,(10)概率0.95和0.99对应的中心区间,2023/6/3,王玉顺:数理统计01_概率分布,112,二组特殊数据在实际中很有用,应当熟记。,一般正态分布概率0.95对应1.96区间概率0.99对应2.58区间,1.2.3 正态分布的概率计算,(10)概率0.95和0.99对应的中心区间,2023/6/3,王玉顺:数理统计01_概率分布,113,标准正态分布概率0.95对应01.96区间概率0.99对应02.58区间,二组特殊数据在实际中很有用,应当熟记。,1.2.3 正态分布的概率计算,(10)概率0.95和0.99对应的中心区间,2023/6/3,王玉顺:数理统计01_概率分布,114,1.3 数字特征Digital Characteristic,1 概率分布,2023/6/3,王玉顺:数理统计01_概率分布,115,随机变量的概率密度曲线可用中心、众数、分散、偏倚、峰凸、关联等特征描述,一个特征用一个数值表达就称作随机变量的数字特征(digital characteristic)。数字特征描述了随机变量观察值分布的集中位置、散布状况和偏倚程度等。数字特征由观察值和概率密度为元素构造,最重要的两个数字特征是期望和方差。,什么是数字特征?,1.3 随机变量的数字特征,2023/6/3,王玉顺:数理统计01_