概率论及数理统计概率分布.ppt
《概率论及数理统计概率分布.ppt》由会员分享,可在线阅读,更多相关《概率论及数理统计概率分布.ppt(71页珍藏版)》请在三一办公上搜索。
1、2023/5/21,1,第二章 概率分布,2023/5/21,2,引 言,由于存在个体差异,即使从同一总体中抽取的两份样本之间也会有所不同,因此需要对总体特征做出描述。随机变量的分布常见的有三种类型:,正态分布(normal distribution)二项分布(binominal distribution)Poisson 分布(Poisson distribution),离散型变量,连续型变量,2023/5/21,3,了解正态分布的密度函数二项分布的应用 Poisson分布的应用,掌握正态分布曲线的特征及应用二项分布的概念与特征Poisson分布的概念与特征,【教学目的】,2023/5/21,
2、4,概念频率密度图的绘制例:随机调查某医院1402例待分娩孕妇,测得她们的体重。体重在各组段的频数分布见表1第2列,并求得体重落在各组段的频率(表1的第3列)。现以体重测量值为横轴,以频率与组距的比值为纵轴作出直方图。由于该直方图的纵轴表示在每个组段内单位长所占有的频率,相当于频率密度,因此我们将此图称为频率密度图(见图1)。,一、正态分布,2023/5/21,5,表1 某医院1402例分娩孕妇体重频数分布,图1 体重频率密度图,2023/5/21,7,若将各直条顶端的中点顺次连接起来,得到一条折线。当样本量n越来越大时,组段越分越细,此时直方渐进直条,这条折线就越来越接近于一条光滑的曲线(见
3、图1、2),我们把这条呈中间高,两边低,左右基本对称的“钟型”曲线称为正态分布曲线,近似于数学上的正态分布(高斯分布;Gauss)。,2023/5/21,8,图1 体重频率密度图,图2 概率密度曲线示意图,2023/5/21,9,正态分布的密度函数,式中,m为总体均数,s为总体标准差,p为圆周率,e为自然对数的底,仅x为变量。当x确定后,f(x)为X相应的纵坐标高度,则X服从参数为和2的正态分布(normal distribution),记作XN(m,s2)。,2023/5/21,10,一般地,若连续型随机变量,设其概率密度函数为,则X取值落在区间 内的累积概率为概率密度曲线下位于 的图形面积
4、,等于其概率密度函数 在 到x上的积分,记作。,称 为正态分布 的概率密度函数。其值表示变量落在区间 的概率,对应于从-到x概率密度曲线下的阴影的面积(常称为左侧尾部面积),见图3。,2023/5/21,12,图3 正态分布的概率密度函数,2023/5/21,13,于是,利用概率密度函数 可以计算正态分布变量取值在任意区间(a,b)的概率为,P(aXb)=,2023/5/21,14,2023/5/21,15,2.正态分布的特征,对称性:正态分布为单峰、对称分布,以均数为中心,左右对称。正态分布的图形由均数和标准差两个参数决定。位置参数m,即集中趋势的位置;变异度参数s,表示正态变量取值的离中程
5、度。概率密度函数f(x)在x取均值时达到最大,峰值为随机变量X的取值从-到+,相应的概率密度函数对应的曲线位于x轴上方,并与X轴永不相交;,2023/5/21,16,图4 正态分布位置变换示意图,2023/5/21,17,图5 正态分布形态变换示意图,2023/5/21,18,正态分布曲线下的面积分布有一定规律:正态曲线与横轴所夹的面积为1。位于 内的面积为0.90;位于 内的面积为0.95;位于 内的面积为0.99。,2023/5/21,19,图6 正态分布曲线下面积分布规律示意图,2023/5/21,20,3.标准正态分布,为了实际应用的方便,设U=(x-m)/s或Z=(x-m)/s,即将
6、原点移到m的位置,横轴尺度以s为单位,使m=0,s=1,则将原正态分布变换为标准正态分布N(0,1)。U为标准正态变量或标准正态离差。,2023/5/21,21,正态分布,标准正态分布,2023/5/21,22,统计学家对不同的U值编制了标准正态分布曲线下面积表(见附表),这样一般正态分布N(m,s2)的概率计算问题借助于标准化变换,并通过查附表就完全解决了。,2023/5/21,23,标准正态分布的概率密度曲线与分布函数示意图,2023/5/21,24,标准正态分布曲线下面积规律,1.标准正态分布区间(-1,1)的面积占总面积的68.26%。2.标准正态分布区间(-1.96,1.96)的面积
7、占总面积的95%。3.标准正态分布区间(-2.58,2.58)的面积占总面积的99%。,2023/5/21,25,例:已知某地正常成年女子的血清总蛋白数服从正态分布,调查了该地110名正常成年女子,得样本血清总蛋白均数为72.8(g/L),标准差为3.8(g/L),试估计该地正常成年女子血清总蛋白介于66.075.0(g/L)之间的比例,以及110名正常成年女子中血清总蛋白介于66.075.0(g/L)之间的人数。,2023/5/21,26,解:本例由于是大样本,可用样本均数和样本标准差作为总体m、s的估计值,即将该地正常成年女子的血清总蛋白数近似看作服从N(72.8,3.82)的正态分布。作
8、如下标准化变换:,2023/5/21,27,查标准正态分布表得:,于是,2023/5/21,28,故估计该地区正常成年女子血清总蛋白介于66.075.0(g/L)之间的比例为68.23%。估计110名正常成年女子中血清总蛋白介于66.075.0(g/L)之间的人数约为 人。,2023/5/21,29,4.1 制定医学参考值范围 参考值范围(reference range)是指所谓“正常人”的解剖、生理、生化等指标的波动范围。制定参考值范围时,首先要确定一批样本含量足够大的“正常人”。所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群。其次需根据指标的实际用途确
9、定单侧或双侧界值,根据研究目的和使用要求选定适当的百分界值,常用95%。,4.正态分布的应用,2023/5/21,30,制定观察指标参考值范围的一般步骤:,依据观察指标的特点、背景和已知的影响因素,确定抽样的入选标准和排除标准;根据指标特点决定单侧或双侧;确定范围:一般为95%;按资料特点选取不同方法计算正常值范围的上下限。,2023/5/21,31,双侧临界值:标准正态分布双侧尾部面积之和等于时所对应的正侧变量值称为双侧临界值,记作Za/2或 Ua/2。,单侧临界值:标准正态分布单侧尾部面积等于时所对应的正侧变量值称为单侧临界值,记作Za或Ua。,2023/5/21,32,参考值范围的制定方
10、法:,(1)正态分布法 适用于正态或近似正态分布资料;双侧界值 单侧上界 单侧下界,2023/5/21,33,参考值范围的制定方法:,(2)百分位数法:特别适用于偏态分布资料以及资料中一端或两端无确切数值的资料。如95%参考值范围:双侧界值:P2.5和P97.5 单侧上界:P95 单侧下界:P5,2023/5/21,34,例:调查某地120名健康女性血红蛋白,直方图显示其分布近似正态分布,试估计该地健康女性血红蛋白的95%参考值范围。,2023/5/21,35,因血红蛋白过高、过低均为异常,所以按双侧估计95%医学参考值范围:上限为:下限为:,2023/5/21,36,注意:95%医学参考值范
11、围仅告诉我们某特定人群中,95%的个体该指标测定值在此范围内,并不能说明在此范围内都“正常”;也不能说明凡不在此范围内都“不正常”,因此医学参考值范围在临床上只能作为参考。,2023/5/21,37,表2常用参考值范围的制定,2023/5/21,38,计算某地正常女子血清总蛋白的95%参考值范围。由于该地正常成年女子血清总蛋白近似服从正态分布,可用正态分步法计算,因血清总蛋白过多过少均属异常,故计算95%参考值范围的上下限为:,2023/5/21,39,例:某地调查120名健康成年男性的第一秒肺通气量得均数=4.2(L),标准差S=0.7(L),试据此估计该地健康成年男子第一秒肺通气量的95%
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 论及 数理统计 分布
链接地址:https://www.31ppt.com/p-4876113.html