正态分布及其应用医本.ppt
第九章 数值变量资料的统计分析第二节 正态分布及其应用,温医环境公卫学院黄陈平,第二节 正态分布及其应用,一、正态分布的概念及特征 1.正态分布的图形 2.正态分布的特征 3.标准正态分布 4.正态分布曲线下面积分布规律二、正态分布的应用 1.估计变量值的频数分布 2.制定参考值范围 3.质量控制 4.统计处理方法的基础,小结,表9-1 某地140名正常成年男性血清尿素氮浓度(mmol/L),图9-1 140名健康成年男性血清尿素氮浓度频数分布图,1、正态分布的图形,频数,变量值,概率密度函数,正态分布的概率密度函数f(x)为:,由上式可见,正态分布的图形由 和 所决定,即N(,2),正态曲线下的面积F(x)的计算:,1)在横轴上方,均数处最高,为单峰分布2)以均数为中心,左右对称3)有两个参数,和 4)正态曲线下面积分布有一定规律,2、正态分布的特征,图9-5 不同、下正态分布概率密度函数的图形,正态分布的图形由 和 所决定,即N(,2)对上式进行 u 代换,即:,可使一般的正态分布转换为标准正态分布(u 分布),此时 N(0,1)。,3、标准正态分布,x,=0,=1,问题:为什么一般的正态分布要转换成标准正态分布?,表中曲线下面积为-u 的面积;即 P(u)P299,9-8,4、正态曲线下的面积分布规律,表9-6 正态分布和标准正态分布曲线下面积分布规律,若n100,则可用 代替,用 s 代替。,图9-6 正态分布和标准正态分布的曲线下面积分布规律,-2.58-1.96-1 0+1+1.96+2.58 u,-2.58-1.96-1+1+1.96+2.58 x,95%,95%,正态曲线下某一区间的面积占总面积的百分数有何意义?即该区间的例数占总例数的百分数(频数分布),或观察值落在该区间的概率,或从此总体随机抽得该区间观察值的概率。,图9-6 正态分布和标准正态分布的曲线下面积分布规律,二、正态分布的应用,(一)估计变量值的频数分布(二)制定参考值范围(三)质量控制(四)统计处理方法的基础,例 某地用随机抽样方法检查了140名成年男子的红细胞数(1012/L),检测结果如下表:,(一)估计变量值的频数分布,若上例均数为4.78(1012/L),标准差为0.38(1012/L),问低于41012/L的人占总人数的比例有多少?,P299 表9-8 标准正态分布曲线下的面积,注意 P(u),例:对使用过甘草的许多重要处方进行分析,若已知每次的甘草用量X(单位:克)服从正态分布,=8,=2。现任抽一张含甘草的处方,求甘草的用量在510克范围内的概率。,P=P(u2)P(u1)=P(1)P(-1.5)=0.7745,(二)参考值范围的估计,参考值的意义制定参考值范围的基本步骤参考值范围的估计方法,1.参考值的意义,医学参考值(medical reference value)指绝大多数正常人的生理、生化指标常数,也称正常值。由于存在个体差异,正常人某项指标测定值并非常数而是在一定范围内波动,故采用参考值范围作为判断某项指标是否正常的依据。,1)随机抽得足够数量(n100)符合条件的观察对象;2)控制测量误差;3)合理合并或分组;4)确定单侧或双侧 白细胞计数?肺活量?血铅浓度?5)选定适当的百分界限;如80%、90%、95%和99%,常用为95%。6)选定适当的计算方法。,2.制定参考值范围的基本步骤,3.参考值范围的估计方法,1、正态分布法 若取95%界限,双侧:X 1.96S 单侧:若高不正常,则 X-1.645S 2、百分位数法 若取95%界限,双侧:P2.5 P97.5 单侧:若高不正常,则 P5,表9-1 某地140名正常成年男性血清尿素氮浓度(mmol/L),例9-1 求双侧95%的参考值范围。,参考值范围应用时注意:,人数,上限值(95%),Normal,Patient,假阴性,假阳性,(三)质量控制 实验中的检测误差一般服从正态分布,为了控制实验中的检测误差,常以 作为上、下警戒值,以 作为上、下控制值。(四)正态分布是很多统计方法的基础 多种统计方法均要求分析的指标服从正态分布或近似正态分布。对于非正态分布资料,应先作变量转换,使转换后的资料服从或近似服从正态分布,然后就可按正态分布的方法进行统计处理。,课堂总结提问,正态分布有何特征?何谓标准正态分布?有何意义?简述正态分布曲线下面积规律。简述参考值范围指定的步骤和方法。,问:(1)理论上95%男孩出生体重在什么范围?(2)某男孩出生体重为4.51kg,如何评价?,(1)(2.43,4.14)(2)超重,某市1974年为了解该地居民发汞的基础水平,随机抽样检测该地无汞作业接触史的健康居民238人的发汞含量如下:,如何制定该地健康居民的发汞参考值范围?如在以后工作中测得某人发汞值为17.8mol/kg,如何判断?,12.5 mol/kg不正常,THE END,表9-1 2002年某市150名正常成年男子的尿酸浓度(mol/L),2002年某市正常成年男子尿酸浓度的频数表,0,5,10,15,20,25,30,尿酸浓度(mol/L),频数(人),图9-1 2002年某市20岁-29岁正常成年男子的尿酸浓度的频数分布,270,300,330,360,390,420,对于连续型随机变量,设 为任意实数,且,若 存在,则称它为 在点 的概率密度,记为,即,概率密度的定义,简单来说,就是在x附近增加单位随机变量的概率增加值。,THE END,