《医学统计》PPT课件.ppt
《《医学统计》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《医学统计》PPT课件.ppt(129页珍藏版)》请在三一办公上搜索。
1、医学统计学(3),季聪华,概率分布参数估计与假设检验EPIDATA数据管理软件,概率分布第一节 正态分布第二节 二项分布和Poisson分布第三节 抽样分布,第一节 正态分布,正态分布是生物医学和统计学上极其重要的一种分布,医学研究的很多指标都服从或近似服从正态分布。在统计学上,很多分布都是由正态分布导出,同时正态分布又是多种分布的极限分布。,一、正态分布的概念,正态分布(normal distribution):是描述连续型随机变量最重要的分布。其分布曲线叫正态分布曲线,呈中间高,两边低,左右基本对称的“钟型”曲线,又称高斯分布(Gauss distribution)。,正态分布由德国数学家
2、 Gauss 在描述误差分布时所发现,并加以推广,所以通常称为高斯分布(Gauss distribution)。,高 斯,10马克的钱币,正态分布的公式,和是正态分布的两个参数,和决定了x的概率分布;习惯上用 N(,2)表示均数为,标准差为的正态分布。,二、正态分布的特征,(1)集中性:正态分布是一条单峰分布,高峰位置在均数处。(2)对称性:正态分布以均数为中心,左右完全对称。(3)正态分布曲线的形态取决于两个参数,即总体均数和总体标准差。(4)正态分布曲线下的面积分布具有一定的规律性。,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动,所以叫正态曲线N(,2)的位
3、置参数,。,1.位置参数:,正态分布位置随参数变换示意图,2.形状参数:,正态分布形态随参数变换示意图,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭,叫正态曲线N(,2)的形状参数。,三、正态分布面积分布规律,(1)正态分布曲线与横轴所夹面积为1。(2)区间在(-,+)内的面积或概率为0.683,此区间之外概率为0.317,左右两侧各0.1585。(3)区间在(-1.96,+1.96)内的面积或概率为0.95,此区间之外概率为0.05,左右两侧各0.025。(4)区间在(-2.58,+2.58)内的面积或概率为0.99,此区间之外概率为0.01,左右两侧各0.005。,正态分布应用于以下
4、3 个方面:1.制定医学参考值范围2.质量控制3.统计方法的理论基础,四、正态分布的应用,1.制定医学参考值范围,参考值范围(reference range):指所谓“正常人”的解剖、生理、生化等指标的波动范围。,制定方法:制定参考值范围时,首先要确定一批样本含量足够大的“正常人”。测量样本人群相应指标的值,测量的过程中要严格控制各种误差。而后根据指标的实际用途确定单侧或双侧界值,根据研究目的和使用要求选定适当的百分界值,常用95%。,单侧临界值:标准正态分布单侧尾部面积等于时所对应的正侧变量值,记作Z。,双侧临界值:标准正态分布双侧尾部面积之和等于时所对应的正侧变量值,记作Z/2。,以不同的
5、方法计算参考值范围:,举例1:调查某地120名健康女性血红蛋白,直方图显示其分布近似正态,均数 X=117.4,标准差S=10.2,试估计该地 健康女性血红蛋白的95%参考值范围。,解析:,1.分布近似正态,2.过高过低均为异常,3.求上、下界值,上界:,下界:,所以,该地健康女性血红蛋白的95%参考值范围是(97.41,137.39)g/l。,举例2:某地调查120名健康成年男性的第一秒肺通气量得均数 X=4.2(L),标准差S=0.7(L),试据此估计其第一秒肺通气量的95%参考值范围。,解析:,1.分布近似正态,2.仅过低为异常,3.求下界值,下界:,所以,该地健康成年男子第一秒肺通气量
6、的95%参考值范围为不低于3.05(L)。,2.质量控制,基本原理:许多临床检验指标,当影响某一指标的随机因素很多,而每个因素所起的作用均不太大时,这个指标的随机波动属于随机误差,则往往服从正态分布。,质量控制领域的“3原则”:其意义是指正常情况下检测误差服从正态分布,根据正态分布的曲线面积或概率分布理论可知,3之外的观察值出现的概率不到3,如果超过这一值,则提示测量或产品质量有问题。统计学规定:以x为中心线,x2S 为警戒线,x3S为控制线,根据以上的规定还可以绘制出质量控制图。,中心线,警戒线,控制线,控制线,警戒线,3.统计方法的理论基础 t 分布、F 分布、x2分布都是在正态分布的基础
7、上推导出来的,u 检验也是以正态分布为基础的。二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。,第二节 二项分布和Poisson分布,变量类型为二分类时,变量均现为两个对立的可能结果,每个个体的观察结果只能取其中之一,这类变量需按二项分布(binomial distribution)规律进行统计分析。,毒性试验:白鼠 死亡生存临床试验:病人 治愈未愈临床化验:血清 阳性阴性事件 成功(A)失败(非A)这类“成功失败型”试验称为Bernoulli试验。,一、二项分布,(一)二项分布的概念,【例3-1】临床上用针灸治疗某型头痛,有效率为60%,现以该法治疗3例
8、,其中2例有效的概率是多大?,有效的概率是0.6 无效的概率是0.4 3人接受针灸治疗后的有效和无效的所有可能组合,就排列方式而言有8 种;如只计算有效或无效的数目而不考虑其顺序时,则只有 4 种组合。又由于结果是独立的,病例间互不影响,则根据概率的乘法法则可以计算各种排列的连乘概率,再根据概率的加法法则,可以算出无效数或有效数分别为0、1、2、3 时的概率。,SPSS计算,(二)二项分布的特征,【例3-2】大样本研究显示,某中药制剂不良反应发生率为5%,现随机抽取5人服用此药,试求:其中m个人(m=0、1、2、3、4、5)有反应的概率。至多有2人有反应的概率。有人有反应的概率。,至多有2人反
9、应的概率:P(X2)=P(0)+P(1)+P(2)有人反应的概率:P(X1)=1-P(0),SPSS计算,PDF.BINOM(m,5,0.05),总体发生率,抽样人数,发生数,PDF.BINOM(quant,n,prob)。数值。返回当每次试验的成功概率是prob 时,n次试验中的成功次数将等于quant的概率。当n为1时,这等同于 PDF.BERNOULLI。,CDF.BINOM(m,5,0.05),总体发生率,抽样人数,发生数,CDF.BINOM(quant,n,prob)。数值。返回n次试验(每次成功的概率为prob)中成功次数将小于等于quant的累积概率。当n为1时,这等同于 CDF
10、.BERNOULLI。,3、二项分布的图形和正态近似,(1)二项分布的图形:如果已知n和,则按二项分布概率公式可计算出不同的X取值时的概率,我们可以用X为横轴,取值概率 P为纵轴,可绘制出二项分布的图形。不难发现,二项分布的图形是一个离散型分布,其形状决定于两个参数n和,当为0.5时,图形对称;当不等于0.5时,图形呈偏态,但当样本量增大时,图形逐渐趋于对称。,SPSS演示二项分布图概念,(2)二项分布的正态近似:根据统计学上的中心极限定理,当n较大,且n与n(1-)较接近时,二项分布将接近于正态分布。当n趋向无穷大时,二项分布B(n,)的极限分布就是正态分布Nn,n(1-)。一般地说,如果n
11、与n(1-)大于5时,即可用正态分布近似原理处理二项分布问题,以简化计算。,(三)二项分布的应用,在应用二项分布时,必须注意其应用条件:(1)二项分布中的观察单位数通常是事先确定的。(2)各观察单位只有互相对立的两种结果,如成功与失败、生存和死亡等。(3)若两种对立结果中的一种结果(阳性)的概率为,则其对立结果的概率为1-。实际工作中总体概率往往是未知的,但可以从大量观察中获得的比较稳定的样本频率作为总体概率的估计值。(4)n个观察单位的观察结果相互独立。即观察单位之间发现的结果不能互相影响,如要求疾病无传染性、无家族聚集性。,【例 3-3】大样本调查显示,新生儿畸形发生率为1%,现随机调查某
12、地 500 名新生儿,其中只有1例发生畸形,问该地新生儿畸形发生率是否低于一般。,首先计算500名新生儿发生1例畸形的概率 P(X1)=P(0)+P(1)=0.0398说明当地至多发生1例畸形的概率是0.0398,小于0.05,是小概率事件。所以可以认为当地新生儿畸形发生率不等于1%。互相之间的高与低,通过1/500=0.0020.01得出比较结论。,SPSS计算,二、Poisson 分布,(一)Poisson分布的概念当二项分布中n很大,p很小时,二项分布就变成为Poisson分布,所以Poisson分布实际上是二项分布的极限分布。,Poisson 分布为稀有(罕见)事件概率分布,主要用于生
13、物医药研究中描述单位时间、单位空间上某事件的发生数。如每毫升水中大肠杆菌的发生数,新生儿出生缺陷、多胞胎、染色体变异发生数等,与二项分布的区别在于发生数很低,而样本数又很大时,这时用 Poisson 分布来计算概率能简化计算。Poisson分布主要用于描述在单位时间(空间)中稀有事件的发生数。,(二)Poisson分布的特征,1.Poisson分布的均数与标准差 Poisson 分布的总体均数即为单位时间(或单位面积、空间)内某随机事件的平均发生数,可以用来表示,值得注意的是 Poisson 分布的标准差为,也就是说总体均数和总体方差是相等的,=2。,2.Poisson分布的图形和正态近似 因
14、为 Poisson 分布只有一个参数,如果已知总体均数,就可以计算出 Poisson 分布的概率分布值,我们可以用X为横轴,取值概率 P为纵轴,可绘制出 Poisson分布的图形。,(三)Poisson 分布的应用,由于 Poisson分布是二项分布的极限分布,因此二项分布的应用条件也是 Poisson分布的应用条件。值得注意的是,Poisson 分布的适用场合还要求观察单位数 n 很大,且事件发生的概率很小,特别是罕见事件,如某些发病率极低的疾病。,本例中:n=500,=0.01,=n=500*0.01=5计算实际发生1例与总体均数5例相等的概率是多少?,【例 3-3】大样本调查显示,新生儿
15、畸形发生率为1%,现随机调查某地 500 名新生儿,其中只有1例发生畸形,问该地新生儿畸形发生率是否低于一般。,SPSS计算,CDF.POISSON(quant,mean)。数值。返回泊松分布(指定了均值或比率参数)中的值将小于等于quant的累积概率。,第三节 抽样分布,是样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值及出现的概率分布 样本统计量(样本均值,样本比例,样本方差等)是随机变量,它有若干可能取值,每个可能取值都有一定的可能性(即概率),从而形成它的概率分布,即统计上所谓的抽样分布。,抽样分布反映了样本指标的分布特征,是抽样推断的重要依据。
16、根据样本分布的规律,可揭示样本指标与总体指标之间的关系,估计抽样误差,并说明抽样推断的可靠程度。,样本均值,样本比例,样本方差,分布未知大样本,正态总体方差已知,正态总体方差未知小样本,大样本,正态分布,t分布,2分布,样本统计量,参数估计与假设检验,统计推断(statistical inference)是根据样本提供的信息,以一定的概率对总体的分布及其特征作出推断。它包括两个重要的方面:一是参数佑计,二是假设检验。参数估计(pararneter estimation)是指由样本统计量估计总体参数;假设检验(hypothesis testing)是指对所估计的总体首先提出某种假设,然后根据随机
17、样本信息及抽样误差理论,应用小概率反证法逻辑思维推断某种假设可被接受或拒绝的统计检验方法。,估计,参数估计,假设检验,第一节 参数估计,一、抽样误差与标准误总体是根据研究目的确定的同质研究对象的全体,分为无限总体和有限总体。在医学研究中,无论是无限总体还是有限总体,由于受到人力、财力、物力、时间或其他条件的限制,不可能对总体中的每一个个体都进行研究,只能抽取部分有代表性的个体(即样本)进行研究,进而由样本信息来推断总体特征。,population,sample2,sample1,sample3,sample4,sample5,这种由随机抽样造成的样本统计量与总体参数之间或各样本统计量之间的差异
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学统计 医学 统计 PPT 课件

链接地址:https://www.31ppt.com/p-5474476.html