12第十五章普哇松分布.ppt
第一节概述,普哇松分布(Poisson distribution),Poisson分布为二项分布的特例。例如,某些现象的发生率甚小,而样本含量n趋向于无穷大时,则二项分布逼近于Poisson分布。Poisson分布多专用于研究单位容积(或面积、时间等)内某事件的发生数,即分母(n)甚大时,罕见事件的发生数。例如,单位体积水样中大肠杆菌数、单位空间中某些野生动物或昆虫数的分布、单位时间内放射性物质放射出的质点数的分布、单位人群中某些患病率很低的非传染性疾病患病数或死亡数等。单位容积(或面积、时间等)内某事件发生数为x的概率为:P(x)=(e-x)/x!(x=0,1,2,n),Poisson分布的概率密度函数,试验的次数n很大时,在每一观察单位内出现成功次数X(X=0,1,2,.,)的概率:,式中:e是自然对数的底,e2.71828;是大于0的常数,称为Poisson分布的参数。,Poisson分布的递推公式,由二项分布的计算公式可以发现,当 很大时,二项分布概 率的计算相当复杂。利用二项分布 的 Poisson 近似这一性质,当 很大,且 很小时,可以利用Poisson分布的概率计算近似地替代二项分布的概率计算。,二项分布的Poisson近似,Poisson分布的特征,1、Poisson分布的方差等于均数,即2;2、Poisson分布的可加性。以较小的度量单位观察某一现象的发生数时如果它呈Poisson分布,那么把若干个小单位合并为一个大单位后,其计数亦呈Poisson分布。设x1,x2,,xn为n个相互独立的从均数分为1,2,,n的Poisson分布总体中随机抽取的样本计数,T=x1+x2+xn服从均数为1+2+n的Poisson分布。因此Poisson分布资料可利用可加性原理,使20,用正态近似法处理;3、Poisson分布属离散型分布。,Poisson分布的可加性,如果X1,X2,Xk相互独立,且它们分别服从以 为参数的 Poisson分布,则T=X1+X2+Xk也服从Poisson分布,其参数为。举例:设某放射性物质平均每分钟放射计数为 5。现考虑测3个1分钟的放射计数,分别记为X1,X2,X3。则 XiP(5),i=1,2,3。据Poisson分布的可加性可得X1+X2+X3P(15)。,第二节二项分布的要求,满足Poisson分布的三个条件,1、平稳性:X的取值与观察单位的位置无关,只与观察单位的大小有关。2、独立增量性(无后效性):在某个观察单位上X的取值与前面各观察单位上X的取值独立(无关)。3、普通性:在充分小的观察单位上X的取值最多为1。,第三节 Poisson分布的形态,Poisson分布的图形,在Poisson分布中,已知,即可计算出随机变量x=0,1,2,n时的p(x)值,以x为横坐标,p(x)为纵坐标,在直角坐标纸上作图,可以绘制出Poisson分布的图形。可见,由于p(x)是根据计算出来的,故Poisson分布的形状取决于的大小,值愈小,分布愈偏。随着的增大,分布趋于对称,当=20时,分布接近正态分布。=50时,可以认为Poisson分布呈正态分布。,第四节 Poisson分布在医学上的应用,Poisson分布的应用,一、Poisson分布总体均数(总体计数)的可信区间;二、Poisson分布样本均数与总体均数(样本计数与总体计数)的比较;三、Poisson分布两个样本均数(两个样本计数)的比较;四、Poisson分布多个样本均数(多个样本计数)的比较;五、Poisson分布对聚集性的研究。,一、Poisson分布总体均数(总体计数)的可信区间,1、查表法、适用条件:样本均数(样本计数)x50;、方法:以样本计数x查表“普哇松分布用上下可信区间”,可得总体均数的95%或99%可信区间。2、正态近似法、适用条件:样本均数(样本计数)x50、方法:总体均数95%可信区间:x1.96x 总体均数99%可信区间:x2.58x,1查表法 Poisson分布总体均数的可信区间可以根据Poisson分布的理论计算而得,但计算较复杂,为方便使用,统计学家编制了据样本计数X查Poisson分布总体均数 的95%和99%可信区间的表格(附表7)。当X50时,可以很方便地从附表7查得总体均数的95%或99%可信区间。,2正态近似法 当样本计数X50时,附表7上查不到相应的可信区间,但此时可利用Poisson分布的正态近似性,计算其总体均数()可信区间如下:式中:X 为样本计数;为标准正态分布 水平双侧临界值。,二、Poisson分布样本均数与总体均数(样本计数与总体计数)的比较,1、直接计算概率法适用条件:总体均数20;方法:计算Poisson分布的概率和累 计概率。2、正态近似法(u检验)适用条件:总体均数20;方法:u=x-0/0,三、Poisson分布两个样本均数(两个样本计数)的比较,1、u检验、两样本观察单位(时间、面积、容积等)相同、两样本观察单位(时间、面积、容积等)不相同 2、校正u检验3、2检验,Poisson分布两个样本均数(两个样本计数)的比较(u检验),适用条件:总体均数的估计值(即两样本均 数)均大于20。、两样本观察单位(时间、面积、容积等)相同 u=x1-x2/x1+x2=x1-x2/x1+x2(式中x1和x2分别为两样本均数,x1和x2 分别为两合并样本的均数)、两样本观察单位(时间、面积、容积等)不同 u=x1-x2/x1/n1+x2/n2(式中n1和n2分别为两样本例数,即两样本观察 单位数),两个样本均数的比较,1、两个样本的观察单位数相等(n1=n2)时2、两个样本的观察单位数不等(n1n2)时,Poisson分布两个样本均数(两个样本计数)的比较(校正u检验),适用条件:总体均数的估计值(即两样本均数)在520之间。公式:,Poisson分布两个样本均数(两个样本计数)的比较(2检验),适用条件:两样本观察单位不同,且总体均数的估计值较小。计算步骤:1、计算的估计值 2、将x1、x2分别转换为z1、z2 3、计算x2值,四、Poisson分布多个样本均数(多个样本计数)的比较(2检验),计算步骤:1、计算的估计值 2、将各xi值转换为zi值 3、计算x2值,五、Poisson分布对聚集性的研究,利用Poisson分布的均数与方差相等的特点,可以检验样本中各计数x1,x2,xn是否来自于同一个Poisson分布总体的随机样本。,应用Poisson分布应注意的问题,1、Poisson分布的x虽为样本计数,由于观察的单位(时间、面积、容积等)是固定的,可看成n=1,故有均数的含义。按照Poisson分布的特征2,而标准误n,当n=1时,标准差与标准误相等。样本标准误的平方等于均数x,当观察单位不同时,标准误x/n;2、若利用正态分布法时,要满足20的条件。为此,可利用Poisson分布的可加性,把若干个观察单位合并;3、两均数比较时,要注意观察单位(时间、面积、容积、人口基数等)是否相同。若不相同,须化为相同的观察单位后再作比较,且只能将大单位化为小单位,不能将小单位化为大单位。例如不能将人口基数不足10万人口查得的结果,按比例把基数扩大为10万。再者,以10万人口为观察单位,两样本均数差别有显著性,不等于以1万人口为观察单位,差别也有显著性。,二项分布 Poisson分布:总体率 n:总体中一定计量基本符号 n:样本例数 单位内发生某 X:某类事件发生数 事件的总均数 p=X/n:样本率 X或X:样本均数恰有X 例阳性的概率 最多有k例累积概率 至少有k例正态近似条件 n 与n(1)均大于5 20 均数 u=n u=n(率)=n=2标准差 可信区间估计n 50 查表 查表正态近似 puSp 样本率(均数)与总体 算出p(xk)或P(Xk)与比较 率(均数)比较(单侧)正态近似(单、双侧)两样本率(均数)比较(正态近似),小 结,