二项分布与泊松分布.ppt
《二项分布与泊松分布.ppt》由会员分享,可在线阅读,更多相关《二项分布与泊松分布.ppt(60页珍藏版)》请在三一办公上搜索。
1、常用离散型变量概率分布及应用,二项分布和泊松分布张合喜 公共卫生学院,第一节 二项分布和总体率的估计,一、二项分布(一)二项分布的概念 在生命科学研究中,经常会遇到一些事物,其结果可分为两个彼此对立的类型,如一个病人的死亡与存活、动物的雌与雄、微生物培养的阳性与阴性等,这些都可以根据某种性状的出现与否而分为非此即彼的对立事件。这种非此即彼事件构成的总体,就称为二项总体(binomial population)。,第一节 二项分布和总体率的估计,二项分布(binomial distribution)就是对这种只具有两种互斥结果的离散型随机变量的规律性进行描述的一种概率分布。由于这一种分布规律是由
2、瑞士学者贝努里(Bernoulli)首先发现的,又称贝努里分布。,二项分布有两个基本假设:1.各事件是相互独立的,即任一事件的发生与否,不影响其它事件的发生概率;2.各个随机事件只能产生相互排斥的两种结果。,定理:几个相互独立事件同时发生的概率等于各独立事件的概率之积。,定理:在几个互不相容的事件中,任一事件发生的概率等于这几个事件的概率之和。,抓中两黑一白的概率:P(2)=30.125=0.375,抓中三个黑球的概率:P(3)=0.50.50.5=0.125,各种可能发生的结果对应的概率相当于展开后的各项数值,即:前例:=0.8,1-=0.2,n=3,二项分布的概率公式,如果一个事件A,在n
3、次独立试验中,每次试验都具有概率,那么,这一事件A将在n次试验中出现x次的概率为:式中:称二项系数。,(二)二项分布的应用条件,1.各观察单位只能具有互相对立的一种结果,属于二项分类资料;2.已知发生某一结果的概率为,其对立结果的概率则为1-。实际工作中要求是从大量观察中获得的比较稳定的数值;3.n个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观察单位的结果。,(三)二项分布的性质,1.二项分布的均数和 标准差 二项分布的平均数:=n 上式的意义:做n次独立试验,某事件平均出现的次数为n次,这一结果较为符合人们的直观想法。如果,生男孩这一事件的概率是1/2,则100个新生
4、儿中可期望有n=1001/2=50个是男孩。当用率表示时,,(三)二项分布的性质,二项分布的标准差:标准差表示x取值的离散度或变异的大小。如n=5,=5/6,1-=1-5/6,则:,(三)二项分布的性质,二项分布的标准误 若以比值或百分数表示,则标准误为:p被称为率的标准误(standard error of rate),用来反映随机抽样获得的样本率p与总体之间的抽样误差大小。,(三)二项分布的性质,二项分布的标准误 若以比值或百分数表示,则标准误为:实际工作中常用p作为 的估计值,得:,(三)二项分布的性质,2.二项分布的累计概率常用的有左侧累计和右侧累计2种方法。从阳性率为 的总体中随机抽
5、取n个个体,则(1)最多有k例阳性的概率P(xk)=P(0)+P(1)+P(k)(2)最少有k例阳性的概率P(xk)=P(k)+P(k+1)+P(n)=1-P(xk-1),(三)二项分布的性质,3.二项分布的图形 二项分布的图形,取决于两个方面,其一为事件发生的概率,其二为样本含量n。当=1-=1/2时,二项分布的图形是对称的;当 1/2时,二项分布的图形呈右偏态;当与1-不变时,即使 1-,但随着n的增大,二项分布的的偏态程度会逐渐降低而趋于对称。,二项分布总体不同样本例数时的抽样分布,二、二项分布的应用,(一)、总体率的估计 有点值估计和区间估计。1 查表法:当n较小,如n50时,特别是p
6、很接近于0或1时,可由附表6百分率的置信区间表直接查出。P709 or p817例:某地对13名输卵管结扎的育龄妇女经壶腹部吻合术后,观察其受孕情况,发现有6人受孕,据此估计该吻合术妇女的受孕的95%可信区间 此例:n=13,x=6 查表得95%CI为:19%75%。,二、二项分布的应用,(一)、总体率的估计 1 查表法:附表6百分率的置信区间表直接列出了Xn/2的部分。其余部分可以查n-x的阴性部分的QLQU再相减得PLand pU PL=1-QL 1-QU例:某地调查50名儿童蛔虫感染情况,发现有10人大便中有蛔虫卵,问儿童蛔虫感染率的95%置信区间是多少?此例:n=50,x=10 查表得
7、95%CI为:10%34%。,二项分布的应用,2 正态近似法:应用条件:np及n(1p)均5pusp 例:在某地随机抽取329人,做HBsAg检验,得阳性率为8.81%,求阳性率95%置信区间。已知:p=8.81%,n=329,故:95%CI:8.811.961.56;即5.75%11.87%。,二项分布,下表是用PUasp时要求的P值与N的大小参考数字。P n nP 0.5 30 15 0.4 50 20 0.3 80 24 0.2 200 40 0.1 600 60 0.05 1400 70,二项分布的应用,(二)差异的显著性检验1 直接法例 某医院用甲药治疗某病,其治愈率为70%,今用乙
8、药治疗该病10人,治愈9人,问甲乙两药疗效有无差别?已知:=0.7,1-=0.3,假设两药疗效无差别,则治愈与非治愈的概率应符合二项分布,即:,如果甲乙两药疗效无差别,按甲药的治愈率(70%)用乙药治疗10人应治愈7人,实际治愈9人,相差2人。双侧检验,计算相差2人及2人以上的总概率,即x9和x5的概率之和:P=0.000006+0.000138+0.001447+0.009002+0.036757+0.102919+0.121061+0.028248=0.299577或:P=1-(0.200121+0.266828+0.233474)=0.299577,P=0.2995770.05,差异无统
9、计学意义,尚不能认为乙药疗效优于甲药。本例如采用单侧检验,即要求判断乙药疗效优于甲药?此时只需计算相差2人及以上的总概率:P=P(9)+P(10)=0.121061+0.028248=0.149309P0.05,差异无统计学意义,尚不能认为乙药疗效优于甲药。,3.研究疾病的家族聚集性 例 某单位发生乙肝暴发流行,经调查4口之家共288户,其中无病例的167户,发生1例的51户,2例的50户,3例的17户,全家发病的3户,问乙肝的发病是否具有家族集聚性?=214/1152=0.1858,1-=0.8142 计算发病数x=0,1,2,3,4时的理论概率和理论户数。列表,比较实际户数与理论户数差别有
10、无显著性意义。,二项分布展开计算表,二项分布拟合优度的2检验,2=91.81,按=组数-2=5-2=3查2界值表得:20.01(3)=11.345,故P0.01,说明该疾病的家庭分布不符合二项分布,可以认为该病有家族集聚性。,(五)群检验,用于混合样本分析:常见于阳性率很低或检出率低的分析样本根据二项分布的原理:1份混合样本中含有k份阳性的概率为P(k)=,当k=0时P(0)是说混合样品中没有1阳性样品的原始概率,反映的是混合样品阴性的概率,(五)群检验,当收集的样本数量很大时,全部检验费时费力可以用群检验的方法进行解决,若每个标本的阳性概率为,则其阴性概率为Q=1-Qm便是某个群m个标本均为
11、阴性的概率,一个群为阴性的群的概率,而1-Qm就为一个群阳性的概率。假设受检的n个群中有X个阳性群,用x/n作为阳性群概率的估计值,(五)群检验,1-Qm=X/n,从而Q=,P=1-Q,第四节 泊松分布(Poisson distribution),一、Poisson分布(一)泊松分布的概念泊松分布(旧译普哇松分布)是离散型随机变量的另一重要分布,最早由于1837年提出。定义:若离散型随机变量x的取值为非负整数,且相应的概率函数为:则称随机变量X服从泊松分布。,泊松分布(Poisson distribution),泊松分布的数学表达式:在n个取样单位内,出现X=0,1,2,n个阳性事件的理论概率
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 二项分布 分布
链接地址:https://www.31ppt.com/p-5684682.html