随机变量、概率和概率分布.ppt
统计学,湖北中医药大学预防医学教研室,1,医学统计学,基础医学院预防医学教研室(J-C202)Tel:027-68891232E-Mail:,魏沙 讲师,统计学,湖北中医药大学预防医学教研室,2,第四章随机变量、概率和概率分布,统计学,湖北中医药大学预防医学教研室,3,本章内容,第一节 概率的有关概念第二节 随机变量及其概率分布概述第三节 常用的概率分布 二项分布、泊松分布、正态分布 第四节 常用的抽样分布 卡方分布、t分布、F分布,统计学,湖北中医药大学预防医学教研室,4,第一节 概率的有关概念,统计学,湖北中医药大学预防医学教研室,5,样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f/n。概率:随机事件发生的可能性大小,用大写的P 表示;取值0,1。,一、频率与概率 frequency and probability,统计学,湖北中医药大学预防医学教研室,6,必然事件 P=1随机事件 0 P 1不可能事件 P=0 P 0.05(5)或P 0.01(1)称为小概率事件(习惯),统计学上认为不大可能发生。,二、随机事件 Random events,Certain,Impossible,0.5,0,1,样本空间(sampling space):随机试验的所有可能的结果称为样本空间。,统计学,湖北中医药大学预防医学教研室,7,频率与概率间的关系:1.样本频率总是围绕概率上下波动 2.样本含量n越大,波动幅度越小,频率越接近概率。,统计学,湖北中医药大学预防医学教研室,8,第二节 随机变量及其概率分布概述,统计学,湖北中医药大学预防医学教研室,9,一、随机变量,每次抛两个硬币,记录正、反面结果;结果可记录为:硬币1正面朝上,硬币2正面朝上;2个正面 硬币1正面朝上,硬币2反面朝上;1个正面 硬币1反面朝上,硬币2正面朝上;1个正面 硬币1反面朝上,硬币2反面朝上 0个正面 正面数就是一个随机变量,记为x,我们通常对x的每个取值的概率感兴趣。对于本例,x的取值为0、1、2。,统计学,湖北中医药大学预防医学教研室,10,二、离散型随机变量与连续型随机变量,离散型随机变量(discrete random variable):数据间有缝隙,其取值可以列举。例如抛硬币10次,正面的可能取值x为0、1、2、3、4、5、6、7、8、9、10 连续型随机变量(continous random variable)数据间无缝隙,其取值充满整个区间,无法一一列举每一可能值 例如身高、体重、血清胆固醇含量,统计学,湖北中医药大学预防医学教研室,11,三、概率分布(probability distribution),概率分布:描述随机变量值xi及这些值对应概率P(X=xi)的表格、公式或图形。,离散型随机变量概率分布连续型随机变量概率分布,统计学,湖北中医药大学预防医学教研室,12,1.离散型随机变量的概率分布,统计学,湖北中医药大学预防医学教研室,13,离散型随机变量的概率分布举例,统计学,湖北中医药大学预防医学教研室,14,2.连续型随机变量的概率分布,变量的取值充满整个数值区间,无法一一列出其每一个可能值。一般将连续型随机变量整理成频数表,对频数作直方图,直方图的每个矩形顶端连接的阶梯形曲线来描述连续型变量的频数分布。,统计学,湖北中医药大学预防医学教研室,15,统计学,湖北中医药大学预防医学教研室,16,如果样本量很大,组段很多,矩形顶端组成的阶梯型曲线可变成光滑的分布曲线。大多数情况下,可采用一个函数拟合这一光滑曲线。这种函数称为概率密度函数(probability density function),统计学,湖北中医药大学预防医学教研室,17,如果连续型随机变量X的概率密度函数记为:则在区间x1,x2 范围内的概率可由微积分函数定义,统计学,湖北中医药大学预防医学教研室,18,第三节 常用的概率分布离散型随机变量分布一、二项分布二、泊松分布连续型随机变量分布三、正态分布,统计学,湖北中医药大学预防医学教研室,19,一、二项分布,毒性试验:白鼠 死亡生存临床试验:病人 治愈未愈临床化验:血清 阳性阴性事件 成功(A)失败(非A)这类“成功失败型”试验称为Bernoulli试验。,统计学,湖北中医药大学预防医学教研室,20,Bernoulli试验序列,n次Bernoulli试验构成了Bernoulli试验序列。其特点(如抛硬币)如下:(1)每次试验结果,只能是两个互斥的结果之一(A或非A)。(2)每次试验的条件不变。即每次试验中,结果A发生的概率不变,均为。(3)各次试验独立。即一次试验出现什么样的结果与前面已出现的结果无关。,统计学,湖北中医药大学预防医学教研室,21,成功次数的概率分布二项分布,例 设某毒理试验采用白鼠共3只,它们有相同的死亡概率,相应不死亡概率为1。记试验后白鼠死亡的例数为X,分别求X0、1、2和3的概率,统计学,湖北中医药大学预防医学教研室,22,统计学,湖北中医药大学预防医学教研室,23,统计学,湖北中医药大学预防医学教研室,24,二项分布的概率计算,统计学,湖北中医药大学预防医学教研室,25,二项分布的性质,统计学,湖北中医药大学预防医学教研室,26,统计学,湖北中医药大学预防医学教研室,27,统计学,湖北中医药大学预防医学教研室,28,统计学,湖北中医药大学预防医学教研室,29,统计学,湖北中医药大学预防医学教研室,30,(二)样本率与总体率的比较,二项分布的应用,统计学,湖北中医药大学预防医学教研室,31,统计学,湖北中医药大学预防医学教研室,32,二、泊松分布,当二项分布中n很大,很小时,二项分布就变成为Poisson分布,所以Poisson分布实际上是二项分布的极限分布。由二项分布的概率函数可得到泊松分布的概率函数为:,统计学,湖北中医药大学预防医学教研室,33,在m处的概率最大,统计学,湖北中医药大学预防医学教研室,34,在m处的概率最大,统计学,湖北中医药大学预防医学教研室,35,Poisson分布主要用于描述在单位时间(空间)中稀有事件的发生数,例如:1.放射性物质在单位时间内的放射次数;2.在单位容积充分摇匀的水中的细菌数;3.野外单位空间中的某种昆虫数等。,统计学,湖北中医药大学预防医学教研室,36,Poisson分布概率的计算,统计学,湖北中医药大学预防医学教研室,37,Poisson分布的性质(1),一、Poisson分布的均数与方差相等 即2=m 二、Poisson分布的可加性,统计学,湖北中医药大学预防医学教研室,38,第五节 Poisson分布的性质(2),三、Poisson分布的正态近似 m相当大(20)时,近似服从正态分布:N(m,m)四、二项分布的Poisson分布近似,统计学,湖北中医药大学预防医学教研室,39,统计学,湖北中医药大学预防医学教研室,40,The class is overThanks!,