生物统计2章概率和概率分布.ppt
《生物统计2章概率和概率分布.ppt》由会员分享,可在线阅读,更多相关《生物统计2章概率和概率分布.ppt(49页珍藏版)》请在三一办公上搜索。
1、2023/10/2,第二章 概率和概率分布,2.1 概率的基本概念2.2 概率分布2.3 总体特征数2.4 几种常见的概率分布律,2023/10/2,第二章 概率和概率分布,2.1 概率的基本概念,自然现象:确定性现象和非确定性现象(随机现象)从随机现象中做大量的研究,能从其偶然性中揭示内在的规律统计学所研究的是非确定性现象,,2023/10/2,概率的统计定义是在大量的试验中,以频率的稳定性为基础上提出来的。设k次随机试验,成功事件A 出现l次,则称l/k是K次随机试验中成功的频率。频率是由样本数据计算得到的。由于样本分布的不恒定性,不同的随机试验,事件A的出现频率也不同,随着K改变,频率也
2、有一定的波动。随着K的增大,频率l/k将围绕着某一确定的常数P做平均幅度愈来愈小的变动,这就是所谓频率的稳定性,其中P即为事件A的概率。简单的说概率就是频率的稳定值。在试验次数较多时,可以用频率作为概率的近似值。(P23 表2-1),2.1.1 概率的统计定义,2023/10/2,概率是事件在试验结果中出现可能性大小的定量计算,是事件固有的属性,有以下明显的性质:任何事件A的概率均满足:0P(A)1必然事件W的概率为1,即P(W)=1不可能事件(V)的概率为0,即P(V)=0,2.1.1 概率的统计定义(续),2023/10/2,概率的统计定义是在大量的试验中,以频率的稳定性为基础上提出来的。
3、不需要做试验就可以确定事件出现的概率,称为古典概率,具有以下特点:随机试验的全部可能结果(基本事件数)是有限的;各基本事件间是互不相容且等可能的。缺点:要求各基本事件是等概率且有限的。,2.1.2 概率的古典定义,2023/10/2,随机变量随机变量就是在随机试验中被测定的量,所取得的值称为观察值。可分为离散型随机变量和连续型随机变量。离散型随机变量:可能取得的数值为有限个或可数无穷个孤立的数值。连续型随机变量:可取某一(有限或无限)区间内的任何数值。,2.2 概率分布,2023/10/2,将随机变量X所取得值x的概率P(X=x)写成x的函数p(x),称为随机变量X的概率函数公式为p(x)=P
4、(X=x)。概率函数应满足:p(x)0 p(x)=1,离散型随机变量的概率分布,2023/10/2,将X的一切可能值x1,x2,x3,xn,以及取得这些值的概率P(x1),P(x2),.,p(xn),.排列起来,构成了离散型随机变量的概率分布。常用概率分布表或概率分布图表示。,2.2.1 离散型随机变量的概率分布(续),离散型随机变量的概率分布表,2023/10/2,离散型随机变量的概率分布图,2023/10/2,离散型变量概率的分布函数:离散型变量概率的累积。其公式为,2.2.1 离散型随机变量的概率分布(续),指随机变量等于或小于某一可能值(x0)的概率。,2023/10/2,对于离散型随
5、机变量的任何值,都可以求出它的概率。而连续型随机变量则不同,因为试验中可以取某一区间内的任何值,这些数值构成不可数的无穷集合。任何值的概率都等于0,这并不是说这种事件不会出现,只是由于技术上的限制,在测量时不可能无限提高精确度。在研究连续型随机变量时,实际观察值只能是落在一定的区间内,其概率可以不为0,当然这种区间可以很小。,2.2.2 连续型随机变量的概率分布,2023/10/2,随机变量X的值落在区间(x,x+x)内的概率为P(xXx+x),其中x为区间长度。当x趋于零时,此时区间概率称为密度函数:概率密度的图形y=f(x)称为分布曲线。,连续型随机变量的概率分布(续),2023/10/2
6、,分布函数(或称为累积分布函数)是随机变量X取得小于X0的值的概率对于任意两点a和b(a b),下式成立:P(Xa)+P(aXb)=P(Xb)或P(aXb)=F(b)-F(a),连续型随机变量的概率分布(续),2023/10/2,通过样本数据得到的频率分布称为统计分布或经验分布,描述总体的概率分布称为理论分布或总体分布。频率分布可出现各种类型:两侧对称,不对称,但对于不同的频率分布均有相应理论分布,即随机变量变化规律的理想化数学模型。虽然很难与实际情况完全一致,但近似得非常好,因此可以用建立在概率分布基础上的统计规律来解决实际问题。如果我们从总体中取出了一个很大的样本,可把这个样本的分布近似作
7、为总体的分布。,概率分布与频率分布的关系,2023/10/2,样本特征数是描述频率分布特征的:统计量总体特征数是描述概率分布特征的:参数总体特征数包括随机变量的数学期望(理论平均数),方差和各阶矩,可以用类似求样本特征数方法求得。,2.3 总体特征数,2023/10/2,总体特征数:描述概率分布特征的数字,包括数学期望、方差和各阶矩。所谓X或X的函数的数学期望,即它们的理论平均数。样本平均数:,2.3.1 随机变量的数学期望和方差,随着n的充分增加,平均数稳定于总体平均数,2023/10/2,频数资料的样本方差和标准差,2.3.1 随机变量的数学期望和方差(续),总体方差和标准差,2023/1
8、0/2,X或X的函数的数学期望可用通式表示,2.3.1 随机变量的数学期望和方差(续),随机变量的数学期望就是这个随机变量的所有可能值,以其相应概率为权的加权平均数。,2023/10/2,连续型随机变量的数学期望定义为,2.3.1 随机变量的数学期望和方差(续),连续型随机变量方差定义为,2023/10/2,2.3.2 数学期望和方差的运算,2023/10/2,2.4 几种常见的概率分布律,2.4.1 二项分布二项分布在生物学中应用很广,其特征如下:每次试验只有两个对立结果(A和);N次试验是重复,独立的。回放式抽样适合于二项分布;非回放式抽样适合于超几何分布。,二项分布概率函数,2023/1
9、0/2,2.4.1 二项分布(续),服从二项分布的随机变量的特征数,(用比率表示时),平均数,方差,偏斜度,峭度,(用比率表示时),2023/10/2,二项分布决定于两个参考数:试验次数和概率,因此其图形变化趋势与这两个参数有关随试验次数的增大图形分布趋于对称;而且当概率趋于0.5时分布趋于对称偏斜度和峭度是与试验次数和概率有关。当相同时,随样本含量的增加,1和2逐渐接近于0(正态分布);或样本含量相同时,愈接近于0.5,1和2愈接近于0。表3-1 P37二项式分布应用实例,2.4.1 二项分布(续),2023/10/2,在生物统计学中,正态分布占有极其重要的地位。许多生物学现象所产生的数据,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计 概率 分布
链接地址:https://www.31ppt.com/p-6182273.html