医药数理统计课件.ppt
《医药数理统计课件.ppt》由会员分享,可在线阅读,更多相关《医药数理统计课件.ppt(87页珍藏版)》请在三一办公上搜索。
1、医药数理统计,教师:吕 靖联系方式:电话:13789089073邮箱:QQ号:76756940办公室:公教楼123,第一章.事件与概率,第二章.随机变量的概率与数字特征,第三章.实验设计,第四章.抽样分布,第五章.参数估计,第六章.假设检验,第八章.线性相关与回归分析,第九章.正交设计,概率规律,统计方法,主要内容,第七章.方差分析,第十章.均匀设计,实验设计,确定性现象:结果确定不确定性现象:结果不确定,自然界与社会生活中的两类现象,抛出的物体会掉落到地上明天天气状况买了彩票会中奖抛硬币出现正(反)面,事件与概率,一次抛掷硬币试验(出现正面朝上),多次抛掷硬币实验(出现正面朝上的次数),不确
2、定,近半数(规律),这种在个别实验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象,称为随机现象。,概率论与数理统计是研究和揭示随机现象规律性的一门数学学科。,事件与概率,第一节 随机事件及其运算一、随机事件随机试验:对随机现象的观察(试验)抛一枚硬币,观察抛一颗骰子,观察记录某城市120急救电话台一昼夜接到的呼叫次数观察某一电子元件的寿命将一枚硬币连抛三次,考虑正(反)面出现的情况具有以上三个特点的试验成为随机试验,简称试验(E)。,1、可以在相同条件下重复;2、每次试验的结果可能不止一个,并且能事先明确试验的所有可能结果;3、进行一次试验之前不能确定哪一个结果会出现。,
3、事件与概率,样本空间:试验所有的结果的集合()抛硬币:正面,反面抛一颗骰子:1,2,3,4,5,6记录某城市120急救电话台一昼夜接到的呼叫次数:1,2,3,4,观察某一电子元件的寿命:R+将三枚硬币:正正正,正正反,正反反,反反反随机事件:随机试验的结果(样本空间的子集)(A,B.)基本事件:不能分解成其它事件的最简单的随机事件.必然事件:每次试验必然发生()不可能事件:每次试验都不会发生(),二、事件间的关系与运算,事件的包含:如果事件A发生必然导致B发生 则称事件B包含事件A 或称事件A包含于事件B 或称A是B的子事件 记作BA或AB,说明:AB属于A的每一个样本点一定也属于B 对任意事
4、件A 易知A,事件的相等:如果事件A包含事件B 事件B也包含事件A 则称事件A与B相等(或等价)记作AB,说明:相等的两个事件总是同时发生或同时不发生,事件与概率,事件的并(或和)“事件A与B至少有一个发生”这一事件称作事件A与B的并(或和)记作AB或AB 例.在投掷一枚骰子的试验中 记A“点数为奇数”B“点数小于5”则 AB?,事件的交(或积)“事件A和B都发生”这一事件称为事件A与B的交(或积)记作AB(或AB),说明:两个事件的并与交可以推广到有限个或可数个事件的并与交,例.在投掷一枚骰子的试验中 记A“点数为奇数”B“点数小于5”则AB?,事件与概率,事件的差“事件A发生而B不发生”这
5、一事件称为事件A与B的差 记作AB 例.在投掷一枚骰子的试验中 记A“点数为奇数”B“点数小于5”则 AB?,互不相容事件 若事件A与B不可能同时发生 也就是说 AB是不可能事件 即AB 则称事件A与B是互不相容事件,事件与概率,完备事件组:设A1 A2 An是两两互不相容的事件 并且和为,称A1 A2 An是一个完备事件组,例.考察某一位同学在一次数学考试中的成绩 分别用A B C D P F表示下列各事件(括号中表示成绩所处的范围)A优秀(90 100)D及格(60 70)B良好(80 90)P通过(60 100)C中等(70 80)F未通过(0 60)则:A B C D F是两两不相容事
6、件 P与F是互为对立的事件 即有PF A B C D均为P的子事件 且有PABCD,对立事件:“事件A不发生”这一事件称为事件A的对立事件 记作A 如:在投掷一枚骰子的试验中“点数小于3”和“点数大于4”这两个事件是互不相容事件 说明:在一次试验中 如果A发生 则A一定不发生 如果A不发生 则A一定发生 因而有AA AA,问:对立事件与互不相容事件之间的关系?,事件与概率,三、随机事件的运算律1 关于求和运算(1)ABBA(交换律)(2)(AB)CA(BC)ABC(结合律)2 关于求交运算(1)ABB A(交换律)(2)(AB)CA(B C)AB C(结合律)3 关于求和与求交运算的混合(1)
7、A(BC)(AB)(AC)(第一分配律)(2)A(BC)(AB)(AC)(第二分配律)4 关于求对立事件的运算5 德摩根律,事件与概率,频 率 稳 定 值 概率,概率的统计定义频率:在相同条件下进行n次试验,事件发生的次数m称为事件发生的频数。称 为发生的频率。记作定义:当n足够大时,频率的稳定值p(注意概率与频率的区别),性质:,第二节 事件的概率,注:概率是一个随机事件所固有的属性,与试验次数以及每一次试验结果无关。,频率的性质,事件发生的频繁程度,事件发生的可能性的大小,概率的统计定义,事件与概率,一、概率的定义,概率的古典定义前提:试验样本空间只包含有限个元素;每个基本事件发生等可能性
8、。定义:已知样本空间 中基本事件总数为n,若事件A 包含 k 个基本事件,则有例:将一枚硬币抛三次,求(1)事件A=恰有一次出现正面(2)事件B=至少有一次出现正面?例:某学习小组有10名同学,其中7名男生,3名女生,从中任选3人去参加社会活动,则3人全为男生的概率为?,补充:排列与组合排列定义:从m个元素中,取出n(nm)个元素按一定顺序排成一列。记为组合定义:从n个元素中,任取k个为一组,得出的不同的组数,称为组合数。记作,1.互斥事件加法定理(有限可加性)若事件A、B互斥,则有P(A+B)=P(A)+P(B)推广:若 为两两互斥事件,则例.药房有包装相同的六味地黄丸100盒,其中5盒为去
9、年产品,95盒为今年产品。现随机发出4盒,求:有1盒或2盒陈药的概率。2.一般加法定理对任意两事件A、B,有P(A+B)=P(A)+P(B)P(AB)推广:对任意三事件A、B、C,有P(A+B+C)=P(A)+P(B)+P(C)P(AB)P(AC)P(BC)+P(ABC)3.减法定理对任意的A、B,有P(A-B)=P(A)P(AB),二、概率的运算,4.条件概率与乘法定理条件概率:在事件B已经发生的条件下,A发生的概率称为A的条件概率,记性质:一般情况下,例.袋中有2个白球,8个黑球,现让两个人去抽球(无放回)。若已知第一个人抽到白球,则第二个人也抽到白球的概率是多少?乘法定理:推广公式:,4
10、.独立事件及其乘法定理独立事件:若 或 或 则称时间A、B相互独立。定理:若A与B,A与,与B,与 中有一对相互独立,则另外三对也相互独立。推广:若任意三事件A、B、C两两独立,且P(ABC)=P(A)P(B)P(C),则称A、B、C相互独立。多事件相互独立 多事件两两独立例如:抛一枚硬币两次,记A=第一次为正面,B=第二次为反面,C=两次都为同一面。分析知,A、B、C两两独立,但不相互独立。独立事件的乘法定理:若 相互独立,则注意:具有非零概率的两事件,互斥就不独立,独立就不互斥。例.若每人血清中有肝炎病毒的概率为0.4%,今混合100人的血清,求混合血清无肝炎病毒的概率。,1.全概率公式:
11、若 构成互斥完备群,则对任意事件B,有全概率公式的意义:在较复杂情况下直接计算P(B)不易,借助于一个完备事件组,将复杂事件分解成若干个互不相容的简单事件的和,再利用概率的加法公式求出复杂事件概率。例12.设药房的某种药品由三个不同的厂家生产。其中第一家药厂生产的药品占1/2,第二、三家分别占1/4,已知第一、二家药厂生产的药品有2%的次品,第三家药品有4%的次品。试求:现从药房任取一份,问拿到次品的概率?,第四节 全概率公式和逆概率公式,实际工作中还会遇到与全概率问题相逆的问题。如例12改成:设药房的某种药品由三个不同的厂家生产。其中第一家药厂生产的药品占1/2,第二、三家分别占1/4,已知
12、第一、二家药厂生产的药品有2%的次品,第三家药品有4%的次品。试求:拿到的药品是次品时,该次品由各家药厂生产的可能性为多大?2.逆概率公式(贝叶斯公式):设 是互斥完备群,则对任意事件B,有,随机变量的概率分布与数字特征,第一节 随机变量与离散型随机变量的概率分布 引入随机变量使得随机事件可用随机变量的关系式表示,从而使对随机现象研究进一步深入、更数学化。1.随机变量 对于随机试验,若其试验结果可用一个取值带有随机性的变量来表示,且变量取这些可能值的概率是确定的,则称这种变量是随机变量。注意:随机变量常用X,Y,Z表示,而表示随机变量所取的值通常用x,y,z表示。例如,从某一学校随机选一学生,
13、测量他的身高。我们可把可能的身高看作随机变量X,然后提出关于X的各种问题。如P(X1.7)=?P(X1.5)=?P(1.5X1.7)=?一旦我们实际选定了一个学生并量了他的身高之后,我们就得到X的一个具体的值,记作x。这时,要么x1.7米,要么x 1.7米,再去求P(x1.7米)就没有什么意义。性质1:随机变量取任何值的概率均为非负。性质2:随机变量取所有可能值的概率之和为1。,2.离散型随机变量 如果随机变量只能取有限个或无限可列个数值,则称它为离散型随机变量。例如:小白鼠存活的只数,引体向上次数等。3.连续型随机变量 如果随机变量的可能取值为某一区间的所有实数,无法一一列举,则称他为连续型
14、随机变量。例如:身高、体重等。,4.离散型随机变量的概率函数 设离散型随机变量X的所有可能取值为xi(i=1,2,),相应的概率P(X=xi)=pi称为离散型随机变量X的概率函数或分布律。通常X的分布律可用表格表示:概率函数有如下性质性质:例.某篮球运动员投中篮圈概率是0.9,求他两次独立投篮投中次数X的概率分布。,5.离散型随机变量的分布函数设X是一个随机变量(可以是离散型,也可以是连续型),x是任意实数,则函数F(x)=P(Xx)称为随机变量X的分布函数。性质:(1)F(x)为非减函数;(2)0F(x)1(-x+);(3)F(-)=0,F(+)=1;(4)F(x)右连续,即 例.给青蛙按每
15、单位体重注射一定数量的洋地黄,由以往的实验知,致死的概率为0.6,存活的概率为0.4,现给两只青蛙注射,求死亡只数的概率函数和分布函数。,第二节 常用的离散型随机变量的概率分布1.二项分布伯努利试验:许多试验只有两种互斥的结果,为了找到这些试验结果的规律性,需要在相同条件下做n次独立重复试验,称为n重伯努利试验,简称伯努利试验。二项分布 若在一次伯努利实验中成功(事件A发生)的概率为p(0p1),独立重复进行n次,这n次中实验成功的次数(事件A发生的次数)X的分布列为:称X所服从的分布为二项分布.记为XB(n,p).例.某射手在相同条件下独立地进行5次射击,每次击中目标的概率是0.6,求击中目
16、标次数X的概率分布.,在二项分布中,X取不同值k(k=0,1,2,n)的概率是不同的,是P(X=k)取最大值的k(记为k0)称为二项分布的最可能值。当k在(n+1)p附近时,P(X=k)达到最大值。即:若(n+1)p为整数,则k0为(n+1)p和(n+1)p-1;若(n+1)p为非整数时,则k0为int(n+1)p例4.设某种老鼠正常情况下,受某种病毒感染的概率为20%,试求正常情况下,25只健康老鼠受感染的最可能只数是多少?2.泊松分布(稀有事件模型)如果随机变量X的概率函数为其中,0,则称X服从参数为的泊松分布,记为XP()。许多稀有事件都服从或近似服从泊松分布。=np。,例5.已知某地区
17、人群中患某种病的概率为0.001,试求在检查的5000人中至少有2人患此病的概率。解:由于n=5000较大,p=0.001较小,取=np=5,设X=患此病人数,则XP(5)若精确计算,则XB(5000,0.001),第3节 连续型随机变量的概率分布1.连续型随机变量的概率密度若对于随机变量X的分布函数F(x),存在非负函数f(x),使得对于任意实数x,有:则称X为连续型随机变量,其中被积函数f(x)称为X的概率密度函数(简称概率密度)性质:f(x)0;对于任意实数a,b(ab)若f(x)在点x处连续,则注意:连续型随机变量X的分布函数F(x)是连续函数.连续型随机变量 X 取任一常数 a 的概
18、率为0,2.正态分布定义:若随机变量X的概率密度函数为其中,(0)为常数,则称X服从参数为,2的正态分布(或高斯分布),记为XN(,2).特点:曲线f(x)呈钟形,关于直线x=对称,在(-,上递增,在,+)上递减。在x=处,f(x)取最大值 在x=处有拐点,且以x轴水平渐近线。,当固定时,改变,则f(x)图形的形状不变,只改变其位置,确定图形的中心位置,称位置参数,增大,曲线向右移。当固定时,越小图形越陡峭,确定图形峰的陡峭形状,故称形状参数。,标准正态分布参数=0,=1的正态分布为标准正态分布,记为XN(0,1)。标准正态分布的重要性在于,任何一个正态分布都可以通过线性变换转化为标准正态分布
19、。它的依据是下面的定理:根据定理,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题。,正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都是服从或近似服从正态分布的正态分布是概率论中最重要的分布。均匀分布、对数正态分布等分布不做要求。,第4节 随机变量的数字特征随机变量数字特征,分两类:表示集中程度、平均水平数学期望、分位数、中位数、众数等;表示离散程度、变异大小方差、标准差、变异系数等。1.均数(数学期望)定义1:设离散型随机变量X的分布律为PX=xi=pi,k=1,2,3.,则规定X 的均数定义2:设连续型随机变量X的概率密度函数f(x),则规定X的均数为
20、性质:(1)E(c)=c,c为常数(2)E(cX)=c*E(x)(3)E(XY)=E(X)E(Y)(4)E(XY)=EX*EY,X与Y独立,常见分布的数学期望二项分布:泊松分布:正态分布:E(X)=2.方差和标准差方差:设X是一个随机变量,则称E(X-EX)2为X的方差,记作DX,为标准差。注:随机变量的方差反映了它的取值与其数学期望的偏离程度,它是衡量取值离散程度的一个尺度。对于离散型随机变量:对于连续型随机变量:性质:(1)D(c)=0,c为常数(2)D(cX)=c2*D(X)(3)D(XY)=DX+DY,X与Y相互独立,常见分布的方差二项分布:泊松分布:正态分布:例7:设XP(2),则下
21、列结论中正确的是()A.EX=0.5,DX=0.5B.EX=0.5,DX=0.25C.EX=2,DX=4 D.EX=2,DX=2例8:相互独立的随机变量X和Y的方差分别为4和2,则随机变量3X-2Y的方差是?3.变异系数比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。,第5节 三种重要分布的渐进关系(略)当n,二项分布B(k;n,p)以泊松分布P(k;)为极限分布;当n,二项分布B(k;n,p)以正态分布N(np,npq)为极限分布;当n,泊松分布P(k;)以正态分布N(;)为极限分布。例:,第3讲 随机抽样、抽样分布和总体的参数估计第1节 随机抽样1.总体与样本总体:研究对象的
22、全体,组成总体的每个单元称为个体。样本:在一个总体X中抽取n个个体X1,X2Xn,这n个个体组成的集合称为总体X的一个样本。样本中含有个体的数目称为样本容量,也称样本的大小。简单随机抽样是指在抽取样本单位时,总体的每一个可能的样本被抽中的概率相同。简单随机样本样本X1,X2Xn相互独立且与总体X有相同的分布函数,这样的样本称为简单随机样本。,第2节 样本的数字特征统计量:设X1,X2Xn为总体X的一个样本,g(X1,X2Xn)为一个样本函数,如果g中不含有任何未知参数,则称g为一个统计量。特点:(1)统计量是样本中n个随机变量X1,X2,Xn的函数,它是完全由样本决定的量,仍是一个随机变量。(
23、2)统计量不包含任何未知参数。例如:几种常见统计量样本均数,样本方差、标准差、变异系数(相对标准差)注意:分母为n-1。由于样本方差中的均数是样本的,是总体的一部分,其离差平方和一定变小,所以若以n为分母,S2一般比总体方差小(有偏估计)。而分母改为n-1后,经数学证明,S2总在总体方差周围波动(无偏估计),另外,S2 的自由度正好是n-1。样本的标准误SD与SE的区别:SD是描述个体观察值变异程度的大小,样本标准差越小,样本均 数对一组样本观察值的代表性就越好;SE是描述样本均数变异程 度和抽样误差的大小,样本标准误越小,用样本均数估计总体均 数可靠性就越高。,在实际中,一般用样本标准差与样
24、本均数结合,用于描述样本观察值的分布范围;样本标准误与样本均数结合,用于估计总体均数可能出现的范围。第3节 抽样分布统计量是样本随机变量的函数,也是一个随机变量,因而也有自己的概率分布,这种统计量的分布叫做抽样分布。以下介绍几种在已知总体为正态分布条件下,常见统计量的抽样分布。1.样本均数的u分布这说明样本均数的期望与总体的期望相等,而方差为总体方差的1/n倍。可见,用样本均值估计总体均值无系统偏差,且n越大越精确。,样本均值分布的应用:其标准化随机变量u主要用于单正态总体、方差已知、小样本条件下数学期望的u检验。,2.2分布(卡方分布)设X1,X2,Xn相互独立,都服从N(0,1),则称随机
25、变量:所服从的分布为自由度为n的2分布,记为22(n)。自由度:指统计量中独立变量的个数。计算公式为df=n-k,n为样本容量,k为约束条件个数。如统计量,变量独立无约束条件,所以自由度为n。而样本方差,其中有n个变量,但这说明变量间有一个约束条件,所以其自由度为n-1.性质:(1)一种非对称分布。当n较大时,曲线近似对称,趋于正态分布。(2)一个以自由度n为参数的分布族,自由度n决定了分布的形状,对于 不同的n有不同的分布。(3)均值为n,方差为2n。,定理:若X1,X2Xn为正态总体 的一个样本,则有3.t分布设XN(0,1),Y2(n),且X与Y相互独立,则称随机变量 所服从的分布为自由
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医药 数理统计 课件
链接地址:https://www.31ppt.com/p-5246796.html