五章概率统计初步.ppt
第五章概率统计初步,第五章概率统计初步,n元线性方程组与矩阵,1,随机事件与概率,1,n元线性方程组与矩阵,1,随机变量及分布,2,n元线性方程组与矩阵,1,随机变量的数字特征,3,n元线性方程组与矩阵,1,统计推断,4,第五章概率统计初步,1了解随机事件概念、掌握事件之间的关系与运算;2会求简单的随机事件的概率和随机变量及其分布;3会用随机变量的数学期望与方差分析经济生活中的相关案例。,1,学习目标,第五章概率统计初步,【经济问题5-1】你知道质量保证时间应确定为多少小时吗?,宏达教学设备有限公司,研发了一款投影仪节能灯泡。经过大量测试,研发人员估计在正常情况下,产品使用寿命服从于3800小时到12960小时的均匀分布.试问:(1)使用寿命在5000小时到11500小时的概率;(2)为让更多的购买者愿意接受此产品,公司经理欲提出一个质量保证期,凡正常使用而使用寿命没超过质量保证期的产品,公司将予以更换.但希望更换的产品数不超过10%,则质量保证时间应确定为多少小时适宜?,一、随机事件及其运算(一)必然现象与随机现象 必然现象是指在一定的条件下,必然会出现某种结果的现象.随机现象是指在一定条件下,其结果可能不止一个,至于究竟出现哪一种结果,事先是无法确定的。,第一节随机事件与概率,第一节随机事件与概率,(二)随机试验与随机事件 定义5.1 对随机现象观察的过程称为随机试验,简称为试验。记为E。具有以下的特性:1.试验可以在相同条件下重复进行;2.每次试验的可能结果不止一个,而且在试验前明确知道所有的可能结果;3.每次试验前不能肯定会出现哪一个结果,但可以肯定每次试验出现这些可能结果中的一个。,第一节随机事件与概率,定义5.2 在一定的条件下,随机试验中可能出现的每一种结果称为随机事件,简称事件,常用大写字母A、B、C等来表示。在随机事件中,不可能再分的事件称为基本事件或样本点;由若干个基本事件组合而成的事件称为复合事件(或称一般事件)。,第一节随机事件与概率,样本点的全体构成的集合称为样本空间,常用表示;注:由于包含了全部样本点,故试验结果一定出现在中,因此说是必然事件。在一定的条件下,必然不会发生的事件称为不可能事件,记为。,(三)随机事件之间的关系及其运算 1.事件的包含与相等 设有事件A和B,如果A发生必然导致B发生,由称事件B包含事件A(或称A包含在B中)记作:,如果 和 同时成立,则事件A与B相等,记作A=B,第一节随机事件与概率,或,2事件的和(并)“事件A与B中至少有一个发生”这一事件称为A与B的和(或并),记作,第一节随机事件与概率,(或,)如图阴影部分所示。,类似地,事件“,,中至少有一个出现”称为,的和(并)记作:,3事件的积(交)“事件A 与B 同时发生”这一事件称为事件A与B的积(或交),记作AB(或).,第一节随机事件与概率,如图阴影部分所示。,4事件的差“事件A发生而事件B不发生”这一事件称为A与B的差,记作,如图阴影部分所示。,第一节随机事件与概率,5互不相容事件 若事件A与B在一次试验中不能同时出现,则称事件A与B是互不相容事件(或互斥事件),这时,如图所示。,第一节随机事件与概率,显然,6对立事件“A不发生”是一个事件,称此事件为事件A的对立事件(或逆事件),记作 如图所示。,第一节随机事件与概率,,,,,第一节随机事件与概率,7事件的运算律 事件运算满足以下规律:交换律,结合律,第一节随机事件与概率,分配律,反演律,第一节随机事件与概率,二、古典概型及概率(一)概率的统计定义 定义 5.3 在相同条件下重复进行n次试验,事 件A出m次,现当n很大时,事件A发生的频率稳定地在某个常数p 附近,则称常数p为事件A的概率,记为P(A)=p。,根据概率的统计定义,概率具有以下性质:1.对任何事件A有,第一节随机事件与概率,2.必然事件的概率等于1,即 P()=13.不可能事件的概率等于0,即 P()=0,第一节随机事件与概率,(二)古典概型及概率,具有以下两个特征的试验的概率问题称古典概型。1.每次试验,只有有限种可能的试验结果,或者说基本事件总数为有限个。2.每次试验中,各基本事件出现的可能性相同。,第一节随机事件与概率,定义5.4 若试验结果共有n个基本事件,这些事件的出现具有相等的可能性,而事件A由其中m个基本事件组成,则事件A的概率是:,解:设 表示“任取2件中恰有1件次品”,则基本事件种数,事件 所包含的基本事件为,故,第一节随机事件与概率,例1 一批产品共有50件,其中有2件次品。求:从中任取2件,恰有1件次品的概率;从中任取2件均为合格品的概率。,第一节随机事件与概率,解:设 表示“任取2件均为合格品”,则基本时间种数,事件 所包含的基本事件为,故,第一节随机事件与概率,三、加法公式与乘法公式(一)加法公式 对于任意两个事件A,B,有,称此公式为广义的加法公式,也称为加法的一般公式。,第一节随机事件与概率,注:1.当事件A,B互不相容时,即,则,2.,3.,如果,则,表示“甲、乙至少有一人被选中”。由于A、B相容,所以有,例2 甲、乙两人代表学院参加市级新会计准则知识选拔赛,甲被选中的概率为0.82,乙被选中的概率为0.84,甲、乙二人同时被选中的概率为0.68。求学院至少有一人被选中的概率。解 设A表示“甲被选中”,B表示“乙被选中”,,第一节随机事件与概率,当 时,有,当 时,有,第一节随机事件与概率,定义5.5 如果A、B为同一随机试验的两个事件,在事件B已经发生的条件下,事件A发生的概论叫做条件概率,记作,第一节随机事件与概率,例3 某班有40名学生,其中男生25名,女士15名。男生中有18名是独生子女,女生中有10是独生子女。现任抽一名学生参加暑期社会实践活动,求:(1)抽到男生独生子女的概率;(2)抽到的是一名男生,这名男生是独生子女的概率。,解设事件A表示“男生”;事件B表示“独生子女”(1),(2),(二)乘法公式由条件概率公式(5-8)和(5-9)直接得到乘法公式,即两个事件之积的概率等于其中一个事件的概率乘以另一个事件在已知前一个事件发生下的条件概率。,第一节随机事件与概率,第一节随机事件与概率,四、事件的独立性(一)事件的独立性 定义5.6 如果事件B的发生不影响事件A的概率,即,则称事件A对事件B是独立的(或称A独立于B),否则,称为不独立。,注:1.若事件A独立于事件B,则事件B也独立于事件A;2.若A、B相互独立,则,反之也成立;3.若事件A和B相互独立,则下列各对事件,第一节随机事件与概率,例4 甲、乙两人同为某财产保险公司的资深业务推销员。根据近三年的业绩,甲推销员的业务推销成功率为0.28,乙推销员的业务推销成功率为0.30,现在两人被公司要求各随机拜访某类人群中的一名客户,试求:(1)两人都推销成功的概率;(2)恰有一位推销员业务推销成功的概率。,第一节随机事件与概率,解 设A表示“甲推销员推销成功”,B表示“乙推销员推销成功”,(1)由于A、B 相互独立,所以,第一节随机事件与概率,(2),2)在每次试验中事件A发生的概率为P(),具有以上两个特点的n重实验又称为n重贝努利实验。,n重独立试验概型具有下列两个特点:1)每次试验都是在相同条件下进行,且只有两个结果,即事件A 或者发生或者不发生;,(二)独立试验概型 在相同条件下,独立重复进行n次试验的模型称为n重独立试验概型。,第一节随机事件与概率,第一节随机事件与概率,例5 欣欣便利店的经理经过长期观察,得出任意一个顾客购买商品的概率为0.30.现在有3个顾客接连走进便利店,问个顾客有两人会购买商品的概率.,第一节随机事件与概率,定理(贝努利定理)设一次试验中事件A发生的概率为P(),则n重贝努利试验中,事件A恰发生k次的概率为,其中(),用来表示随机事件结果的变量叫做随机变量通常用字母,、或X、Y、Z来表示。,一、随机变量的概念(一)随机变量,第二节随机变量及分布,第二节随机变量及分布,(二)随机变量的分类 随机变量按其取值情况通常主要分为下列两 类:1.若随机变量的取值可以一一列出,这个随机变量称为离散型随机变量。,2.若随机变量的取值充满了某个区间,该随机变量称为连续型随机变量。,第二节随机变量及分布,二、离散型随机变量及其分布(一)离散型随机变量的概率分布 在中学我们介绍离散型随机变量的概率分布,下面举例进行简单复习例6 盒子里装有5个白球和3个黑球,任意摸取一个,如果是黑球则这个黑球不放回而另外放一个白球,这样继续下去,直到取出的球是白球为止,试写出随变量可能取到值及其概率情况。,”表示“第 次换到白球”(),解 设“,第二节随机变量及分布,其概率分别为:,定义 5.7 离散型随机变量取值 及其对应的概率值得全体叫离散型随机变量的概率分布或称分布。,离散型随机变量的分布也可以用下面的表52给出,第二节随机变量及分布,可列成下表51,任意一个离散型随机变量的概率分布必须满足:1对于随机变量的任意取值,其概率是非负的,即。,第二节随机变量及分布,2对于随机变量所有可能的取值,其概率之和总是等于1,即当随机变量取值为有限个时,当随机变量取值为无限个时有,(二)几个常用的离散型概率分布1.二点分布(“01”分布)如果随机应量的分布列为表53,第二节随机变量及分布,其中q=1-P,0P1则称服从以P为参数的二点分布,记作B(1、P)。,例 7 设一批产品的次品率为0.08,今任取一件检查,分别用,表示这件产品为合格品或次品,求 的分布列。,B(1、0.92)。,即,第二节随机变量及分布,解 显然有表54,第二节随机变量及分布,2.二项分布若离散型随机变量的分布列为,则称服从参数为n,p的二项分布,记作B(n,p),第二节随机变量及分布,二项分布满足分布列的两个性质,(1)因为 所以,(2)根据二项式定理,解:设随机变量 为任一时刻抽水机在工作的台数,则 服从B(4,0.8),分布列为,例8 现有4台功率相同的抽水机,正常工作的概率均为0.8,不正常工作的概率为0.2,试写出任一时刻有抽水机在工作的概率分布。,第二节随机变量及分布,或表55,第二节随机变量及分布,3.泊松分布如果离散型随机变量的分布为,则称服从以为参数的泊松分布,记作P(),级数 是收敛的,且,因为,所以,第二节随机变量及分布,泊松分布满足列的两个性质,(),为随机变量的分布函数,记作 或。,(三)离散型随机变量的分布函数,第二节随机变量及分布,定义5.8 设是一个随机变量,称函数,分布函数 具有以下性质:,1.若,则;,第二节随机变量及分布,2.,3.,4.,另外,还有如下公式,,,第二节随机变量及分布,三、连续型随机变量及其分布,(一)概率密度函数,就叫做的概率密度函数(简称密度函数)。记为,定义5.9 设为连续型随机变量,如果存在非负数,使在任一区间a,b内取值的概率都有,第二节随机变量及分布,即密度函数是非负的;,第二节随机变量及分布,显然,对于连续随机变量,但有a=b时有,故,概率密度函数需满足以下条件:,第二节随机变量及分布,例9 某台电子计算机发生故障前正常运行的时间(小时)是一个连续性随机变量,其密度函数为,求:(1)正常运行时间在50小时100小时之间的概率。(2)运行100小时尚未发生故障的概率。,运行100小时尚未发生故障,而,第二节随机变量及分布,解,(二)连续型随机变量的分布函数 对于连续型随机变量,其分布函数:,且但 在 处连续时。,第二节随机变量及分布,求系数A和B 求的密度函数,第二节随机变量及分布,例 10 设随机变量的分布函数为,第二节随机变量及分布,解 及,可得,解之得,所以,1.均匀分布如果连续型随机变量 的概率密度函数为,则服从区间上的均匀分布,其分布函数为:,第二节随机变量及分布,(三)几个常见的连续型随机变量的分布函数,第二节随机变量及分布,均匀分布的密度函数与分布函数的图为:,简记为,第二节随机变量及分布,例11 爱奇发动机公司设计的汽车排气系统的寿命服从区间为2.5年到7年的均匀分布。假设该公司对所有部件有一个5年的保证期,在购买后的5年内可以更换任何有缺陷的部件。求:在保证期内,任何一辆汽车需要更换排气系统的概率。任何一辆汽车的排气系统的寿命在3年到6年之间的概率。,解 设 表示排气系统的寿命的随机变量,且服从均匀分布,有:,第二节随机变量及分布,第二节随机变量及分布,如果连续型随机变量密度函数为,其中为任意实数,0,则称服从以,2为参数的正态分布,记作,2.正态分布,第二节随机变量及分布,第二节随机变量及分布,曲线位于 轴上方,且以 为水平渐进线。,曲线关于参数 对称。,当 时,达到最大值。,曲线与 轴转成的面积为1。,曲线在 处有拐点,拐点坐标为,,由图可见,曲线具有下列特点:,图1 图2,第二节随机变量及分布,参数决定正态曲线的扁平,小图像狭高,大图像扁平,如图2所示。,参数决定正态曲线所在的位置,如图1所示。,当,时,则称随机变量 服从标准正态分布,记为,其密度函数为 和分布函数 分别为,第二节随机变量及分布,服从正态分布的随机变量 的分布函数为,(1)正态分布函数,由标准正态分布的密度函数可知曲线关于y轴称且对称区间概率相等。即:如图4所示,见图3 图3 图4,第二节随机变量及分布,例12 已知,求,第二节随机变量及分布,(1),(2),解(1),(2),若随机变量,则。即,第二节随机变量及分布,正态分布的标准化,第三节随机变量的数字特征一、随机变量的数学期望及其性质例 13 某化妆品公司根据近几年销售业绩,预测下一年度销售收益及概率分布为表5-8,试求,该公司下一年度预期期望收益是多少?,第三节随机变量的数字特性,表5-8:,(百万),解:,为的数学期望(或均值)记为,第三节随机变量的数字特性,定义5.10 设离散型随机变量的分布列为下表5-9:,则称,(一)离散型随机变量的数学期望,如果不考虑货币的时间价值,以10年总净收益决定方案的优劣,应选择哪种投资方案?,例14 某地区规划在某新建住宅区增加商业网点,提出两种方案:建一个大型连锁超市,或建若干个便利店。估计建大型连锁超市要投资100万元,建若干个便利店需要投资16万元。两个方案的年损益值以及经营状况的概率见表5-10:,第三节随机变量的数字特性,表5-10,第三节随机变量的数字特性,解 建大型连锁超市:年收益的期望值=50 x0.7+(-10)x0.3=35-3=32万10年总净收益=32x10-100=220万建若干便利店:年收益的期望值=24x0.7+5x0.3=16.8+1.5=18.3万10年总净收益=18.3x10-16=16万两者比较,建大型连锁超市方案较合理。,称为的数学期望。如果积分不存在,则 也不存在。,定义5.11 如果连续型随机变量的概率密度函数为,则称,(二)连续型随机变量的数学期望,第三节随机变量的数字特性,第三节随机变量的数字特性,例15某种无线电元件的使用寿命是一个随机变量,它有概率密度函数,求这种元件的平均使用寿命。,第三节随机变量的数字特性,解 由公式,第三节随机变量的数字特性,(三)数学期望的性质随机变量的数学期望有下列性质:,2.,3.,4.,1.,第三节随机变量的数字特性,二、随机变量的方差及性质定义5.12 设是一个随机变量,称,为的方差。称为随机变量的标准差或均方差,记作,即,第三节随机变量的数字特性,如果是离散型随机变量且分布列为 则,如果是连续型随机变量,且概率密度函数为,则,随机变量的方差具有以下性质:,第三节随机变量的数字特性,方差的常用公式,第三节随机变量的数字特性,例16 已知 求,解 因为随机变量服从均匀分布,且概率密度函数为:,所以,第三节随机变量的数字特性,第四节统计推断,一、基本概念 举例 安徽调查总队对全省2350户城镇居民家庭抽样调查得到:2006年,全省城镇居民人均可支配收入9771.1元,人均家庭消费支出7294.7元;截止2006年底,全省城镇人均拥有住房面积27.1平方米,户均住房面积78.9平方米。,第四节统计推断,(一)总体、样本与统计量 数理统计中把研究对象的全体称为总体(或母体),而组成总体的每一个元素称为个体。,分析:对人均收入、人均家庭消费、人均住房面积三个调查指标而言,全省城镇居民就是总体,全省每一个城镇居民就是一个个体,抽取的2350户的所有居民就是样本;,由总体中随机抽取的个体组成的集合称为一个样本,样本中所含个体的数目称为样本容量.,设 是总体中抽取的一个容量为n 的样本,则常用统计量:,第四节统计推断,样本均值,样本方差,样本均方差,第四节统计推断,例17 从一批机器零件毛坯中随机抽取8件,测得其重量(单位:公斤)为:228,191,230,241,200,245,240,185 写出总体,样本,样本值,样本容量;求样本均值,方差和标准差。,第四节统计推断,第四节统计推断,设,是的样本,则,(二)统计中常用的几个分布,1.样本均值的分布,第四节统计推断,解 因为总体服从正态分布,所以 服从正态分布,第四节统计推断,2.分布,叫做 变量。,设,是 的样本,则,称为自由度为n-1的t变量,其概率分布称为自由度为n-1的t分布,记为Tt(n-1)。,第四节统计推断,3.t 分布,设,是 的样本,则,第四节统计推断,二、参数估计 参数估计就是用样本的统计量 估计总体参数,我们称他为估计量,其具体指称为估计值。参数估计通常分为点估计和区间估计两种。,1.无偏性 若估计量 的数学期望等于未知参数到真值,即,则称 是 到无偏估计量。,(一)评价估计量的优良性准则,第四节统计推断,2.有效性 若 与 都是 的无偏估计量,而 得方差小于 到方差,即,则称 较 是 的有效估计量。,3.一致性 如果随着样本容量增大,估计量 越来越近总体参数,则称 为 的满足一致性标准要求的估计量。,(二)点估计 从总体中抽取一个样本,用这组样本观测值来估计总体参数的值,这种估计方法称为参数的点估计(也称定值估计)。在实际工作中,常常用样本均值 估计总体均值,用样本方差 来估计总体的方差,第四节统计推断,。,例19 某厂生产一批零件,现要查验零件的直径,从产品中随机选取12只,测得直径(单位:毫米)分别为:13.30 13.38 13.42 13.43 13.36 13.4813.54 13.34 13.34 13.47 13.44 13.50设零件的直径总体 服从正态分布,试估计 和 的值。,第四节统计推断,第四节统计推断,解 用样本的平均直径 和样本方差 来估计总体 的 和,将样本值分别代入得,因此总体均值到估计值为13.42(毫米),总体方差 到估计值为0.0054(毫米)2,第四节统计推断,设 是总体 分布的未知参数,是取自总体 到样本,构造两个统计量 和,使得包含未知参数 区间 的概率为,即这样的估计方法称为区间估计。,(三)区间估计,第四节统计推断,区间 叫置信区间,及 分别叫置信区间的上下限,如图所示。叫置信系数,也叫置信概率或置信度,而 是事先给定的一个小正数,它是指参数估计不准确的概率,通常取值0.01,0.05,0.10等,区间估计较点估计的优点:既反映了估计结果的精确度又表明了这个估计结果的可靠程度。,第四节统计推断,1.正态总体均值区间估计,已知方差,求均值 的置信区间。,第四节统计推断,由正态分布表可知,对给定的,存在一个临界值,使,第四节统计推断,例如 时,,查正态分布表可得,上式表明 包含在区间,内的概率为0.95。,第四节统计推断,设 为总体 的一个样本,其 中,是未知参数,给定置信度,求总体方差 的置信区间。,由于 是 的良好估计量,并且可以根据样本值求出 变量,除待估的参数 外,不含其它参数,因此可选用 变量构造 置信区间,,2.正态总体方差的置信区间,第四节统计推断,其中,,,于是总体方差 到置信度 到置信区域为:,例20 某超市经理为确定每天上午营业最初几小时,收银台开启几个较为合理,进行了40天的调查记录,通过对客流量的记录整理,得出每天上午最初的几小时来超市购物的客流量方差为62,求方差的置信度为95%的置信区间。,第四节统计推断,解 在统计调查中对总体分布未知,一般样本,即可按正态分布处理。所以认为媒体上午营业最初几小时超市客流量。,第四节统计推断,当,查 分布表。,代入(5-11)式得:,所以超市每天上午营业最初几小时顾客的流量方差为 的置信度为95%的区间为。,由题知自由度;,马尔柯夫是俄国伟大的数学家,以他的名字命名的马尔柯夫链在人类的历史上第一个从理论上提出并加以研究的随机过程的模型,在今天的市场预测、利润预测、经营决策等经济领域有着广泛的应用。,第四节统计推断,知识应用链接,