随机现象-数学期望.ppt
第二章 随机数学的基本思想,随机现象概率分布数学期望与方差决策论数理统计,1、必然(确定)现象,只要具备一定的条件,,某现象一定会发生或一定,一、随机现象,不会发生.,2、随机(不确定)现象,在相同条件下,重复同样的试验,结果可能出现,也可能不出现,具有不确定性。,但是在大量实验中其结果又具有统计规律性.,概率论与数理统计是研究与揭示随机现象,统计规律性的一门数学学科。,第一节、随机现象,例如抛一枚硬币,硬币必然下落。,(1)掷一枚均匀硬币,正面向上的可能性。,(2)明天下雨的可能性。,(3)买彩票中奖的可能性。,3、随机事件,买彩票事件中,在开奖之前无法确定你所购买的彩票是否中奖,即“中奖”是一个可能发生也可能不发生的事件。这类事件称为随机事件,用A,B,C等表示。,二、频率的稳定性 概率,一个事件在某次试验中的出现具有偶然性,但在大,量重复试验中随机事件的出现呈现一定的数量规律,,频率这一概念近似反映了这个数量规律。,抛硬币试验。,在相同条件下做,n次试验,事件A发生的次数为nA,称为A的频率。,比值,历史上著名的统计学家蒲丰和皮尔逊曾进行过,大量掷硬币的试验,所得结果如下:,4040,2048,0.5069,12000,6019,0.5016,24000,12012,0.5005,频率有随机波动性,每次试验频率不一定相等;,稳定性(n充分大时,,称为事件A,的概率.),随机事件发生的频率具有稳定性是客观规律。,其稳定,值可以通过大量重复试验估计出来。,其稳定值就是该随,机事件的属性,称为概率,反映了该事件出现的可能,性的大小。,例如:世界各国女婴出生的频率稳定在21/43上下;,再如:因没有写地址而无法投递的信件的频率。,注意:“相同条件下的重复试验”。,若条件变化或无法重复试验,则频率不具有稳定性。,区别:主观概率。,如:某人脸色不好看,可能会想:他多半不高兴了。,由于频率只要求每次试验在相同条件下进行,(即重复试验),,因此应用十分广泛。,实际问题中,通常用频率来估计概率。,如:产品合格率、,天气预报准确率、,电话使用率、,电器可靠率等都是通过频率来确定概率。,但因我们不可能对每个事件都做大量的试验,,从中发现频率的稳定值,,同时为了理论研究的需要,,需要给出概率的公理化定义,这里不做讨论。,本书仍采用概率的频率解释,三、随机现象的规律,概率论是研究随机现象的数学学科。,结果的随机性;,频率的稳定性.,随机现象的特征:,对随机现象的研究将使事前无法预料的结果最终变为可以预料的结果?,如何才算对随机现象有了“了解”?,“了解”随机现象是指:,明确所有可能出现的结果;,明确每个结果出现的概率.,这两点体现了随机现象的规律性。,掌握随机现象的规律有何作用?,掷一枚硬币的规律是:,所有可能的结果是:“正面向上”、“反面向上”,每个结果出现的概率是“二分之一”.,废话!,例:彩票中奖率为四分之一,买了10张却无一中奖.,想在事前能预料结果?想得美!,作用举例:,如:两厂生产同一种产品,甲厂次品率为0.001,乙厂次品率为0.01。在其他方面条件都相同的情况下,你会选择哪个厂家的产品?为什么?(你可能买到次品哦!),又如:明天下雨的概率是80%。“带雨具出门”与“不带雨具出门”,哪个更明智?(可能明天根本不会下雨!),再如:商店如何合理地安排售货员人数?假设任一时刻来k个顾客的概率是pk如下表给出:,第二节、概率分布,“了解”随机现象的规律是指:,明确所有可能出现的结果;,明确每个结果出现的概率.,将每个结果与一个实数对应起来,即将结果数量化.,如:观测天气时,规定:1表示晴天;,2表示阴天;,3表示下雨.,对于的数学处理办法:,如:掷一枚骰子,用1表示“掷出1点”,,用2表示“掷出2点”,,把随机现象的每个结果对应一个数,这种对应关系称为随机变量。用X,Y等表示.,如:掷一枚骰子,用随机变量X 表示掷出的点数,则,研究随机现象,总是先引入一个随机变量。其每个取值对应随机现象的一个可能结果。,X 所有可能的取值:1,2,3,4,5,6.,“X=1”表示“掷出1点”,,“X=2”表示“掷出2点”,.,又如,射击10次,用X表示命中次数,X=0,1,2,.,10.,“X=0”表示“10次射击没有一次命中”,,“了解”随机现象的规律是指:,明确所有可能出现的结果;,明确每个结果出现的概率.,“了解”随机现象的规律是指:,明确随机变量所有可能的取值;,随机变量取每个值的概率.,引入随机变量后:,转化为:,定义1.若某个随机变量,的全部可能取值是有限个或,无限可列多个,则称这个随机变量是离散型随机变量。,定义2.设离散型随机变量,的所有可能取值为,取 的概率为,,即,四、离散型随机变量,或用如下表格的形式表示,称为随机变量X 的分布列。,随机变量X 的分布列完全描述了随机现象的规律。,例:掷一枚均匀骰子,令X 表示掷出的点数,则,X 的分布列为,其分布列为,例:一骰子掷两次,用,表示所得点数之和,则,可能的取值为,所有,例:测试灯泡的寿命,用X 表示灯泡的寿命;,五、连续型随机变量,例:测试某产品的寿命,用X 表示其寿命;,例:测试上课迟到情况,用X 表示你到达教室的时间.,特点:X 的取值充满一个区间 或,X 的取值无法一一列出;,先前的分布列无用武之地.,这类问题,人们关心的重点是什么?,例:人们对产品的了解是,寿命不超过500小时的概率为0.71,寿命在500到800小时之间的概率是0.22,在800到1000小时之间的概率为0.07.,可画图示意,用矩形的面积表示相应的概率。,为了更精确,无限细分下去,得到,一条曲线,图中“曲边梯形”(阴影区域)的面积即为X 落在区间a,b上的概率.,该曲线称为随机变量X 的分布密度曲线.,曲线对应的函数称为随机变量X 的分布密度函数,记为f(x).,分布密度函数 f(x)完全描述了X 的规律.,可求X 落于任何区间的概率.,如,归一性,两大类随机变量:,(1)离散型随机变量:取值可以一一列出,,用分布列描述其规律性.,(2)连续型随机变量:取值不能一一列出,,用分布密度函数描述规律性.,今后常泛称随机变量的(概率)分布描述了其规律,这里“分布”指分布列或分布密度函数,不细区分.,(1)如何了解随机变量的概率分布;,(2)研究具体的概率分布有何性质;,“分类研究方法”:根据不同的分布分成若干类.,(3)了解了概率分布后有何用处.,类似于三角形的研究方法.,我们将介绍:正态分布、二项分布.,六、事件的独立性,总结:两个事件A,B,若其中一个事件的发生与否不影响另一个事件发生的概率,则称这两个事件是相互独立的。,可知,事件A 发生与否并不影响事件B 发生的概率.,B 表示“乙掷出偶数点”,A 表示“甲掷出偶数点”,引例 掷甲乙两枚骰子,,随机试验:从 N 个产品中任取一个产品。,令 A=取到的产品长度不合格,B=取到的产品重量不合格,,设这 N 个产品中,长度不合格的有 NA 个,重量不合格的有 NB 个,长度、重量都不合格的有 NAB 个。,我们将说明A,B 的独立性问题,并给出下面结果:,PA,B 都发生=P A 发生P B 发生,若 所有长度不合格的产品中,重量不合格产品占的比例与全体产品中重量不合格产品占的比例相等,即,A=长度不合格发生与否不影响B=重量不合格发生的概率。,反过来又如何?,说明:,同样,上式可以改写为,B=重量不合格发生与否也不影响A=长度不合格发生的概率。,说明:,A,B中任一事件发生与否并不影响另一事件发生的概率.,可知,上两式等价于,概率形式,PA,B 都发生=P A 发生P B 发生,在考试中,,表示“第i个学生得100分”i=1,2,n,则,是相互独立的。,若下面四个等式同时成立,则称A,B,C相互独立,,如果只有前三个等式成立,则称A,B,C两两相互独立。,如何理解 n 个事件相互独立的定义?,独立射击3次,每次命中率为0.6,求下列事件概率:,三次都命中;三次都不中;三次中至少命中一次.,解:,PX=3=P第一、二、三次都命中.,=P第一次命中 P第二次命中 P第三次命中,=0.63=0.216,独立射击3次,每次命中率为0.6,求下列事件概率:,三次都命中;三次都不中;三次中至少命中一次.,解:,(2)PX=0=P第一、二、三次都不中.,=P第一次不中 P第二次不中 P第三次不中,=(1-0.6)3=0.064.,(3)PX1=1-P X=0,=1-0.064=0.936.,掷2个均匀骰子,求至少出现一个6点的概率.,解:,P至少出现一个6点,=1-P不出现6点,=1-P第一骰子不出现6点,第二骰子不出现6点,=1-P第一骰子不出现6点 P第二骰子不出现6点,七、二项分布,进行n 次独立试验,每次试验只有两种可能结果。,把其中一个结果称为“成功”,另一个称为“失败”。,每次试验“成功”的概率相同,记为p,,“失败”的概率为 1-p.,令X 表示这n 次试验中“成功”的次数.,随机变量X 的分布是什么样的形式?,某人打靶单发命中率为,现独立重复射,击3 次,求恰好命中2 次的概率。,理解“恰好命中2 发”这一事件.,令X 为命中次数.,共有 种情形.,某一种情形下的概率为:,P第1、2次“成功”,第3次“失败”,=P第1次“成功”P第2次“成功”P第3次“失败”,=0.7 2(1-0.7)1,=0.7 2(1-0.7)3-2,因此,一般地,在n 次独立试验中,,令X 表示“成功”的次数.,则恰好“成功”k 次的概率为,它是X 的分布,称为二项分布.,记为,二项分布是指一类分布,n,p 是它的两个参数.,当 n,p 给定时,就是一个具体 的二项分布.,如例中,,许多随机变量都服从二项分布:,n 次独立射击,每次命中率相同,X 为命中次数.,一个硬币抛 n 次,X 为正面出现次数.,抛 n 个均匀骰子,X 为1点出现次数.,某产品的次品率为p,任取 n 个产品中的次品数X.,商店的 n 个顾客中,要求服务的人数X.,(每个顾客要求服务的概率相同,并且相互独立.),已知100个产品中有5个次品,现从中有放回地,取3次,每次任取1个,求在所取的3个中恰有2个次品,的概率.,表示所取的3个中的次品数,,,于是所求概率为,则,设,解:,一大批产品中一级品率为0.2,现随机抽查20,只,问20只元件中恰好有,为一级,品的概率为多少?,解,设,表示20只元件中为一级品的只数,,这个试验可以看作伯努利模型。,某篮球运动员,投篮命中率为0.7,现投了8次,求至少有4次投中的概率.,解,设,表示8次投篮中投中的次数,则,某人射击命中率为0.02,独立射击400次,试,求至少击中2次的概率?,解:设,表示击中的次数,则,所以分布律,则所求概率,小概率事件,不可忽视小概率事件;,反过来看,如果一个人射击400次,击中竟不到,两次,由于,很小,故怀疑“命中率,0.02”是否为真,即他的命中率不到0.02。,保险公司有10 000任参加人身意外保险.该公司规定:每人每年付公司120元,若逢意外死亡,公司将赔偿10 000元.若每人每年意外死亡率为0.006,试讨论该公司是否会亏本,其利润状况。,分析:,公司收入为 120*10 000=120万元,设,表示10 000人中意外死亡的人数,则,即,公司亏本意味着:,死亡人数超过了120人.,解:,设,表示10 000人中意外死亡的人数,则,即,解:,则公司亏本的概率为,公司不会亏本!,设,表示10 000人中意外死亡的人数,则,即,解:,则公司利润不少于40万元的概率为,公司盈利几乎是必然的!,某电话总机有1000个分机,若每个分机平均1小时有3分钟需要外线,且每个分机是否使用外线是相互独立的.问总机要安装多少条外线才比较合适。,分析:,每人都满意?(100%),1000条外线?不划算!,每人都不满意?(0%),很少的外线?抱怨!,大家都基本满意!(99%),恰当的外线数!既不浪费,又不需要等较久!,990条外线?,不是!,设,表示1000个分机中同时要外线的数目,则,即,解:,设安装N条外线保证分机以99%的概率不等待,,计算得:,P86,设发行彩票的中奖率是0.001,假定发行的彩票数量巨大,以至于不论别人是否中奖均不会改变你抽奖时的中奖率。求买n 张彩票能中奖的概率pn.另外由于中奖率是千分之一,买1000张彩票中奖概率是否接近于1.,设,表示 n 张彩票中中奖的票数,则,即,解:,设,表示n 张彩票中中奖的票数,则,即,解:,则 n 张彩票能中奖的概率为,八、正态分布,定义1 设连续型随机变量 X 的概率密度为,其中,则称 X 服从参数为,的正态分布,记为,为常数,,定义2 当,时,X 的概率密度为,则称 X 服从标准正态分布,记为,时,,可以认为,,Y 的取值几乎全部集中在,的区间内。,这在统计学上称为,准则”,当,正态分布是概率论中最重要的分布:,正态分布可以作为许多分布的近似分布,大量的随机现象都是服从或近似服从正态分布;,正态分布有许多良好的性质;,如:误差,成绩,噪音等.,如:图形特点,aX+b 等.,如:二项分布(n 较大时).,总误差由许多小误差构成.,炮弹命中目标的误差与风速,射击的方向、角度,炮弹的形状、重量,弹药的质量等多种因素有关.,可以证明:当每一个小的误差与总的误差相比可以忽略不计时,不管小的误差服从什么分布,总的误差都近似服从正态分布.,中心极限定理,一、数学期望,第三节、数学期望与方差,如何购买灯泡?,寿命越长越好!,显然,灯泡寿命是随机的,所服从分布也很难知道.,但是,如果知道平均寿命,对于随机变量来说,,有时不仅要知道它的概率分布,,还希望知道随机变量取值的“平均”大小。,如何计算随机变量的“平均取值”呢?,帕斯卡,德.梅勒,约定先赢5局,获全部赌金,A:4,B:3,费马,假设再赌一局,A赢获全赌金:1,A输获赌金:1/2,A最后获赌金:1/21+1/21/2=3/4,B最后获赌金:1/20+1/21/2=1/4,期望(提前分钱),法国数学家帕斯卡(Pascal,16231662),法国数学家费马(Fermat,16011665),法国军人德.梅勒(de Mere,16071684),1654年,帕斯卡(法国数学、物理学家),三年后,惠更斯(荷兰著名天文、物理、数学家),概率论第一本著作:论机会游戏的计算,若统计100天,每天生产的废品数 X 是一个随机变量。如何定义X,可以得到这100天中每天的平均废品数为,某车间对工人的生产情况进行考察。车工小张,的平均值呢?,分析:,可以得到n 天中每天的平均废品数为,一般来说,若统计n天,(假定小张每天至多出三件废品),由频率和概率的关系,,概率代替频率,得平均值为,在求废品数 X 的平均值时,用,我们就用这个数作为随机变量X 的平均值.,这样得到一个确定的数。,总结:,X 表示小张所出的次品数,,其概率分布为:,则以相应概率作为权的加权平均,在概率论里把这种加权平均称为数学期望。,设离散型随机变量X 的分布律为,简称期望或均值,记为 E(X).,则称级数 的和为X 的数学期望。,即,解 设试开次数为X,于是,掷一颗均匀的骰子,以 X 表示掷得的点数,,求X 的数学期望。,解 甲乙的平均环数可求得:,因此,从平均环数上看,甲的射击水平要比乙的好。,1.设C 是常数,则E(C)=C;,2.若C 是常数,则E(CX)=CE(X);,3.,二、方 差,甲、乙两个合唱队都由5名成员组成,身高如下:,甲:1.60、1.62、1.59、1.60、1.59,乙:1.80、1.60、1.50、1.50、1.60,那个合唱队演出效果好?,分析:易见,甲乙两队的平均身高都为1.60,但显然,甲队比乙队整齐,身高相对集中在1.60米左右,,演出效果好。,用什么来衡量X 与E(X)的偏离程度?,在实际问题中常常关心随机变量与均值的偏离程度,,1、,合理,但是存在正负相消,不可行;,2、,带绝对值的运算,不利于分析;,3、,采用平方是为了保证一切差值,都起正的作用.,若X 的取值比较分散,,方差刻划了随机变量的取值,若X 的取值比较集中,,则方差较小;,则方差较大.,对于其数学期望的离散程度,为X 的方差。,称,称为均方差或,标准差。,1.设C是常数,则D(C)=0;,2.若C是常数,则 D(CX)=C 2D(X);,甲、乙两人射击,他们的射击水平由下表给出:,试问那个人的射击水平较高?,解 比较量个人射击的平均环数,甲的平均环数为,乙的平均环数为,从平均环数上看,,甲、乙射击水平是一样的。,但两人射击环数的方差分别为:,这表明乙的射击水平比甲稳定。,