数理统计(1.概率部分复习).ppt
2023/11/14,1,数理统计(工科研究生课程),主要内容:概 率 论 基 本 内 容 复 习(2学时)数 理 统 计 基 本 概 念(4学时)参 数 估 计(4学时)假 设 检 验(6学时)回 归 分 析(8学时)方 差 分 析(6学时)试验设计初步(4学时),2023/11/14,2,目的和要求,学习并掌握数理统计的基本内容,理论和方法学会用相应的统计方法分析和解决实际问题了解和掌握一些常用的统计工具,2023/11/14,3,1.概率的计算与性质,2.常见的概率分布及其问题背景,3.大数定律与中心极限定理,第部分:概率论基本内容,2023/11/14,4,1.概率的计算与性质,概率的计算途径通常有以下几种:古典概率计算几何概率计算利用频率(统计定义)主观概率,2023/11/14,5,1.1 古典概率计算,计算公式:,注意:1.使用该公式计算概率要求样本空间具有等可能的有限个样本点.2.n 和m 的计算通常需要利用排列组合知识.,2023/11/14,6,经典古典概率问题主要有:德.梅尔(掷骰子)问题生日问题(分房问题)抽球问题产品抽样 等等,2023/11/14,7,1.2 几何概率计算,计算公式:,注意:1.使用该公式计算概率要求样本空间中的样本点具有等可能性且充满一个几何体.2.分别表示相应几何体的度量.,2023/11/14,8,1.3 利用频率,用,作为概率P(A)的近似值.,注意:1.使用该公式得到的值只是概率的近似值,因此通常用于对随机现象没有更多了解时的情况.2.频率与试验次数n有关.但是频率和概率不具备普通极限意义上的收敛关系,而是依概率收敛(大数定律).,2023/11/14,9,1.4 主观概率,目前一个非常值得注意的研究方向,其哲学理念可以表述为”概率是人们对事件发生可能性的一种判断,与人们的主观意念有关”.对于随机现象不能重复试验的问题,可以利用专家经验并根据对问题的观察判断给出事件发生可能性的估计.,2023/11/14,10,1.5 概率的性质及常用公式,前苏联数学家柯尔莫哥洛夫1933年给出了概率的公理化定义,由此可以得到概率的诸多性质:如不可能事件的概率为零,有限可加性,逆事件的概率,单调性等等.在复杂事件的概率计算中,常用到加法公式,乘法公式,全概率公式,贝叶斯公式等等.,2023/11/14,11,2.常见的概率分布及其问题背景,常用的概率分布有:二项分布 泊松分布均匀分布指数分布正态分布,2023/11/14,12,2.1 二项分布,二项分布的实际背景是伯努利概型,即:每次试验只有两个结果A与,且P(A)=p,进行n次独立重复的试验,考虑事件A发生k次的概率.,2023/11/14,13,一般来说,可以首先设则 服从二项分布.,这样做的好处在于把二项分布变量分解为n个两点分布变量的独立和,在许多场合可以使得问题变得简单.,2023/11/14,14,例 某计算机主机有100个终端,每个终端有80%的时间被使用.若每个终端是否被使用是独立的,求至少有15个终端空闲的概率.设则100个终端被使用的数目是由中心极限定理,至多有85个终端被使用的概率是,2023/11/14,15,2.2 泊松分布,泊松分布主要用于描述单位时间内某种事件发生次数比较稀少的情况.某地区一年内重大自然灾害发生的次数;某商店在一周内销售的某种贵重商品数量;某电话总机一分钟内接到的呼叫次数;某种放射性物质在一秒钟内放射出的粒子数;等等 另外应注意,二项分布问题当n很大,p比较小时,可以利用泊松分布来近似计算概率.,2023/11/14,16,2.3 均匀分布,均匀分布的实际背景是几何概率问题,要求的条件是随机变量的取值充满一个几何空间,且取值其每一点的可能性相同.体现了”均匀”的性质.这是连续型分布中比较简单的一种分布,也是一种基本的分布,许多分布都可以由均匀分布利用一些变换和中心极限定理得到.,2023/11/14,17,2.4 指数分布,指数分布主要用于描述寿命问题,如电子产品的使用寿命,某些生物的寿命,服务台的等待时间等问题,有着广泛的应用.,注意:指数分布与其他分布的关系,如 分布,泊松分布,正态分布等.,2023/11/14,18,2.5 正态分布,正态分布是所有分布中最为重要的一个分布,实际背景极为广泛,如成绩分布,身高(某个年龄)分布,测量误差分布等等.在满足一定条件下是许多分布的极限分布(中心极限定理).密度函数具有很好的性质,概率计算最终归结为查表.,2023/11/14,19,3.大数定律与中心极限定理,大数定律主要揭示满足一定条件的随机变量序列,其平均 的渐近性质.中心极限定理描述了满足一定条件的随机变量,其独立和 的极限分布.,2023/11/14,20,3.1 大数定律,贝努利大数定律:设 为n重贝努利试验中事件A发生的次数,p为每次试验中A出现的概率,则对任意的,有,其意义是:频率将以概率收敛与概率.,2023/11/14,21,3.2 中心极限定理,林德贝格-勒维中心极限定理:设 是独立同分布的随机变量序列,且则对任意实数y,有,2023/11/14,22,隶莫夫-拉普拉斯中心极限定理:设 为n重贝努利试验中事件A发生的次数,p为每次试验中A出现的概率,则对任意实数y,有,2023/11/14,23,练习题,1.已知某产品的合格率是98%,现有一检查系统,它对合格品能以0.98的概率判断正确,对不合格品检查时,有0.05的概率会判错.求该系统错判的概率.,2023/11/14,24,2.一学生接连参加同一课程的两次考试.第一次及格的概率是p,若第一次及格则第二次及格的概率也为p;若第一次不及格则第二次及格的概率为p/2.(1)如果至少有一次及格他就能获得某种资格,求他取得该资格的概率.(2)如果已知他第二次已经及格,求他第一次及格的概率.,2023/11/14,25,3.有一大批产品,其验收方案如下:先作第一次检验,从中任取10件产品,经检验无次品接受这批产品,次品数大于2拒收;否则作第二次检验,其做法是再从中任取5件产品,仅当其中无次品时接收.若产品的次品率是10%,求(1)这批产品经第一次检验就能接收的概率.(2)需做第二次检验的概率.(3)这批产品若按第二次检验的标准能被接收的概率.(4)产品在第一次检验未能作出决定且第二次检验时通过的概率.(5)这批产品被接收的概率.,2023/11/14,26,4.设顾客在某银行的窗口等待服务的时间X(以分计)服从指数分布,密度函数为 Fx(x)=0.2exp(-x/5)(x0)某顾客在窗口等待服务,若超过10分钟,他就离开.他一个月要到银行5次,以Y表示一个月内他未等到服务而离开窗口的次数.写出Y的分布律并求P(Y1).,2023/11/14,27,5.一家公司在招收职员时,首先要通过两项能力测试,在A项测试中,平均分是100分,标准差是15分;在B项测试中,平均分是400分,标准差是50分.一位应试者在A项测试得分115分,B项得分425分,问他的哪一项成绩更好一些?,注意:这类问题要转化为标准分才可以比较.,A项的标准分为1分,B项的标准分为0.5分.故A项成绩要好一些.,2023/11/14,28,6.某公司决定给职员发放“销售代表奖”,计划根据过去一段时期内的销售状况对月销售额最高的5%的职员发放奖金.已知这段时期职员的月销售额服从均值40000,方差360000的正态分布.问应把“销售代表奖”的最低发放标准定为多少元?(相当于划分数线),2023/11/14,29,7.某中外合资公司准备通过考试招工200名,其中180名正式工,,20名临时工.报考人数为1684名,考试满分为300分.阅卷后人事部门公布了如下信息:平均成绩是178分,270以上的高分有32名.考生小王成绩是233分,他能否被录取?如被录取能否是正式工?,2023/11/14,30,8.电视台需作节目A 收视率的调查.每天在播电视的同时,随机地向当地居民打电话询问是否在看电视.若在看电视,再问是否在看节目A.设回答看电视的居民户数为 n.若要保证以 95%的概率使调查误差在10%之内,n 应取多大?若使调查误差在1%之内,n 又取多大?每晚节目A 播出一小时,调查需同时进行,设每小时每人能调查20户,每户居民每晚看电视的概率为70%,电视台需安排多少人作调查.,2023/11/14,31,9.仓库有100件商品,市场需求服从U80,120,(1)求供应量不能满足需求量的概率;(2)求平均销售量;(3)求出销售量的分布函数.,2023/11/14,32,解:即求需求D100的概率.设销售量为X,求E(X),注意X为D的函数,即求随机变量函数的期望.求销售量X的分布函数,利用X与D的函数关系,直接利用分布函数的定义求出.结果是一个非离散非连续的随机变量的分布函数.,