欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第4章概率分布统计学课件.ppt

    • 资源ID:1822303       资源大小:2.33MB        全文页数:86页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第4章概率分布统计学课件.ppt

    2022-12-20,数学定律不能百分之百确切地用在现实生活里;能百分之百确切地用数学定律描述的,就不是现实生活 Alber Einstein,统计名言,第 4 章 统计推断的理论基础概率分布,4.1 度量事件发生的可能性3.2 随机变量概率分布3.3 由正态分布导出的几个重要分布3.4 样本统计量的概率分布,probability,2022-12-20,学习目标,度量事件发生的可能性概率离散型概率分布二项分布,泊松分布,超几何分布连续型概率分布正态分布由正态分布导出的几个重要分布c2-分布, t-分布, F-分布样本统计量的概率分布,2022-12-20,想过下面的问题吗?,购买一张彩票中奖的可能性有多大?购买一只股票明天上涨的可能性有多大?你投资一个餐馆盈利的可能性有多大?一项工程按期完成的可能性有多大?明天降水的可能性有多大?,2022-12-20,中奖的可能性有多大?,很多想在彩票市场上赚大钱,这可以理解,但赢得大奖的人总是少数。山东的一打工者为了碰运气,半个小时花去了1000元钱,买了500张即开型福利彩票,结果也没撞上大奖。有人曾做过统计,最赚钱的彩票,中彩的概率最高是500万分之一,有的达到1000万分之一甚至更低假定每张彩票面值是2元,大奖的奖金额是500万元,中将概率是500万分之一,你花掉1000万元购买500万张彩票,即使中了500万的大奖,你仍然亏损500万。况且,从概率的意义上看,即使你购买500万张彩票,也不能肯定就中大奖法国人就有这样的俗语:“中彩的机会比空难还少。”对于多数人来说,彩票只是一种数字游戏,是社会筹集闲散资金的一种方式,而不是一种投资,更不是赌博。相信有了本章介绍的概率方面的知识,你就不会再跟彩票较劲,2022-12-20,神州七号飞船遭遇空间碎片的概率有多大?,2008年9月25日21:10分,搭载着神舟七号载人飞船的长征二号F型运载火箭,在酒泉卫星发射中心成功发射升空 ,并在完成中国航天员首次太空行走和各项科学试验任务后,于2008年9月28日17时38分安全返回,太空中充斥着难以计数 的空间碎片,随时会给 飞船带来致命的冲击。 据中国科学院空间环境 研究预报中心预测,神 州七号载人航天飞船在 飞行期间遭遇空间碎片 的概率在百万分之一以 下,2022-12-20,神州七号飞船遭遇空间碎片的概率有多大?,空间碎片是人类空间活动的产物,包括完成任务的火箭箭体和卫星本体、火箭的喷射物、航天员的抛弃物、空间物体之间碰撞产生的碎块等,是空间环境的主要污染源。空间碎片的飞行速度平均每秒10公里,最高时速达每秒16公里。在这样的速度下,一个1厘米的碎片就可以把拥有各种防护功能的飞船打穿一个洞。航天员的舱外航天服更经不起碰撞据中国科学院空间环境研究预报中心预测专家说,世界各国联合起来对10厘米至30厘米的大块碎片进行监测,是能够发现它的轨迹的。但对于较小的碎片,人类的观测设备没有办法观测得到,因此还没有办法较为准确地掌握它的运行轨迹,只能通过它碰撞、破碎的演化规律来尽可能多地了解它的运行,2022-12-20,神州七号飞船遭遇空间碎片的概率有多大?,目前可被地面观测设备观测并测定其轨道的空间物体超过9000个,其中只有6是仍在工作的航天器,其余为空间碎片在神舟七号载人航天飞行期间,预计将有10个左右的危险时段可能会遭遇空间碎片的碰撞,只要避开这些危险时段,碰撞的概率都是在百万分之一以下。即使是在那几个危险的时段,飞船或航天员与空间碎片碰撞的概率也在万分之一以下,据中国科学院空间环境研究预 报中心专家称,这种小概率事 件意味着我们几乎可以保证飞 船不会与空间碎片相撞,4.1 度量事件发生的可能性 概率是什么? 怎样获得概率? 怎样理解概率?,第 4 章 概率分布,2022-12-20,什么是概率?(probability),概率是对事件发生的可能性大小的度量明天降水的概率是80%。这里的80%就是对降水这一事件发生的可能性大小的一种数值度量你购买一只股票明天上涨的可能性是30%,这也是一个概率一个介于0和1之间的一个值事件A的概率记为P(A),2022-12-20,怎样获得概率?,重复试验获得概率当试验的次数很多时,概率P(A)可以由所观察到的事件A发生次数(频数)的比例来逼近在相同条件下,重复进行n次试验,事件A发生了m次,则事件A发生的概率可以写为,用类似的比例来逼近一家餐馆将生存5年的概率,可以用已经生存了5年的类似餐馆所占的比例作为所求概率一个近似值,主观概率,2022-12-20,怎样理解概率?, 投掷一枚硬币,出现正面和反面的频率,随着投掷次数 n 的增大,出现正面和反面的频率稳定在1/2左右(注意:抛掷完成后,其结果就是一个数据,要么一定是正面,要么一定是反面,就不是概率问题了),4.2 随机变量的概率分布 4.2.1 随机变量及其概括性度量 4.2.2 离散型概率分布 4.2.3 连续型概率分布,第 4 章 概率分布,4.2.1 随机变量及其概括性度量,4.2 随机变量的概率分布,2022-12-20,什么是随机变量?(random variables),事先不知道会出现什么结果投掷两枚硬币出现正面的数量一座写字楼,每平方米的出租价格一个消费者对某一特定品牌饮料的偏好 一般用 X,Y,Z 来表示根据取值情况的不同分为离散型随机变量和连续型随机变量,2022-12-20,离散型随机变量(discrete random variables),随机变量 X 取有限个值或所有取值都可以逐个列举出来 x1 , x2,以确定的概率取这些不同的值离散型随机变量的一些例子,2022-12-20,连续型随机变量(continuous random variables),可以取一个或多个区间中任何值 所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点连续型随机变量的一些例子,2022-12-20,离散型随机变量的期望值(expected value),描述离散型随机变量取值的集中程度离散型随机变量X的所有可能取值xi与其取相对应的概率 pi 乘积之和记为 或E(X),计算公式为,2022-12-20,离散型随机变量的方差(variance),随机变量X的每一个取值与期望值的离差平方和的数学期望,记为 2 或D(X)描述离散型随机变量取值的分散程度计算公式为方差的平方根称为标准差,记为 或D(X),2022-12-20,离散型数学期望和方差 (例题分析),【例4-1】一家电脑配件供应商声称,他所提供的配件100个中拥有次品的个数及概率如下表。求该供应商次品数的数学期望和标准差,2022-12-20,连续型随机变量的期望和方差,连续型随机变量的期望值方差,4.2.2 离散型概率分布,4.2 随机变量的概率分布,2022-12-20,离散型随机变量的概率分布,列出离散型随机变量X的所有可能取值列出随机变量取这些值的概率通常用下面的表格来表示,P(X =xi)=pi称为离散型随机变量的概率函数pi0 ;常用的有二项分布、泊松分布、超几何分布等,2022-12-20,二项试验(Bernoulli试验),二项分布建立在Bernoulli试验基础上贝努里试验满足下列条件一次试验只有两个可能结果,即“成功”和“失败”“成功”是指我们感兴趣的某种特征一次试验“成功”的概率为p ,失败的概率为q =1- p,且概率p对每次试验都是相同的 试验是相互独立的,并可以重复进行n次 在n次试验中,“成功”的次数对应一个离散型随机变量X,2022-12-20,二项分布(Binomial distribution),重复进行 n 次试验,出现“成功”的次数的概率分布称为二项分布,记为XB(n,p)设X为 n 次重复试验中出现成功的次数,X 取 x 的概率为,2022-12-20,二项分布(期望值和方差),期望值 =E(X) = np方差 2 =D(X) = npq,2022-12-20,二项分布 (例题分析),【例4-2】已知一批产品的次品率为4%,从中任意有放回地抽 取5个。求5个产品中 (1) 没有次品的概率是多少? (2) 恰好有1个次品的概率是多少? (3) 有3个以下次品的概率是多少?,计算二项分布的概率,Excel,2022-12-20,泊松分布(Poisson distribution),1837年法国数学家泊松(D.Poisson,17811840)首次提出 用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布泊松分布的例子一定时间段内,某航空公司接到的订票电话数一定时间内,到车站等候公共汽车的人数一定路段内,路面出现大损坏的次数一定时间段内,放射性物质放射的粒子数一匹布上发现的疵点个数一定页数的书刊上出现的错别字个数,2022-12-20,泊松分布(概率分布函数), 给定的时间间隔、长度、面 积、体积内“成功”的平均数e = 2.71828 x 给定的时间间隔、长度、面 积、体积内“成功”的次数,2022-12-20,泊松分布(期望值和方差),期望值 E ( X ) = 方差 D ( X ) = ,2022-12-20,泊松分布 (例题分析),【例4-3】假定某航空公司预订票处平均每小时接到42次订票电话,那么10分钟内恰好接到6次电话的概率是多少?,解:设X=10分钟内航空公司预订票处接到的电话次数,计算泊松分布的概率,Excel,2022-12-20,超几何分布(hypergeometric distribution),采用不重复抽样,各次试验并不独立,成功的概率也互不相等总体元素的数目N很小,或样本容量n相对于N来说较大时,样本中“成功”的次数则服从超几何概率分布概率分布函数为,2022-12-20,超几何分布 (例题分析),【例4-4】假定有10支股票,其中有3支购买后可以获利,另外7支购买后将会亏损。如果你打算从10支股票中选择4支购买,但你并不知道哪3支是获利的,哪7支是亏损的。求 (1)有3支能获利的股票都被你选中的概率有多大? (2)3支可获利的股票中有2支被你选中的概率有多大?,解:设N=10,M=3,n=4,计算超几何分布的概率,Excel,4.2.3 连续型概率分布,4.2 随机变量的概率分布,2022-12-20,连续型随机变量的概率分布,连续型随机变量可以取某一区间或整个实数轴上的任意一个值它取任何一个特定的值的概率都等于0不能列出每一个值及其相应的概率通常研究它取某一区间值的概率用概率密度函数的形式和分布函数的形式来描述,2022-12-20,常用连续型概率分布,2022-12-20,正态分布(normal distribution),由C.F.高斯(Carl Friedrich Gauss,17771855)作为描述误差相对频数分布的模型而提出描述连续型随机变量的最重要的分布许多现象都可以由正态分布来描述 可用于近似离散型随机变量的分布例如: 二项分布经典统计推断的基础,2022-12-20,概率密度函数,f(x) = 随机变量 X 的频数 = 正态随机变量X的均值 = 正态随机变量X的方差 = 3.1415926; e = 2.71828x = 随机变量的取值 (- x +),2022-12-20,正态分布函数的性质,图形是关于x=对称钟形曲线,且峰值在x= 处均值和标准差一旦确定,分布的具体形式也惟一确定,不同参数正态分布构成一个完整的“正态分布族” 均值可取实数轴上的任意数值,决定正态曲线的具体位置;标准差决定曲线的“陡峭”或“扁平”程度。越大,正态曲线扁平;越小,正态曲线越高陡峭当X的取值向横轴左右两个方向无限延伸时,曲线的两个尾端也无限渐近横轴,理论上永远不会与之相交正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1,2022-12-20, 和 对正态曲线的影响,2022-12-20,正态分布的概率,2022-12-20,标准正态分布(standardize normal distribution),标准正态分布的概率密度函数,随机变量具有均值为0,标准差为1的正态分布任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布,标准正态分布的分布函数,2022-12-20,正态分布(例题分析),【例4-5】计算以下概率 (1) XN(50,102),求 和 (2) ZN(0,1),求 和 (3)正态分布概率为 0.05 时,求标准正态累积分布函数 的反函数值 z,正态分布的计算概率,Excel,2022-12-20,数据正态性的评估,对数据画出频数分布的直方图或茎叶图若数据近似服从正态分布,则图形的形状与上面给出的正态曲线应该相似绘制正态概率图。有时也称为分位数分位数图或称Q-Q图或称为P-P图用于考察观测数据是否符合某一理论分布,如正态分布、指数分布、t分布等等P-P图是根据观测数据的累积概率与理论分布(如正态分布)的累积概率的符合程度绘制的Q-Q图则是根据观测值的实际分位数与理论分布(如正态分布)的分位数绘制的 使用非参数检验中的Kolmogorov-Smirnov检验(K-S检验),绘制正态概率图,SPSS,2022-12-20,正态概率图的绘制 (例题分析),【例4-6】第2章中电脑销售额的正态概率图,2022-12-20,正态概率图的分析(normal probability plots),实际应用中,只有样本数据较多时正态概率图的效果才比较好。当然也可以用于小样本,但此时可能会出现与正态性有较大偏差的情况在分析正态概率图时,最好不要用严格的标准去衡量数据点是否在一条直线上,只要近似在一条直线上即可对于样本点中数值最大或最小的点也可以不用太关注,除非这些点偏离直线特别远,因为这些点通常会与直线有偏离。如果某个点偏离直线特别远,而其他点又基本上在直线上时,这个点可能是离群点,可不必考虑,4.3 由正态分布导出的几个重要分布 4.3.1 t 分布 4.3.2 2 分布 4.3.3 F 分布,第 4 章 概率分布,4.3.1 t 分布,4.3 由正态分布导出的几个重要分布,2022-12-20,t-分布 (t-distribution),提出者是William Gosset,也被称为学生分布(students t) t 分布是类似正态分布的一种对称分布,通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,2022-12-20,t-分布(用Excel计算t分布的概率和临界值),利用Excel中的【TDIST】统计函数,可以计算给定值和自由度时分布的概率值语法:TDIST(x,degrees_freedom,tails) 利用【TINV】函数则可以计算给定概率和自由度时的相应 语法:TINV(probability,degrees_freedom),计算t分布的临界值,Excel,4.3.2 2 分布,4.3 由正态分布导出的几个重要分布,2022-12-20,由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson) 分别于1875年和1900年推导出来设 ,则令 ,则 y 服从自由度为1的2分布,即对于n个正态随机变量y1 ,y2 ,yn,则随机变量 称为具有n个自由度的2分布,记为,c2-分布(2-distribution),2022-12-20,分布的变量值始终为正 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 期望为:E(2)=n,方差为:D(2)=2n(n为自由度) 可加性:若U和V为两个独立的2分布随机变量,U2(n1),V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布,c2-分布(性质和特点),2022-12-20,不同自由度的c2-分布,2022-12-20,c2-分布(用Excel计算c2分布的概率),利用Excel提供的【CHIDIST】统计函数,计算c2分布右单尾的概率值语法:CHIDIST(x,degrees_freedom) ,其中df为自由度,x,是随机变量的取值利用【CHIINV】函数则可以计算给定右尾概率和自由度时相应的反函数值 语法:CHIINV(probability,degrees_freedom),计算c2 分布的概率,Excel,4.3.3 F 分布,4.3 由正态分布导出的几个重要分布,2022-12-20,为纪念统计学家费希尔(R.A.Fisher) 以其姓氏的第一个字母来命名则设若U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则 称F为服从自由度n1和n2的F分布,记为,F-分布(F distribution),2022-12-20,不同自由度的F分布,2022-12-20,F-分布(用Excel计算F分布的概率和临街值),利用Excel提供的【FDIST】统计函数,计算分布右单尾的概率值语法:FDIST(x,degrees_freedom1,degrees_freedom2)利用【FINV】函数则可以计算给定单尾概率和自由度时的相应 语法: FINV(probability,degrees_freedom1,degrees_freedom2),计算F分布的概率,Excel,4.4 样本统计量的概率分布 4.4.1 统计量及其分布 4.4.2 样本均值的分布 4.4.3 其他统计量的分布 4.4.4 统计量的标准误差,第 4 章 概率分布,4.4.1 统计量及其分布,4.4 样本统计量的概率分布,2022-12-20,参数和统计量,参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值一个总体的参数:总体均值()、标准差()、总体比例();两个总体参数:(1 -2)、(1-2)、(1/2)总体参数通常用希腊字母表示 统计量(statistic)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数一个总体参数推断时的统计量:样本均值(x)、样本标准差(s)、样本比例(p)等两个总体参数推断时的统计量: (x1-x2)、(p1-p2)、(s1/s2)样本统计量通常用小写英文字母来表示,2022-12-20,样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 随机变量是 样本统计量样本均值, 样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据,抽样分布 (sampling distribution),4.4.2 样本均值的分布,4.4 样本统计量的概率分布,2022-12-20,在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础,样本均值的分布,2022-12-20,样本均值的分布(例题分析),【例4-10】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体的均值、方差及分布如下,均值和方差,2022-12-20,样本均值的分布 (例题分析), 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为,2022-12-20,样本均值的分布 (例题分析), 计算出各样本的均值,如下表。并给出样本均值的抽样分布,2022-12-20,样本均值的分布与总体分布的比较 (例题分析), = 2.5 2 =1.25,总体分布,样本均值分布,2022-12-20,样本均值的分布与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的期望值为,方差为2/n。即xN(,2/n),2022-12-20,中心极限定理(central limit theorem),从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,2022-12-20,中心极限定理 (central limit theorem),x 的分布趋于正态分布的过程,2022-12-20,抽样分布与总体分布的关系,总体分布,正态分布,非正态分布,大样本,小样本,样本均值正态分布,样本均值正态分布,样本均值非正态分布,2022-12-20,样本均值的分布样本均值的期望值和方差,样本均值的分布(数学期望与方差),4.4.3 其他统计量的分布,4.4 样本统计量的概率分布,2022-12-20,总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品) 与全部产品总数之比总体比例可表示为样本比例可表示为,样本比例的分布(proportion),2022-12-20,在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布一种理论概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似,即,样本比例的分布,2022-12-20,样本方差的分布,在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为 (n -1) 的2分布,即,4.4.4 统计量的标准误差,4.4 样本统计量的概率分布,2022-12-20,统计量的标准误差 (standard error),样本统计量的抽样分布的标准差,称为统计量的标准误,也称为标准误差衡量统计量的离散程度,测度了用样本统计量估计总体参数的精确程度样本均值和样本比例的标准误差分别为,2022-12-20,估计的标准误差 (standard error of estimation),当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误以样本均值为例:当总体标准差未知时,可用样本标准差s代替,则在重复抽样条件下,样本均值的估计标准误为,2022-12-20,Excel中的统计函数,BINOMDIST计算二项分布的概率POISSON计算泊松分布的概率HYPGEOMDIST计算超几何分布的概率NORMDIST计算正态分布的概率NORMINV计算正态分布的区间点(临界值)NORMSDIST 计算标准正态分布的概率NORMSINV计算标准正态分布的区间点(分位数)CHIDIST计算c2分布的右尾概率CHIINV计算给定c2分布的右尾概率的临界值FDIST 计算F分布的右尾概率FINV 计算给定F右尾概率的临界TDIST计算给定t值的分布概率TINV计算给定概率的t值,本章图解,2022-12-20,本章小结,度量事件发生的可能性概率离散型概率分布二项分布,泊松分布,超几何分布连续型概率分布正态分布由正态分布导出的几个重要分布c2-分布, t-分布, F-分布样本统计量的概率分布,结 束,THANKS,

    注意事项

    本文(第4章概率分布统计学课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开