数理统计与计量讲义.ppt
《数理统计与计量讲义.ppt》由会员分享,可在线阅读,更多相关《数理统计与计量讲义.ppt(70页珍藏版)》请在三一办公上搜索。
1、2023/10/1,天津港湾工程质量检测中心,1,水运工程试验检测人员培训,公共基础,2023/10/1,天津港湾工程质量检测中心,2,概率与数理统计,2023/10/1,天津港湾工程质量检测中心,3,一、概率统计基础,圆的面积自由落体运动;水的沸点摄氏100度。,随机事件抛掷硬币,出现正面还是反面?车站等车人数。抽样检验。,必然事件,随机事件也是有规律的。概率统计是揭示和研究自然界和人类社会中随机现象数量规律性的一门学科。,2023/10/1,天津港湾工程质量检测中心,4,注1:可能发生的事件的全体是确定的。注2:试验(观察)是可重复的。,(1)不确定性在该现象发生之前,人们无法知道将会出现
2、那一种结果;,(2)统计规律性每一个可能结果出现的可能性的大小是确定的。数学家皮尔逊曾投掷硬币 12000次,得正面6019次;24000次,得正面12012次。,2023/10/1,天津港湾工程质量检测中心,5,二、频率与概率的统计定义,如何描述事件A出现的可能性的大小?,频率总是在某一定值附近摆动,事件A发生的频率的稳定中心P(A)称为事件A发生的概率。注1:频率与试验有关,但概率是该事件的客观属性。注2:稳定中心不是极限。注3:概率总是非负的,最大值为1,代表必然事件,最小值为0,代表不可能事件,2023/10/1,天津港湾工程质量检测中心,6,三、概率的基本计算,2023/10/1,天
3、津港湾工程质量检测中心,7,2023/10/1,天津港湾工程质量检测中心,8,2023/10/1,天津港湾工程质量检测中心,9,四、常用的几种概率,(1).均匀分布,2023/10/1,天津港湾工程质量检测中心,10,任意一次试验中,只有事件A发生和不发生两种结果,发生的概率分别是:P和1 P若在相同的条件下,进行n次独立重复试验,用X表示这n次试验中事件A发生的次数,那么X服从二项分布,其概率密度函数为:,(2).二项分布,2023/10/1,天津港湾工程质量检测中心,11,对于固定n及p,当k增加时,概率P(X=k)先是随之增加直至 达到最大值,随后单调减少.,当(n+1)p不为整数时,二
4、项概率P(X=k)在k=(n+1)p达到最大值;,2023/10/1,天津港湾工程质量检测中心,12,正态分布是应用最广泛的一种连续型分布.,正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.,德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.,(3).正态分布,2023/10/1,天津港湾工程质量检测中心,13,正态分布的定义,若X的概率密度为,记作,f(x)所确定的曲线叫作正态曲线.,其中 和 都是常数,任意,0,则称X服从参数为 和 的正态分布.,2023/10/1,天津港湾工程质量检测中心,14,正态分布 的图形特点,正态分布的密度曲线是一条关于 对
5、称的钟形曲线.,特点是“两头小,中间大,左右对称”.,2023/10/1,天津港湾工程质量检测中心,15,决定了图形的中心位置,决定了图形中峰的陡峭程度.,正态分布 的图形特点,2023/10/1,天津港湾工程质量检测中心,16,用上海99年年降雨量的数据画出了频率直方图.,从直方图,我们可以初步看出,年降雨量近似服从正态分布.,2023/10/1,天津港湾工程质量检测中心,17,下面是我们用某大学男大学生的身高的数据画出的频率直方图.,红线是拟合的正态密度曲线,可见,某大学男大学生的身高应服从正态分布.,2023/10/1,天津港湾工程质量检测中心,18,标准正态分布,的正态分布称为标准正态
6、分布.,2023/10/1,天津港湾工程质量检测中心,19,它的依据是下面的定理:,标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.,根据上面定理,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.,则,N(0,1),设,2023/10/1,天津港湾工程质量检测中心,20,利用标准正态分布函数数值表,可以解决一般正态分布的概率计算.,正态分布表,表中给的是x0时,(x)的值.,当-x0时,2023/10/1,天津港湾工程质量检测中心,21,若,N(0,1),若 XN(0,1),2023/10/1,天津港湾工程质量检测中心,22,五、
7、统计的基本概念,一个统计问题总有它明确的研究对象.,研究对象的全体称为总体(母体),,总体中每个成员称为个体.,研究某批灯泡的质量,1.总体,2023/10/1,天津港湾工程质量检测中心,23,然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.,该批灯泡寿命的全体就是总体,灯泡的寿命,2023/10/1,天津港湾工程质量检测中心,24,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体
8、数目称为样本容量.,2.样本,2023/10/1,天津港湾工程质量检测中心,25,3.总体、样本、样本值的关系,统计是从手中已有的资料-样本值,去推断总体的情况,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,2023/10/1,天津港湾工程质量检测中心,26,4.几个常见统计量,样本均值,样本方差,样本标准差,在教程中称有偏标准差,实际上,对样本容量为n的情况,当有平均值时,由其中的n1个偏差就可以推出剩下的那个偏差,因此,偏差自由度为n1,在公式中使用n1是比较合理的,特别是样本容量不大时。当样本容量很大时,使用 n1与n计
9、算出的标准差相差不大。另外,使用n1也避免了样本容量为1时还能求出标准差的情况。,极差,2023/10/1,天津港湾工程质量检测中心,27,5.参数估计,无偏估计量:一个估计量的数学期望恰好等于被估计的总体参数。样本均值就是总体均值的一个无偏估计量。实际中,由于样本容量有限,参数估计总存在偏差,所谓的无偏只是理论意义上的。比如样本均值和总体均值总存在偏差,如何来衡量这种偏差:区间估计区间估计:根据估计量的分布规律,使得总体指标U在U1,U2区间的概率 P(U1U U2)1,区间U1,U2称置信区间,1称置信系数,称置信度(常取0.05)。根据置信度求置信区间的过程就是区间估计。应用例子:由样本
10、均值估计总体均值的范围,总体,样本,(总体参数),(估计量),2023/10/1,天津港湾工程质量检测中心,28,六、常用的数理工具,1.排列图(巴雷特图、巴氏图)功能:找出主要影响因素三个分区:A区(0-80),主要影响因素B区(80-90),一般影响因素C区(90-100),次要影响因素,频率由高到低,2023/10/1,天津港湾工程质量检测中心,29,2.直方图功能:掌握质量数据的分布和估算不合格品率步骤:1)收集数据,不少于50-100个2)分析数据,计算极差R Xmax Xmin3)确定组数k和组距h,组数k根据样本容量定,hR/(k-1)4)确定组界,对于第一组:下限:Xminh/
11、2;上限:Xminh/2;,2023/10/1,天津港湾工程质量检测中心,30,判断质量分布形态,2023/10/1,天津港湾工程质量检测中心,31,3.控制图(管理图)功能:是一种动态控制方法,它可以用于辨别某过程由于异常原因引起的变化及由于偶然原因引起的变化。原理:“3 准则”,(三倍标准差原则):对于正态分布的变量,其取值几乎全部集中在区间(概率为99.74):,如果没有落在这一区间,则认为出现了异常。应用方法:以下控制线UCL和上控制线LCL取代,以中线CL取代,中线CL,下控制线UCL和上控制线LCL,为 和 的函数,应注意:,批平均值的均值,不是整体均值,批级差的均值,不是整体级差
12、,2023/10/1,天津港湾工程质量检测中心,32,七、抽样检验与评定,1.计数一次抽检评定标准:数量,基本思想:从N件(不合格品数为D)抽取n件,规定n件中允许不合格数上限为c,当不合格品数量d小于或者等于c时,认为N件产品都合格,否则不合格。表示方法:(N,n,c)接收概率:,精确方法:近似方法:,超几何分布,二项分布泊松分布,2023/10/1,天津港湾工程质量检测中心,33,抽样特征曲线:接收概率和产品不合格率之间的关系曲线。1.总是单调递减的,左高右低2.越陡峭,抽样方案越严,越平坦,方案越宽松,两种错误:1.第一种错误,将合格产品判为不合格,对生产方不利,生产风险,其概率记为2.
13、第二种错误,将不合格产品判为合格,对使用方不利,使用风险,其概率记为,2023/10/1,天津港湾工程质量检测中心,34,2.计量一次抽检评定标准:统计特征量,基本思想:从如果总体为正态分布,,,则样本为正态分布,标准差已知的一次抽样方案:最好的抽检方案,相同的样本容量n,得到最好的检验效果;相同的检验效果,只需要较少的样本容量n。,根据第一种错误概率,第二种错误概率,以及参数m0,m1,求出样本均值的范围,如果样本均值落在此范围内,则判定为合格,否则不合格,标准差未知的一次抽样方案:适用性较好;检验效果随n的增大而改善;要达到与标准差已知的一次抽样方案相同的效果,n要增至(1k2/2)倍(k
14、是合格判定系数),2023/10/1,天津港湾工程质量检测中心,35,八、一元线性回归,1.线性回归的定义:有些情况下,变量之间有确定的关系,可以用精确的表示方法来表述,但对大多数情况,变量之间存在虽有某种关系,但这种关系很难找到一种精确的表示方法来描述。这种大量存在的变量间既互相联系但又不是完全确定的关系,称为相关关系.回归分析就是研究相关关系的一种重要的数理统计方法.在回归分析中,当变量只有两个时,称为一元回归分析;当变量在两个以上时,称为多元回归分析.变量间成线性关系,称线性回归,变量间不具有线性关系,称非线性回归.,2023/10/1,天津港湾工程质量检测中心,36,2.线性回归分析的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 计量 讲义

链接地址:https://www.31ppt.com/p-6167044.html