欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPTX文档下载  

    平均指标和变异指标参考课件.pptx

    • 资源ID:1697226       资源大小:744.68KB        全文页数:105页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    平均指标和变异指标参考课件.pptx

    1,第一节 平均指标的概念、特点、种类,测度数据集中趋势的指标是平均指标,平均指标包括两大类:数值平均数和位置平均数。数值平均数是根据全部数据计算得到的,位置平均数是根据数据所处位置或部分指标值计算得到的;一、概念:平均指标就是反映同质总体内各单位某一数量标志值一般水平的综合指标。如:某企业的工人的平均工资可以代表这个企业工人工资收入的一般水平;全国粮食平均亩产量可以代表我国粮食生产的一般水平;,1第一节 平均指标的概念、特点、种类测度数据集中趋势的指标是,2,二、特点1、平均指标把总体各单位数量标志值之间的差异抽象化了。2、平均指标是总体各单位标志值的一般水平,反映了事物变动的集中趋势;三、种类最通常的分类:数值平均数(包括算术平均数、调和平均数和几何平均数)和位置平均数(中位数和众数);,2二、特点,3,第二节 数值平均数,一、算术平均数 (arithmetic mean)(又可分为简单算术平均数和加权算术平均数)1、计算公式:算术平均数=总体标志总量/总体单位总量注意:1)算术平均数的分子、分母是同一总体的两个总量指标,分子与分母存在着对应关系;2)算术平均数与强度相对指标虽然都是两个总量指标的对比关系,但两者存在实质差别;,3第二节 数值平均数一、算术平均数 (arithmetic,4,2、具体计算1)简单算术平均数:根据未分组整理的原始数据计算的平均值;计算公式为:式中: 代表算术平均数;x代表各单位标志值;n代表总体单位数; 是总和符号;例:某班组有10人,某日的生产量分别为14、15、16、16、18、19、20、20、22、24件,则该班组的平均每人日生产量为:(14+15+16+16+18+19+20+20+22+24)/10=18.4件;,42、具体计算,5,2)加权算术平均数:次数就是权数。根据分组整理的数据计算的算术平均数;分两种情况:单项式数列:、当权数为绝对数:式中的f代表各组变量值出现的频数;例:,52)加权算术平均数:次数就是权数。根据分组整理的数据计算的,6,根据上述资料,计算该生产小组平均日产量为:注意:简单算术平均数是这种情况的特例;、当权数为相对数:式中: 代表权数,是相对数。,6根据上述资料,计算该生产小组平均日产量为:,7,注意:权数为绝对数或相对数,计算结果是一致的;仍以上例为例:,7注意:权数为绝对数或相对数,计算结果是一致的;仍以上例为例,8,根据组距数列计算加权算术平均数:与单项数列条件下计算加权平均数的方法相同,只需要以各组的实际平均数乘以相应的权数即可;但是,在编制组距数列时,由于原始数据量很大或原始数据根本没有给出来等原因,无法计算实际的组平均数,此时,只能用组中值来代替。由于组中值来代替组实际平均数,要求组内部的标志值是均匀分布的,因此,按组中值计算的加权算术平均数只能是个近似值。组中值的含义和计算?,8根据组距数列计算加权算术平均数:与单项数列条件下计算加权,9,知识回顾:组中值:每一组标志值中点位置的数值叫组中值。该数值代表各组数值的一般水平。成立前提:变量在组内的变化是均匀的或在组中值两侧呈对称分布状态;计算方法:闭口组的组中值=(上限+下限)/2只有上限的开口组组中值=上限-相邻组组距/2只有下限的开口组组中值=下限+相邻组组距/2,9知识回顾:组中值:每一组标志值中点位置的数值叫组中值。该数,10,其计算也分两种情况: 、当权数为绝对数:其中xi代表组中值,而不是实际的变量值; fi代表每组的频数;、当权数为相对数:式中: 代表权数,是相对数。,10其计算也分两种情况:,11,例:权数是绝对数的组距数列的加权平均数的计算:,11例:权数是绝对数的组距数列的加权平均数的计算:,12,例:权数是相对数的组距数列的加权平均数的计算:,12例:权数是相对数的组距数列的加权平均数的计算:,13,3、加权算术平均数与简单算术平均数的最大区别在于:加权算术平均数受到变量值大小、次数两个因素的影响,而简单算术平均数只受变量值大小的影响。4、算术平均数的不足:容易受极端变量值的影响,使平均数的代表性变小;当组距数列为开口组时,由于组中值不好确定或不太准确,使平均数的代表性变小;,133、加权算术平均数与简单算术平均数的最大区别在于:加权算,14,5、算术平均数的数学性质(P52)(1)算术平均数与其总体单位数的乘积等于各单位标志值的总和;(2)各个变量值与其算术平均数的离差之和等于0;即:(3)各个变量值与其算术平均数的离差平方和为最小值,即 为最小值;以简单算术平均数为例证明:,145、算术平均数的数学性质(P52),15,设 为不等于 的任意数,则,15设 为不等于 的任意数,,16,二、调和平均数(harmonic mean),1、含义:是算术平均数的变形。是根据变量值的倒数计算的算术平均数的倒数,故又称倒数平均数,通常用 表示。2、计算方法:分为简单调和平均数和加权调和平均数。(1)简单调和平均数:,16二、调和平均数(harmonic mean)1、含义:是,17,先看一个例子:在菜市场上,某青菜早晨卖0.67元/千克,中午卖0.5元/千克,晚上卖0.4元/千克,请计算这种菜这一天的平均价格;1、用简单算术平均数方法计算:2、用简单调和平均数计算方法:,17先看一个例子:,18,前一种计算方法是依据早、中、晚的单价简单平均计算出来的,它只受早、中、晚单价的影响;而后一种简单调和平均数,不仅受早、中、晚不同价格的影响,还受早、中、晚买的商品重量的影响(隐含着早、中、晚各买一元钱,如果购买金额不同,则是我们后面将要讲解的加权调和平均数的概念了),所以计算出来的价格是不同的。那么那种价格更具有代表性呢?在销售量不同的情况下,应考虑销售量这个因素对平均价格的影响,因此第二种价格更具有代表性;,18前一种计算方法是依据早、中、晚的单价简单平均计算出来的,,19,再看一个例子:某市场上三种不同蔬菜的价格分别是0.5元/斤,0.8元/斤,1.0元/斤,如果每种蔬菜各买一元钱的,则平均价格是多少?即各买一元钱的蔬菜的平均价格为0.71元;注意:从这个例子我们可以体会调和平均数的经济意义。在这个例子中,平均价格=总金额/总数量,符合平均价格的基本计算公式;,19再看一个例子:某市场上三种不同蔬菜的价格分别是0.5元/,20,(2)加权调和平均数,计算公式为:,20(2)加权调和平均数,计算公式为:,21,例:根据下表某公司所属三个厂生产某种生产资料的情况,计算产品平均单位成本。,21例:根据下表某公司所属三个厂生产某种生产资料的情况,计算,22,注意两点:(1)简单调和平均数是加权调和平均数的特例;当m1=m2=m3=mn=1时,加权调和平均数就是简单调和平均数;(2)从上例可以看出,调和平均数仍然是以总体标志总量除以总体单位总数计算的,在经济内容和计算结果上与算术平均数一致,只是由于计算时依据的资料不同,而在计算公式和计算过程方面有别于算术平均数;如当m=xf时,加权调和平均数就是加权算术平均数;,22注意两点:,23,例:某公司员工工资情况如下表,请分别计算加权算术平均数和加权调和平均数;,23例:某公司员工工资情况如下表,请分别计算加权算术平均数和,24,3、调和平均数的特点如果数列中有一标志值等于0,则无法计算;4、调和平均数与算术平均数比较:方法和资料不同,调和平均数一般是分子项已知,分母项未知;算术平均数一般是分母项已知,分子项未知。,243、调和平均数的特点,25,三 几何平均数,1、含义:也称为几何均值、对数平均数,是n个变量值乘积的n次方根。当某些经济现象存在“总比率等于各个比率的连乘积”这种关系时,需要计算几何平均数。凡是变量值的连乘积等于总比率或总速度的现象都适用于计算几何平均数。最典型的两种现象是流水作业线和银行存款。请大家思考一下流水作业线的平均合格率该怎么计算?,25三 几何平均数1、含义:也称为几何均值、对数平均数,,26,2、分类及计算(1)简单几何平均数:假定有n个变量值x1,x2,x3,xn,则简单几何平均数的基本计算公式为:式中: 代表几何平均数;x代表变量值,n代表变量值的个数, 是连乘符号;,26,27,例:某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95%、92%、90%、85%、80%,整个流水生产线产品的合格率为:,27例:某流水生产线有前后衔接的五道工序。某日各工序产品的合,28,(2)加权几何平均数,计算公式为:式中的fi代表各个变量值出现的次数;例:将一笔钱存入银行,存期为10年,按复利计息。10年的利率分别为:第1年和第2年为0.05,第3年至第5年为0.08,第6年至第8年为0.10,第9年至第10年为0.12,求平均利率;年平均利率则年平均利率为:1.0877-1=0.0877,28(2)加权几何平均数,计算公式为:,29,四、几种平均数的比较算术平均数 几何平均数 调和平均数成立前提:标志值都属于正数,而且至少两个数不等;请大家用两个数的例子证明?,表示为:,29四、几种平均数的比较表示为:,例,31,第三节 位置平均数,算术平均数、调和平均数和几何平均数都是根据总体全部标志值计算的。中位数和众数不是根据全部标志值计算的,而是根据其在总体中所处的特殊位置确定或根据部分标志值(实际上也是处于特殊位置的一些标志值)计算的,因此叫位置平均数。一、分类:众数(mode)和中位数(median) ;,31第三节 位置平均数算术平均数、调和平均数和几何平均数,32,二、众数1、含义:总体中最常见的数值,也即是数列中重复出现次数最多的数值,通常用Mo表示。如果分布曲线没有明显的集中趋势或最高峰,则该变量无众数;如果分布曲线明显地存在一个众数,则称为单峰分布;如果有两个不邻近的数据具有相对较高的频数(即使频数不相等),则称为双峰分布;也有可能出现多峰分布的情形;2、适用条件:n 较多且有明显集中趋势时适合用众数作为总体一般水平。3、确定方法: (1)对于原始数据或单项式分组资料:可以直接观察,即出现次数最多的数值;,32二、众数,33,例:,33例:,34,(2)组距式分组资料:先找出 众数所在组 , 然后再用比例插值法推算众数的近似值;计算公式为:下限公式为:上限公式为:式中:L代表众数所在组下限,U代表众数所在组上限,d代表组距, 代表众数所在组次数与其下限的邻组次数之差, 代表众数所在组次数与其上限的邻组次数之差;,34(2)组距式分组资料:先找出 众数所在组 , 然后再用,G,E,F,D,C,A,B,f,X,f3,f2,f1,d,XL,XU,M0,1,2,众数的两个计算公式可以从几何图形得到证明:,GEFDCABfXf3f2f1dXLXUM012众数的两,36,例:从表上数据看,最大的频数是350,即众数组为700-800这一组,分别利用公式来计算众数:,36例:,37,课堂练习:请指出下面几组数据的众数;1、10个民工的年龄:15,19,35,38,39,42,43,45,46,52;2、某班15个学生的年龄:19,19,19,19,19,20,20,20,20,20,21,21,21,21,21;3、某部门10名员工月工资:1300,1500,1800,1800,1800,2100,2100,2100,2500,3000;,37课堂练习:请指出下面几组数据的众数;,38,注意:1、众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受各单位标志值的影响,从而增强了对变量数列一般水平的代表性。不受极端值和开口组数列的影响。2、众数是一个不容易确定的平均指标,当分布数列没有明显的集中趋势而趋均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。,38注意:1、众数是一个位置平均数,它只考虑总体分布中最频繁,39,三、中位数1、含义:把某种观察值按大小顺序排队后,处在该数列中点位置的观察值,通常以Me表示。在明显存在极端数值的情况下,用中位数比平均数更能代表总体的一般水平。2、确定方法:根据资料的分组情况不同,确定中位数可分为:未分组资料、单项式分组资料和组距式分组资料三种情况。,39三、中位数,40,(1)未分组资料:排序 确定位置(n +1)/2 (其中n为标志值的个数或总体单位数)若n为奇数项,则居中点位置的数值即为中位数; 若 n为偶数项,则居中的两个数值的平均数为中位数。例:有5个同学的年龄依次为16、17、18、19、21,则中位数的项次为(5+1)/2=3,则中位数是第三位上的标志值18岁;如果5位同学的年龄分别依次为16、17、18、21、24,则中位数是多少?如果有6个同学的年龄依次为16、17、19、20、21、23,则中位数的项次为(6+1)/2=3.5,则中位数是中间位置的两个标志值的算术平均数,即(19+20)/2=19.5;,40(1)未分组资料:排序 确定位置,41,(2)单项式分组资料:累计次数(可以向下也可以向上累积,结果一样) 确定中位数位置,当某一组的累积频数最先达到总频数的一半,即(f/2), 找出中位数:该组所对应的变量值即为中位数。例:,41(2)单项式分组资料:累计次数(可以向下也可以向上累积,,42,填好数字的表如下:计算f/2=21/2=10.5。看哪一组的累积次数先达到10.5:不论是由低到高还是由高到低,中位数都在第3组,即标志值167件为产量中位数;,42填好数字的表如下:,43,(3)组距式分组资料:前两步骤同上,找到中位数所在位置 根据公式(下限或上限)求出中位数的近似值。下限公式为:上限公式为:,43(3)组距式分组资料:前两步骤同上,找到中位数所在位置,44,式中:Me代表中位数; L代表中位数所在组的下限; U代表中位数所在组的上限; d代表中位数所在组的组距; Sm-1代表中位数所在组以下的累积次数; Sm+1代表中位数所在组以上的累积次数;请大家先试着证明?,44式中:Me代表中位数;,45,例:第一步:确定中位数位置= =1500/2=750;根据由低到高或由高到低累积次数,中位数所在的组为第四组,即700-800这一组;第二步:根据公式计算;,45例:,46,如果根据下限公式:如果根据上限公式:,46如果根据下限公式:,47,课堂作业:,47课堂作业:,48,注意:1、中位数也是一种位置平均数,它也不受极端值及开口组的影响,具有稳健性。(同众数同)2、各单位标志值与中位数离差的绝对值之和为最小值(相对于中位数和任一标志值而言)。(同算术平均数比较)3、对某些不具有数学特点或不能用数字测定的现象,可以用中位数求其一般水平。(例:印染厂对颜色的排列),48注意:1、中位数也是一种位置平均数,它也不受极端值及开口,49,四、众数、中位数和算术平均数的比较(一)算术平均数是数值平均数;(二)算术平均数和中位数在任何一组数据中都存在而且具有唯一性;(三)算术平均数只能用于定量数据,中位数适用于定序数据与定量数据,众数适用于所有数据类型;(四)算术平均数受极端值的影响,而众数、中位数则不受;(五)算术平均数可以推算总体的有关总量指标,众数、中位数则不宜;,49四、众数、中位数和算术平均数的比较,1.当总体分布呈对称状态时,三者合而为一,f如图:(六)三者的关系1.当总体分布呈对称状态时,三者合而,如图:,f,X,2. 当总体分布呈非对称状态时(P58),如图:fX2. 当总体分布呈非对称状态时(P58),如图:,f,X,如图:fX,所以,所以,一组工人的月收入众数为700元,月收入的算术平均数为1000元,则月收入的中位数近似值是:,一组工人的月收入众数为700元,月收入的算术平均数例,1.平均指标只能适用于同质总体。(同质异量),2.用组平均数补充说明总平均数。(例子),五、平均指标的运用原则,1.平均指标只能适用于同质总体。(同质异量)2.用组平均数补,某生产小组基期有工人15人,报告期人数增加到30人,两时期各技术等级的工人数和工资总额如下在下表中,每一级工的工资都涨了,但总平均工资却下降了!,某生产小组基期有工人15人,报告期人数增加到30人,,某工业部门100个企业年度利润计划完成程度资料如下:,经计算,100个企业年度平均利润计划完成程度为103.35。,3.用分配数列补充说明平均数,某工业部门100个企业年度利润计划完成程度资料如下:按计划完,58,第四节 变易指标,一、变异指标的概念:反映总体各单位标志值的差别大小程度的综合指标,又称为标志变动度。二、意义:平均指标是反映总体一般水平的综合指标,掩盖了总体各单位标志值的数量差异,而变异指标反映总体内各个观察值之间差异程度,可以说明标志值的分散程度,还可以说明平均指标代表性的大小。它与平均指标结合运用,可以达到对现象总体的全面认识。三、作用: 标志变动度是评价平均数代表性的依据。,58第四节 变易指标 一、变异指标的概念:反映总体各单,甲、乙两学生某次考试成绩列表,甲、乙两学生的平均成绩为80分,集中趋势一样,但是他们偏离平均数的程度却不一样。乙组数据的离散程度大,数据分布越分散,平均数的代表性就越差;甲组数据的离散程度小,数据分布越集中,平均数的代表性越大。,甲、乙两学生某次考试成绩列表语文数学物理化学政治英语甲 9,60,四、种类:极差、四分位差、平均差、方差和标准差、变异系数;,全距R四分位差Q.D.平 均 差A.D.标 准 差S.D.()离散系数V,60四、种类:极差、四分位差、平均差、方差和标准差、变异系数,61,五、极差1、含义:极差(R)又称全距,是总体单位各标志值中最大值与最小值之差。2、计算(1)未分组或单项分组资料(见例1): R=最大标志值-最小标志值(2)组距式分组资料:仅限于首末两组为闭口组,而且计算出来的全距要比实际全距大一些(见例2): R=末组上限-首组下限3、局限:由于极差是根据总体的极端变量值计算的,没有考虑中间变量值的变动情况,所以不能全面反映总体各个变量值的离散程度。因此,其应用受到局限。在实际中,仅限于检查产品质量的稳定性等,应用范围很小。对于开口组,无法计算全距。,61五、极差,62,例1:有两个学习小组的学习成绩分别为:甲组:60 70 80 90 100乙组:78 79 80 81 82 两组的平均成绩都是80分,通过平均成绩的计算看不出两组学生的成绩差别,但计算全距:R甲=100-60=40分,而R乙=82-78=4分,因此通过全距的计算,可以判定:乙组的平均成绩更能代表乙组学生的成绩水平;,62例1:有两个学习小组的学习成绩分别为:,63,例2:给定下列数据:根据未分组资料计算全距:R=最大标志值-最小标志值=139-107=32对上面数据进行组距分组的方法?,63例2:给定下列数据:,64,第一步:对数值进行大小排序;第二步:确定全距:139-107=32;第三步:用经验公式确定组数:m=1+lg50/lg2(约)=7第四步:确定组距:=全距/组数=32/7 (约)=4.6;为便于计算统计,也为了与组限的确定(以尾数5或0)衔接,确定组距为5;第五步:确定组限;第一组的下限应低于最小变量值(本例中为107),故第一组的下限取为105;最后一组的上限应大于最大变量值(本例中为139),故最后一组的上限取为140;,64第一步:对数值进行大小排序;,65,组距分组的结果如下:根据组距分组结果运用公式计算:全距=末组上限-首组下限=140-105=35,65组距分组的结果如下:, 根据未分组资料求Q.D.,2.计算:,1.概念: 将总体各单位的标志值按大小顺序排列,然后将数列分为四等分,形成三个分割点(Q1、Q2、Q3),这三个分割点称为四分位数,(其中第二个四分位数Q2就是数列的中位数Me)。 四分位差 Q.D.=Q3-Q1,六、四分位差Q.D.P113, 根据未分组资料求Q.D.2.计算:1.概念: 将总体各单,例,68,当n+1不能被4整除时的处理方法:如一列数:1,1,2,7,9,11,16,21;Q1的位置=(8+1)/4=2.25;这时Q1的计算方法为:整数部分即第2的数1+第3个数与第2个数的差的0.25,Q1为1.25;同理计算Q3;,68当n+1不能被4整除时的处理方法:, 根据分组资料求Q.D.,2) 若单项数列,则Q1与Q3所在组的标志值就是Q1与Q3的数值;,若组距数列,确定了Q1与Q3所在组后,还要用以下公式求近似值:, 根据分组资料求Q.D. 2) 若单项数列,则Q1与Q3所,平均指标和变异指标参考资料,根据某车间工人日产零件分组资料,求Q.D.,这表明有一半工人的日产量分布在11.41件至17.36件之间,且相差5.95件。,根据某车间工人日产零件分组资料,求Q.D.按日产零件分组(件, 四分位差不受两端各25%数值的影响,能对开口组数列的差异程度进行测定;, 用四分位差可以衡量中位数的代表性高低;该数值越大,表明Q1Q2之间变量值分布越远离它们的重点Q2,即远离中位数,则说明中位数的代表性越差;该数值越小,则说明中位数的代表性越好;, 四分位差不反映所有标志值的差异程度,它所描述的只是次数分配中一半的离差,所以也是一个比较粗略的指标。,3. 四分位差的特点, 四分位差不受两端各25%数值的影响,能对开口组数列的差异,73,七、平均差1、含义:平均差是总体各单位标志值与其算术平均数离差绝对值的平均数,通常用A.D表示。平均差是各标志值对平均数的平均距离,其数值越大,说明标志值的差异程度越大,各标志值的分布也越分散;请大家根据定义来计算下列一组数据的平均差:5,7,8,10,20;?,73七、平均差,74,2、计算: (1)未分组资料: 采用简单平均差方法,计算公式为: 以上面所给数据5,7,8,10,20来计算:第一步:计算平均数=10;第二步,用各标志值减平均数得到离差,分别为:-5,-3,-2,0,10;第三步,对离差取绝对值,得到:5,3,2,0,10;第四步:用离差绝对值之和除以离差的个数,即得到简单平均差A.D=(5+3+2+0+10)/5=4;,742、计算:,75,(2)单项式分组和组距式分组资料:采用加权平均差方法,计算公式为:例1:单变量分组示例:,75(2)单项式分组和组距式分组资料:采用加权平均差方法,计,76,第一步,计算平均数:第二步:计算平均差:,76第一步,计算平均数:,77,例2 组距数列计算平均差,例如:某企业一生产车间100名职工日产量资料分组如下。日产量(件) 人数(人)组中值(件) 离差 离差绝对值 离差绝对值*人数515 10 10 -16 16 1601525 35 20 -6 6 2102535 40 30 4 4 1603545 15 40 14 14 210合计 100 740平均数A=xf/f=2600/100=26(件)平均差A.D=740/100=7.4(件),77例2 组距数列计算平均差例如:某企业一生产车间100名,78,八、方差与标准差1、方差与标准差(1)含义:方差( )是总体各单位标志值与其算术平均数离差的平方的算术平均数。标准差( )是方差的平方根,故又称均方差。由于其计算结果一般稍大于平均差,这对于在抽样估计时,提高推断的把握程度具有一定的意义,因此标准差是应用最广泛的标志变异指标;(2)计算:A、未分组资料:(简单法),计算公式为:,78八、方差与标准差,79,例:某汽车销售商2004年1-6月的宝马汽车销售量分别为:120、125、128、130、135、142;计算其销售量的标准差与方差;计算平均数:计算方差:计算标准差:,79例:某汽车销售商2004年1-6月的宝马汽车销售量分别为,80,B、分组资料:(加权法) 计算步骤:平均数 离差 离差平方乘以次数 代入公式得到标准差。计算公式为:,80B、分组资料:(加权法),81,例:,81例:,82,2、是非标志的标准差A、什么是是非标志:在对经济现象进行分析时,常把其全部单位划分为具有某种属性和不具有某种属性的两组,例如,将学生按性别划分为“男”、“女”,将产品划分为“合格”、“不合格”两组,由于这些反映单位属性或性质的标志不是数量标志,而是质量标志,且只有“是”与“非”两种表现,所以称之为“是非标志”,有时也称为“交替标志”。在进行抽样推断时,是非标志的标准差有着重要的意义。,822、是非标志的标准差,83,B、成数:在总体中,是非标志只具有两种表现,把具有某种表现或不具有某种表现的单位数占全部总体单位数的比重称为成数。用字母表示为: P=N1/N 或Q=N0/N,P+Q=1或Q=1-P例:某公司进口一批彩电共1000台,其中合格品980台,不合格20台,合格品占全部产品的98%,不合格产品占全部产品的2%。在这里,98%、2%都是成数,98%+2%=1;,83B、成数:在总体中,是非标志只具有两种表现,把具有某种表,84,C、成数的平均数是非标志表现了现象质的区别,因此计算平均数首先要把是非标志的两种标志表现进行量化处理。一般以1表示具有某种标志表现,以0表示另外相对的那种标志表现,然后再根据平均数计算公式进行计算。练习:某公司进口一批彩电共1000台,其中合格品980台,不合格20台,合格品占全部产品的98%,不合格产品占全部产品的2%。请计算合格品的平均数;,84C、成数的平均数,85,解:先对两种标志表现进行量化处理,即赋值,我们用1代表合格,0代表不合格;注意:1、是非标志的平均数就是具有某种标志表现的单位数占总体单位数的比重,即成数P。2、一般我们将所研究、关注的标志的标志表现赋值为1(这点将在计算成数的标准差时应用);,85解:先对两种标志表现进行量化处理,即赋值,我们用1代表合,86,D、成数的标准差:其计算根据标准差的计算公式:注意:是非标志的标准差为具有被研究的标志表现的成数P与不具有该标志表现的成数(1-P)乘积的平方根;在上面公式的推导中,平均数取的是P,而在上例中Q是不合格产品的平均数,也是平均数之一,如果平均数取Q,请大家试着计算?例:对前面那个例子,其是非标志的标准差为,86D、成数的标准差:其计算根据标准差的计算公式:,87,3、方差的主要数学性质(1)常数的方差等于0;(2)变量的线性函数的方差等于变量系数的平方乘以变量的方差。设a、b为常数,y=a+bx,则有(3)分组条件下,总体方差等于组间方差与各组组内方差的平均数之和;,873、方差的主要数学性质,88,4、标准化值也称标准分数,给出某一个值在一组数据中的相对位置,可用于判断一组数据是否有离群点;计算公式为,884、标准化值, 与R的关系, 与A.D.的关系,经验表明,当分布数列接近于正态分布时,R和之间存在以下经验公式:R为4至6个: 当标志值项数较少时,R4 当标志值项数较多时,R6,对同一资料,所求的平均差一般比标准差要小,即A.D. ,5、标准差与全距、平均差的关系, 与R的关系 与A.D.的关系 经验表明,当分布,90,九、离散系数(变异系数)1、含义:是指用变异指标与其相应的平均指标对比,反映总体各单位标志值之间离散程度的相对指标,一般用V表示。2、作用:变异系数消除了计量单位不同与平均水平高低的影响,具有广泛的可比性,其数值的大小与平均数的代表性成反比。变异系数大,则平均数代表性弱;变异系数小,则平均数代表性强。,90九、离散系数(变异系数),91,3、种类:全距系数、平均差系数、标准差系数,其中,标准差系数是最常用的变异系数;4、标准差系数的计算:总体标准差系数计算公式为:,913、种类:全距系数、平均差系数、标准差系数,其中,标准差,92,练习1:某地区连续100天的交通事故次数统计资料如下表,计算该地区日交通事故的极差、标准差及标准差系数;,92练习1:某地区连续100天的交通事故次数统计资料如下表,,93,解:,93解:,94,练习2:某工厂对某日生产的100袋奶粉进行检验,检验结果如下表。按照该工厂的质量标准,每袋奶粉的重量不足99克为不合格产品,请根据所给数据计算:(1)计算奶粉的平均重量,并计算重量极差、及标准差系数;(2)计算奶粉的不合格品率及不合格品率的标准差;,94练习2:某工厂对某日生产的100袋奶粉进行检验,检验结果,95,解:,95解:,96,练习1:某机械厂铸造车间生产900吨铸件,合格品810吨,试求平均合格率、标准差及标准差系数;,96练习1:某机械厂铸造车间生产900吨铸件,合格品810吨,97,第五节 分布偏态与峰度的测度指标,一、偏态及其测度指标二、峰度及其测度指标,97第五节 分布偏态与峰度的测度指标一、偏态及其测度指标,98,偏态与峰度分布的形状,偏态,峰度,98偏态与峰度分布的形状扁平分布尖峰分布偏态峰度左偏分布右偏,99,农村居民家庭村收入数据的直方图,偏态与峰度(从直方图上观察),按纯收入分组(元),结论:1. 为右偏分布 2. 峰度适中,99户数比重252015105农村居民家庭村收入数据的直方图,100,一、偏态及其测度指标,(一)偏态 1、概念要点(1)数据分布偏斜程度的测度(2)偏态系数=0为对称分布(3)偏态系数 0为右偏分布(4)偏态系数 0为左偏分布2、计算公式,100一、偏态及其测度指标(一)偏态 1、概念要点,101,一、偏态及其测度指标,【例】已知1997年我国农村居民家庭按纯收入分组的有关数据如表。试计算偏态系数,101一、偏态及其测度指标【例】已知1997年我国农村居民家,102,一、偏态及其测度指标,102一、偏态及其测度指标农村居民家庭纯收入数据偏态及峰度,103,一、偏态及其测度指标,根据上表数据计算得,将计算结果代入公式得,结论:偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大,103一、偏态及其测度指标根据上表数据计算得将计算结果代入公,104,二、峰度及其测度指标,(一)概念要点数据分布扁平程度的测度;如果峰度系数=3,则扁平程度适中;偏态系数3为尖峰分布 (二)计算公式,104二、峰度及其测度指标(一)概念要点,105,二、峰度及其测度指标,代入公式得,【例】根据表中的计算结果,计算农村居民家庭纯收入分布的峰度系数。,结论:由于=3.43,说明我国农村居民家庭纯收入的分布为尖峰分布;,105二、峰度及其测度指标代入公式得 【例】根据表中的计算结,

    注意事项

    本文(平均指标和变异指标参考课件.pptx)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开