《统计学第4章变量数列上.ppt》由会员分享,可在线阅读,更多相关《统计学第4章变量数列上.ppt(38页珍藏版)》请在三一办公上搜索。
1、第四章 变量数列分析,第一节 集中趋势的测度一、平均指标的概念和作用(一)平均指标的概念 P108例:某车间有三名职工,其年龄分别为20、40和54岁。则其平均年龄为:(20+40+54)3=38(岁)(二)平均指标的特点.平均指标将总体各单位标志值的差异抽象化,掩盖了各单位之间的具体差异,反映总体的综合数量特征。2.平均指标是一个代表值,代表总体各单位标志值的一般水平。,(三)平均指标的作用 了解 P109,二、数值平均数和位置平均数 数值平均数是根据总体各单位的标志值计算而来,具体包括算术平均数、调和平均数和几何平均数。位置平均数是根据标志值所处的位置来确定,主要包括众数和中位数。(一)数
2、值平均数的计算 1.算术平均数 算术平均数是平均指标中最常见,也是最重要的平均数,其应用最为广泛。它是总体标志总量与总体单位总量的比值。其基本公式为:,【例】甲公司有职工100人,5月份发放工资总额为230000元,求职工平均工资。职工平均工资=230000/100=2300(元/人)利用公式计算时应注意:课本P109 各变量值必须是同质的,分子、分母同属于同一总体,即分子是分母所具有的标志值,分母是分子的承担者。,算术平均数有两种计算形式:简单算术平均数和加权算术平均数。,(1)简单算术平均数的计算 简单算术平均数就是根据已有的资料,将总体各学位的标志值直接相加求出标志总量,然后除以总体单体
3、数。其计算公式为:,简单算术平均数适用于总体未分组的统计资料。如果已知总体各单位的标志值和总体单位数,可采用简单算术平均法计算平均值。,【例】某车间有五名职工,其月工资分别是:2500元、2520元、2550元、2580元、2600元。则其平均工资为:,(2)加权算术平均数 统计资料经过分组,编制变量数列后应采用加权平均法计算平均数。其计算公式为:,式中 f代表权数,即变量值出现的次数。从上式可以看出:加权算术平均数的大小不仅取决于总体各单位变量值的大小,而且受各变量值出现的频数的影响。某组频数大,说明分布在该组的变量值较多,那么该组变量值对算术平均数的大小影响就大,反之就小。因此把频数称为权
4、数。由于分组数列有单项数列和组距数列两种形式,所以计算加权算术平均数又分根据单项数列计算加权算术平均数和根据组距数列计算加权算术平均数两种。根据单项数列计算加权算术平均数,【例514】甲车间有20名工人,按其每日生产零件数编制数列如下,求该车间工人平均日产量。,即甲车间工人的平均日产量为22.6件/人。计算加权算术平均数也可以采用频率作权数,在同一个分组数列中,二者计算结果完全相同。【思考】根据上例资料,请用频率作权数计算甲车间工人平均日产量,并比较二者计算结果是否相同?,根据组距数列计算加权算术平均数 根据组距数列计算算术平均数时,按理应先计算各组的平均数,但在实际工作中为简化计算是以各组的
5、组中值代替各组的变量值,再按上述单项数列计算平均数的方法来计算。,【例】甲车间有30名工人,按其日产产品数分组如下表,求该车间工人的平均日产量。,即甲车间工人的平均日产量为80件/人。,注意:以各组组中值来代替各组的变量值会产生误差,所以,由组距数列计算的加权算术平均数只是实际平均数的近似值或大约数。,(二)调和平均数,调和平均数是变量数列中各变量值倒数的算术平均数的倒数。它是根据变量值的倒数计算的,故又称倒数平均数,通常用字母H表示,但计算结果并不是算术平均数的倒数。在社会经济统计中,往往因为缺少总体单位数资料,不能直接采用算术平均法计算平均值,这时,就需要把算术平均数的形式加以变形,而采用
6、调和平均法进行计算。因此在统计工作中,调和平均数常常被作为算术平均数的变形来使用。调和平均数有简单调和平均数和加权调和平均数两种形式。,【例516】某种苹果在甲、乙、丙三个市场上的销售价格分别为4元/公斤、4.5元/公斤和5元/公斤。如果在三个市场各销售1元钱的苹果,试计算苹果的平均销售价格?,即苹果的平均销售价格为4.46元/公斤。2.加权调和平均数 在统计资料分组的情况下,很多时候由于只掌握每组标志值的总和(m)而缺少总体单位数(f)的资料,不能直接采用加权算术平均法计算平均数,则应采用加权调和平均法予以计算。,在统计工作中,加权调和平均数是作为加权算术平均数的一种变形来使用的,在经济内容
7、和计算结果上与加权算术平均数一样,加权调和平均数和加权算术平均数的计算公式可以相互推算,前者是后者的变形。,【例】2012年2月,A企业把全部工人按日产产品量分组如下,试计算该企业工人的平均日产量。,应用平均指标必须注意的问题:计算和应用平均指标,必须注意总体的同质性;用组平均数来补充说明总体平均数;计算和运用平均数时,要注意极端数值的影响。因为算术平均数受极端数值的影响很明显。,强度相对指标与平均指标的区别:()指标的含义不同。强度相对指标说明的是某一现象相对于另一现象发展的强度、密度或普遍程度;而平均指标说明的是现象发展的一般水平。()计算方法不同。强度相对指标是两个不同总体但有联系的指标
8、之间的比例关系,即分子、分母属于两个不同的总体,分母中的个体不一定都具有分子上的标志值。如:人均粮食产量=粮食总产量/总人口数(有些人不生产粮食)人均国民生产总值=国民生产总值/总人口数(有些人如婴儿没有产值)。平均指标是在同一总体内标志总量和单位总量的比例关系,分母中的个体都具有分子上的标志值,如:M车间职工的平均工资=M车间职工总工资/M车间职工人数 M车间职工的平均年龄=M车间职工总年龄/M车间职工人数 分子、分母都是指M车间,且分母的每位职工都有自己的工资、年龄。,3.几何平均数,几何平均数是另一种计算平均标志值的平均数。它是计算平均比率和平均速度常用的一种方法。几何平均数不同于算术平
9、均数和调和平均数,它是n个变量值连乘积的n次方根,用字 母G表示。几何平均数也分简单几何平均数和加权几何平均数两种。1.简单几何平均数 简单几何平均数是n个变量值连乘积的n次方根,适用于计算未分组资料的平均比率或平均速度。,【例】丙产品的生产需要经过A、B、C三道工序的连续加工,这三道生产工序的产品合格率依次分别为80、90和95。试计算整个生产过程产品的平均合格率。对于这个问题,不能采用算术平均数和调和平均数法进行计算,而应采用几何平均数。假设最初投产1个产品,则:经过第一道工序加工后,合格品为:10.8;再经过第二道工序加工后,合格品为:10.80.9 最后经过第三道工序加工后,合格品为:
10、10.80.90.95 整个生产过程产品的平均合格率为:,2.加权几何平均数当计算几何平均数的每个变量值次数不同时,则应采用加权几何平均数,它适用于频数分布资料计算平均比率或平均速度。其计算公式为:,【例】假设有一笔期限为20年的投资按复利计算收益,前10年的年利率为10,中间5年的年利率为8,最后5年的年利率为6,试计算整个投资期内的年平均利率。在计算平均年利率时,根据研究对象的性质必须先将各年利率加100换算成各年本利和,然后,按加权几何平均法计算年平均利率。假设存入一元钱,第一年末本利和为:1(1+10%);第二年末本利和为:1(1+10%)(1+10%);第三年末本利和为:1(1+10
11、%)(1+10%)(1+10%).,几何平均数的特点:P117(二)位置平均数的计算 常用的位置平均数有众数和中位数。由于众数和中位数是根据标志值所处的位置确定的,因此,称为位置平均数。1.中位数 中位数是指将总体各单位的标志值按照从大到小(或者从小到大)的顺序排列,处于中间位置的那个变量值。中位数的大小不受极端数值的影响。,则整个存期内,平均年利率为:,确定中位数时,必须将总体各单位的标志值按大小顺序排列。根据不同的资料,中位数的计算有以下三种情况:(1)根据未分组的资料确定中位数在资料未分组的情况下,先将总体各单位的标志值按大小顺序排列,然后,按下面公式确定中间位置,即中位数位置。公式为:
12、,式中:n为总体单位数 如果总体单位数(n)为奇数,则居于中间位置点的标志值就是中位数。如果总体单位数(n)为偶数,则中位数为中间位置点的两个标志值的算术平均数。,【例】某工厂有甲、乙两个车间,工人人数(n)依次分别为9人和10人,工人每日生产产品数已按大小顺序排列如下表,求两组工人日产量的中位数。工人生产产品零件数,甲车间中位数的位置在(9+1)/2=5即甲车间第五位工人的日产量“17件”为所求的中位数。乙车间中位数的位置在(10+1)/2=5.5即乙车间的中间位置为第五和第六两个,则:中位数=(16+18)/2=17(件),中位数的作用,可以替代平均数,反映总体各单位标志值的一般水平。如果
13、总体各单位的标志值呈等差分布,则:中位数=平均数 如上例中的甲车间,工人日产量呈等差分布 工人日产量的平均值为:(13+14+15+16+17+18+19+20+21)/9=153/9=17(件)=中位数,(2)根据单项数列计算中位数 根据单项数列计算中位数,步骤为:(a)计算各组的累计次数(采用向下累计或向上累计均可);(b)确定中位数的位置(f/2);(c)根据中位数位置对照累计次数来确定中位数所在的组,中位数所在组对应的标志值就是中位数。举例如下:【例523】甲车间有50名工人,按其每日生产零件数编制数列如下。试确定该车间工人日产量的中位数。,中位数位置=f/2=50/2=25。第25位
14、落在第三组(向上累计次数为37,向下累计次数为43)因此,第三组对应的变量值“28件”即为中位数。,(3)由组距数列确定中位数对组距数列计算中位数比较复杂,需要分以下两步进行:(1)利用f/2确定中位数所在的组,该组的上、下限规定了中位数的取值范围。(2)假定中位数组内各单位的标志值是均匀分布的,用比例插值法计算中位数的近似值。计算公式为:,【例】某城市就居民家庭年收入情况进行了抽样调查,具体资料如下表所示。要求:计算该市居民家庭年收入的中位数。,根据上表,组距数列的中位数位置为:f/2=1000/2=500,这说明第3组(年收入为2000030000元)为中位数组。,中位数的主要特点 P12
15、1,1.中位数是一个位置代表值,不受极端数值的影响。2.中位数的取值只与处于中间位置的一个或两个标志值有关,利用信息不充分。,2.众数 P121,概念:众数是指在一个统计总体或分配数列中出现次数最多、频率最高的那个标志值(或属性表现)。例如,同一种商品在市场上经常有多种售价,成交数量最多的那个价格就是该种商品价格的众数;用众数来反映总体的一般水平成或集中趋势,具有非常直观的代表性意义;并且,众数不仅可以对数量标志来计算,还可以对品质标志来确定。例如,销售数量最多的服装款式或色彩,也即通常所谓的“流行款式”或“流行色”,也属于这种意义上的众数。作用:众数可以近似地代表现象的一般水平。通常,如果只
16、要求掌握一般的、常见的变量值作为研究问题时的参考,就可以不计算其平均数,而采用众数来代替平均数。确定众数的方法,应视所掌握的资料而定。(1)由单项数列确定众数 对于单项数列,可以通过直接观察来确定众数,即从分布数列中找出最大频数或频率,其对应的变量值或标志表现就是该数列的众数。,【例】2月份,某商场把羊毛衫的销售情况按尺码分组如下表,试确定羊毛衫尺码的众数。,由上表可知,尺码为95匣米的羊毛衫销售数量最多,为70件,占总销售数量的35,所占比重也最大。所以,该商场羊毛衫尺码的众数为95厘米。2由组距数列计算众数 对于组距数列,众数的计算需分两步进行:(1)从变量数列中找出频数或频率最大的组,即
17、众数组,该组对应的上、下限确定了众数的取值范围。(2)依据与众数组相邻的两个组的频数,用比例插值法计算众数的近似值。计算公式为:,d表示众数组的组距。【例】某城市就居民家庭年收入情况进行了抽样调查,资料如下表所示。要求:计算该市居民家庭年收入的众数。,从上表可以看出众数组为20000-30000元一组,因为这一组居民户数最多,达220户。,即该市居民家庭年收入的众数为23333.33元。,【思考】根据上例,请用上限公式计算众数,比较二者计算结果是否相同。需要注意的是:上面给出的众数计算公式通常只适用于等距数列,或者至少变量数列中频数较多的几个组应该是等距的。否则,随着组距的变化,众数组和众数都
18、有可能发生变化,根据公式计算的结果就失去客观意义;并且,根据上述计算可知:众数是总体单位高度集中的变量值,不是根据全部变量值加以平均求得的,所以它不受极大、极小变量值的影响,仅受其前后相邻两组次数大小的影响。因此,只有当总体单位数很多而又有明显的集中趋势时,计算众数才有现实意义。如果变量数列各组的次数都相等,则无众数可言。此外,如果变量数列中出现最多次数的变量值不止一个,而是两个或两个以上时,就需要认真检查调查对象的性质和特点,不宜笼统地计算众数。,第二节 离散程度的测度,前面所学的平均指标数是反映总体各单位标志值的一般水平,说明变量值的集中趋势,掩盖了其间的差异,但它们之间的差异不仅客观存在
19、,有时又需要测度,至于如何程度,今天就来解决这一问题。一、离散程度的含义 P126离散程度是指分配数列中各标志值远离中心值(即平均数)的程度,或总体各单位变量值间的差异程度,也称离散趋势或离中趋势。离散程度可以用标志变异指标来反映和测度。例如:假设11级会电M班和N班各有50位学生,期末考试两班基础会计平均成绩均为75分,要了解哪个班成绩较均匀?需要学习标志变异指标。二、标志变异指标的概念和作用(一)标志变异指标的概念标志变异指标又称标志变动度,它是反映总体单位标志值的差异程度的指标。在统计工作中,通常一方面要计算平均数,以反映总体各单位标志值的一般水平,另一方面又要计算标志变异指标,以反映总体各单位标志值的差异程度。(二)标志变异指标的作用标志变异指标可以反映总体各单位标志值差异程度的大小。标志变异指标的数值越大,说明总体各单位标志值的差异程度越大,平均数的代表性越低;反之,标志变异指标的数值越小,说明总体各单位标志值的差异程度越小,平均数的代表性越大。,
链接地址:https://www.31ppt.com/p-6193909.html