数据分布特征的测.ppt
《数据分布特征的测.ppt》由会员分享,可在线阅读,更多相关《数据分布特征的测.ppt(66页珍藏版)》请在三一办公上搜索。
1、第四章 数据分布特征的测度,教学目的与要求:统计平均指标是表明总体数量特征的一个重要指标,它是将总体各单位标志值的差异抽象化,反映总体各单位标志值的一般水平,揭示总体分布的集中趋势。变异指标是反映总体各单位标志值的差异程度,揭示总体分布离中趋势的又一重要数量特征指标。通过本章的学习,要求理解统计平均指标的意义和作用;掌握各种统计平均指标的特点、应用条件、应用范围和计算方法;理解变异指标的意义和作用;掌握各种变异指标的性质和计算方法;能运用变异指标衡量平均数代表性的大小。,教学重点与难点:重点为各种平均指标和变异指标的概念、特点、应用条件、应用范围和计算方法。难点是不同条件下平均指标和变异指标的
2、计算。,统计数据经过整理和显示后,对数据分布的形状和特征就可以有一个大致的了解。为进一步掌握数据分布的特征和规律,进行更深入的分析,还需要找到反映数据分布特征的各个代表值。,对一组数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢和聚集的程度;二是分布的离散程度,反映各数据远离中心值的趋势;三是分布偏态和峰态,反映数据分布的形状。这三个方面分别反映了数据分布特征的不同侧面。,第一节 集中趋势的测度,集中趋势是指一组数据向某一中心值靠拢的倾向,它反映了一组数据中心点的位置所在。测度集中趋势也就是寻找数据一般水平的代表值或中心值。低层次数据的集中趋势测度值适
3、用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据。因此,选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型和特点来确定。,一、分类数据:众数(Mo)众数是指一组数据中出现次数最多的变量值。出现次数最多的变量值 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和 数值型数据,从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可能不存在;如果有两个最高峰点,也可以有两个众数,见P78图4-1。,二、顺序数据:中位数(M
4、e)和分位数(一)中位数 中位数是一组数据排序后,处于中间位置上的变量值。中位数是一个位置代表值,它主要用于测度顺序数据的集中趋势,当然也适用于作为数值型数据的集中趋势,但不适用于分类数据。,根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,其公式为:中位数位置,对于分类型数据,中位数的位置为:中位数位置 若项数为奇数,则居于中间位置的 那个标志值即为中位数。若项数为偶数,则居于中间位置的两项数值的平均数即为中位数。,【例】:9个家庭的人均月收入数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排 序:750 780 850 96
5、0 1080 1250 1500 1630 2000位 置:1 2 3 4 5 6 7 8 9 位置=(n+1)2=(9+1)2=5 中位数=1080,【例】:10个家庭的人均月收入数据排 序:660 750 780 850 960 1080 1250 1500 1630 2000位 置:1 2 3 4 5 6 7 8 9 10 位置=(n+1)2=(10+1)2=5.5 中位数=(960+1080)2=1020,对于数值型数据,也可以计算中位数:,(二)分位数 四分位数、十分位数和百分位数分别是用3个点、9个点和99个点将数据4等分、10等分和100等分后各分位点上的值。四分位数,“四分位点
6、”,是通过三个点将全部数据等分为四部分,其中每部分包含25的数据,处在分位点上的数值就是四分位数。,QM,QU,QL,下四分位数,中位数,上四分位数,对于分类数据,各四分位数的位置分别为:,当四分位数的位置不在某一个数值上时,可根据四分位数的位置,按比例分摊四分位数位置两侧数值的差值。,【例】:9个家庭的人均月收入数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排 序:750 780 850 960 1080 1250 1500 1630 2000位 置:1 2 3 4 5 6 7 8 9,QL,QL,QL,QL,QU,QU,QU,QU,【例】:1
7、0个家庭的人均月收入数据排 序:660 750 780 850 960 1080 1250 1500 1630 2000位 置:1 2 3 4 5 6 7 8 9 10,三、数值型数据:均值 均值也称为算术平均数,是全部数据的算术平均。均值在统计学中具有重要的地位,是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类和顺序数据。根据所掌握数据的不同,均值有不同的计算形式和计算公式。,(一)算术平均数的基本形式 算术平均数,(二)简单算术平均数 当掌握的资料是未分组的总体各单位的标志值时,则将各单位的标志值简单相加得出标志总量,然后各单位的标志值简单相加得出标志总量,然后在除以总体单
8、位数之和,这种计算平均数的方法称为简单算术平均数。,其公式为:,(三)加权算术平均数 当掌握的资料已经分组,且各组出现的次数 不同时,则采用加权算术平均数。各组的组中值为:M1,M2,Mk,例:某企业某车间工人每天生产产品资料如表4-1:表4-1,根据上表资料,计算平均每人生产产品件数:,简单算术平均数的数值大小只与变量值的大小有关。加权算术平均数的数值大小不仅受各组组中值大小的影响,而且受各组变量值出现的频数及权数大小的影响。如果某一组的权数较大,说明该组的数据较多,那么该组数据的大小对均值的影响就越大,反之则越小。,加权算术平均数应注意几个问题:1、加权算术平均数的权数可以是绝对数,亦可以
9、是比重;上例的权数为绝对数。现举例说明比重权数,例如下表资料:,表4-2,平均每人生产产品件数=,2、根据组距数列计算加权算术平均数 例某企业某车间工人生产产品资料如表4-3:表4-3,用组中值计算出来的平均数,只能是平均数的近似值,而不是平均数的真值。,3、若各组单位数相等,即f1=f2=fn,则加权算术平均数计算公式与简单算术平均数存在下面关系:可见,简单算术平均数是加权算术平均数的一个特例。,(四)算术平均数的数学性质 均值在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。首先,从统计思想上看,均值是一组数据的重心所在,是数据误差相互抵消后的必然性结果。比如对同一事物进行多次测
10、量,若所得结果不一致,可能是由于测量误差所致,也可能是其他因素的偶然影响,利用均值作为其代表值,则可以使误差相互抵消,反映出事物必然性的数量特征。其次,均值具有下面一些重要的数学性质,这些数学性质在实际中有着广泛的应用,体现了均值的统计思想。,算术平均数最重要的两个数学性质是:1.各变量值与平均数的离差之和等于 零,即:简单算术平均数:加权算术平均数:,2.各变量值与平均数的离差的平方和为最小值,即:简单算术平均数:加权算术平均数:证明见P84。,(五)均值的另一种表现形式:调和平均数 调和平均数是算术平均数的另一种表现形式,用表示。在实际工作中,由于所获得的数据的不同,有时不能直接采用均值的
11、计算公式来计算平均数,这就需要使用调和平均数的形式进行计算,二者实质上是相同的,而仅有形式上的区别。,其计算公式为:需要注意的是,当数据中出现“0”时不宜计算调和平均数。,例如,某企业工人月奖金额如表4-4:表4-4,(六)一种特殊的均值:几何平均数 统计几何平均数指标,是指社会经济现象的同质总体在时间上变动速度的平均数。是具有经济意义同质总体的n个环比发展速度连乘积的n次方根。统计几何平均数属于动态平均数。,几何平均数是适用于特殊数据的一种平均数,它主要用于计算比率的平均。当所掌握的变量值本身是比率的形式,这时就应采用几何平均法计算平均比率。在实际应用中,几何平均数主要用于计算社会经济现象的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分布 特征
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6578352.html