第4章数据的概括性度量ppt课件.ppt
《第4章数据的概括性度量ppt课件.ppt》由会员分享,可在线阅读,更多相关《第4章数据的概括性度量ppt课件.ppt(126页珍藏版)》请在三一办公上搜索。
1、第 4 章 数据的概括性度量,第 4 章 数据的概括性度量,4.1 集中趋势的度量 4.2 离散程度的度量4.3 偏态与峰态的度量,4.1 集中趋势的度量,4.1.1 分类数据:众数4.1.2 顺序数据:中位数和分位数4.1.3 数值型数据:平均数4.1.4 众数、中位数和平均数的比较,集中趋势,一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据,分类数据:众数,,众数(mode),一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值
2、的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据,当数据分布存在明显的集中趋势,且有显 著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数,众数的原理及应用,不唯一性,无众数原始数据: 10 5 9 12 6 8,一个众数原始数据: 6 5 9 8 5 5,多于一个众数原始数据: 25 28 28 36 42 42,分类数据的众数 (例题分析),变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值 Mo可口可乐,顺序数据的众数 (例题分析),顺序数据。变量为“回答类别” Mo不满意,某车间50名工人月产量的
3、资料如下:,计算该车间工人月产量的众数。,数值型数据,某车间50名工人月产量的资料如下:,计算该车间工人月产量的众数。,顺序数据:中位数和分位数,中位数(median),排序后处于中间位置上的值,不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据,中位数(位置和数值的确定),位置确定,数值确定,如果统计资料中含有异常的或极端的数据,就有可能得到非典型的甚至可能产生误导的平均数,这时使用中位数来度量集中趋势比较合适。,比如有5笔付款: 9元,10元,10元,11元,60元 平均付款为100/5=20元。 很明显,这并不是一个好的代表值,而中位数10元是一个更好的代表值。,顺序
4、数据的中位数 (例题分析),中位数的位置为 (300+1)/2150.5中位数为 Me=一般,数值型数据的中位数 (9个数据的算例),【例】 9个家庭的人均月收入数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9,中位数 1080,数值型数据的中位数 (10个数据的算例),【例】:10个家庭的人均月收入数据排 序: 660 750 780 850 960 1080 1250 1500 1630 2000位 置: 1
5、2 3 4 5 6 7 8 9 10,某车间50名工人月产量的资料如下:,计算该车间工人月产量的中位数。,组距数列,共 个单位,共 个单位,共 个单位,共 个单位,L,U,中位数组,组距为d,共 个单位,假定该组内的单位呈均匀分布,中位数下限公式为,向上累计,共 个单位,共 个单位,共 个单位,共 个单位,L,U,中位数组,组距为d,共 个单位,假定该组内的单位呈均匀分布,共有单位数,中位数上限公式为,该段长度应为,向下累计,某车间50名工人月产量的资料如下:,计算该车间工人月产量的中位数。,四分位数(quartile),排序后处于25%和75%位置上的值,不受极端值的影响主要用于顺序数据,也
6、可用于数值型数据,但不能用于分类数据,四分位数(位置的确定),方法2:较准确算法,方法1:定义算法,四分位数(位置的确定),方法3: 其中 表示中位数的位置取整。这样计算出的四分位数的位置,要么是整数,要么在两个数之间0.5的位置上方法4: Excel给出的四分位数位置的确定方法 如果位置不是整数,则按比例分摊位置两侧数值的差值,顺序数据的四分位数 (例题分析),解:QL位置= (300)/4 =75 QU位置 =(3300)/4 =225 从累计频数看, QL在“不满意”这一组别中; QU在“一般”这一组别中 四分位数为 QL = 不满意 QU = 一般,数值型数据的四分位数 (9个数据的算
7、例),【例】:9个家庭的人均月收入数据(4种方法计算)原始数据: 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9,方法1,数值型数据的四分位数 (9个数据的算例),【例】:9个家庭的人均月收入数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9,方法2,
8、数值型数据的四分位数 (9个数据的算例),【例】:9个家庭的人均月收入数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9,方法3,数值型数据的四分位数 (9个数据的算例),【例】:9个家庭的人均月收入数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6
9、7 8 9,方法4,数值型数据:平均数,平均数(mean),也称为均值,一组数据相加后除以数据的个数得到的结果集中趋势的最常用测度值一组数据的均衡点所在4. 易受极端值的影响5. 有简单平均数和加权平均数之分6. 根据总体数据计算的,记为;根据样本数据计算的,称为样本平均数,记为x,简单平均数-未分组数据(Simple mean),设一组数据为:x1 ,x2 , ,xn (总体数据xN),样本平均数,总体平均数,平均每人日销售额为:,加权平均数-分组数据 (Weighted mean),设各组的组中值为:M1 ,M2 , ,Mk 相应的频数为: f1 , f2 , ,fk,样本加权平均,总体加
10、权平均,加权平均数(权数对均值的影响),甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组: 考试成绩(x ): 0 20 100 人数分布(f ):1 1 8 乙组: 考试成绩(x): 0 20 100 人数分布(f ):8 1 1,【例】某企业某日工人的日产量资料如下:,计算该企业该日全部工人的平均日产量。,算术平均数的计算方法,解:,算术平均数的计算方法,分析:,起到权衡轻重的作用,加权算术平均数的因素分析,决定平均数的变动范围,加权平均数 (例题分析),思考题,比特啤酒公司雇用了468名员工,其中有56名管理人员,130名行政和技术人员,其余282人是工人。这三组人的周平均工
11、资分别是500英镑、300英镑和200英镑。财务主管希望计算全体员工的平均工资。,正确的计算方法,平均数(数学性质),1. 各变量值与平均数的离差之和等于零,2. 各变量值与平均数的离差平方和最小,几何平均数(geometric mean),n 个变量值乘积的 n 次方根适用于比率数据的平均主要用于计算平均增长率计算公式为,5. 可看作是平均数的一种变形,式中: 为几何平均数; 为变量值的个数; 为第 个变量值。,几何平均数的计算方法,【例】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95、92、90、85、80,求整个流水生产线产品的平均合格率。,分析:,设最初投产100A
12、个单位 ,则第一道工序的合格品为100A0.95;第二道工序的合格品为(100A0.95)0.92; 第五道工序的合格品为(100A0.950.920.900.85)0.80;,因该流水线的最终合格品即为第五道工序的合格品, 故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:,即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。,解:,思考,若上题中不是由五道连续作业的工序组成的流水生产线,而是五个独立作业的车间,且各车间的合格率同前,又假定各车间的产量相等均为100件,求该企业的平均合格率。,几
13、何平均数的计算方法,因各车间彼此独立作业,所以有 第一车间的合格品为:1000.95; 第二车间的合格品为:1000.92; 第五车间的合格品为:1000.80。则该企业全部合格品应为各车间合格品的总和,即总合格品=1000.95+1000.80,几何平均数的计算方法,分析:,不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。又因为,应采用加权算术平均数公式计算,即,式中: 为几何平均数; 为第 组的次数; 为组数; 为第 组的标志值或组中值。,几何平均数的计算方法,【例】某金融机构以复利计息。近12年来的年利率有4年为3,2年为5,2年为8,3年为10,1年为15。求平均年利率
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第4章 数据的概括性度量ppt课件 数据 概括性 度量 ppt 课件
链接地址:https://www.31ppt.com/p-1428504.html