统计学第四章数据的概括性度量.ppt
《统计学第四章数据的概括性度量.ppt》由会员分享,可在线阅读,更多相关《统计学第四章数据的概括性度量.ppt(103页珍藏版)》请在三一办公上搜索。
1、第四章 数据的概括性度量,4.1 集中趋势度量 4.2 离散程度的度量4.3 偏态与峰态的度量,数据分布的特征,4.1 集中趋势的度量,4.1.1.分类数据:众数4.1.2.顺序数据:中位数和分位数4.1.3.数值型数据:均值4.1.4.众数、中位数和均值的比较,、Mode众数、Median and Quartiles中位数和分位数、Mean平均数,Outline概要:,、分类数据:众数(Mode),1)集中趋势的测度值之一2)出现次数最多的变量值3)不受极端值的影响4)可能没有众数或有几个众数5)主要用于分类数据,也可用于顺序据和数值型数据,1、众数的概念,The ode is the va
2、lue of the observation that appears most frequently.众数是观察值中出现得最多的变量值。用Mo表示。In a set of measurements,the mode class is the class that occurs with greatest frequency.在数据集中,众数组是出现频率最高的一组。Set of data may have one mode(or modal class),or two or more modes(or modal class).数据集可能有一个众数(组),或两(多)个众数(组)。,Mode众数
3、,The modal class众数组,For large data sets the modal class is much more relevant than the a single-value mode.对于大的数据集来说,众数组比单个众数更合适。,Types of Mode 众数的种类,No mode无众数data:10 5 9 12 6 8Mode:一个众数data:6 5 9 8 5 5Bimodal:双众数data:25 28 28 36 42 42Multimodal:多众数 data:32 32 32 33 34 34 34 35 36 36 36,有时众数是一个合适的代
4、表值,比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。,2、分类数据的众数(算例),【例】根据第三章表3-3中的数据,计算“饮料类型”的众数,解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值。我们看到,在所调查的50人当中,喝“碳酸饮料”的人数最多,为15人,占总被调查人数的30%,因此众数为“碳酸饮料”这一品牌,即 Mo碳酸饮料,3、顺序数据的众数(算例),【例】根据第三章例3.5 表3-10中的数据,计算众数,解:这里的数据为顺序数据。变量为“回答类别”。甲城市中对住房表示不满意的户数最多,为108户,因此众
5、数为“不满意”这一类别,即 Mo不满意,4、数值型分组数据的众数(要点及计算公式),1.众数的值与相邻两组频数的分布有关,4.该公式假定众数组的频数在众数组内均匀分布,2.相邻两组的频数相等时,众数组的组中值即为众数,3.相邻两组的频数不相等时,众数采用下列近似公式计算,117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114
6、120 128 124 115 139 128 124 121,【例4.1】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。,数值型分组数据的众数(算例),数值型分组数据的众数(算例),【例4.1】计算50名工人日加工零件数的众数,、顺序数据:中位数和分位数 Median and Properties,1、中位数(概念要点),1)集中趋势的测度值之一2)排序后处于中间位置上的值,3)不受极端值的影响4)主要用于顺序数据,也可用数值型数据,但不能用于定类数据5)各变量值与中位数的离差绝对值之和最小,即,2、中位数位置的确定,未分组数据:,组距分组数据:,3、顺序数
7、据的中位数(算例),【例3.2】根据第三章表3-4中的数据,计算甲城市家庭对住房满意状况评价的中位数,解:中位数的位置为:300/2150从累计频数看,中位数的在“一般”这一组别中。因此 Me一般,4、数值型未分组数据的中位数(计算公式),数值型未分组数据的中位数(5个数据的算例),原始数据:24 22 21 26 20排 序:20 21 22 24 26位 置:1 2 3 4 5,中位数 22,数值型未分组数据的中位数(6个数据的算例),原始数据:10 5 9 12 6 8排 序:5 6 8 9 10 12位 置:1 2 3 4 5 6,1)根据位置公式确定中位数所在的组2)采用下列近似公式
8、计算:,3)该公式假定中位数组的频数在该组内均匀分布,5、数值型分组数据的中位数(要点及计算公式),数值型分组数据的中位数(算例),【例4.3】根据例4.1 中的数据,计算50 名工人日加工零件数的中位数,6、四分位数(Quartiles),1)集中趋势的测度值之一2)排序后处于25%和75%位置上的值,3)不受极端值的影响4)主要用于定序数据,也可用于数值型数据,但不能用于定类数据,四分位数(位置的确定),未分组数据:,组距分组数据:,顺序据的四分位数(算例),【例4.4】根据第三章表3-10中的数据,计算甲城市家庭对住房满意状况评价的四分位数,解:下四分位数(QL)的位置为:QL位置(30
9、0)/475 上四分位数(QL)的位置为:QU位置(3300)/4225从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中。因此 QL 不满意 QU 一般,数值型未分组数据的四分位数(7个数据的算例),原始数据:23 21 30 32 28 25 26排 序:21 23 25 26 28 30 32位 置:1 2 3 4 5 6 7,N+1,QL=23,QU=30,数值型未分组数据的四分位数(6个数据的算例),原始数据:23 21 30 28 25 26排 序:21 23 25 26 28 30位 置:1 2 34 5 6,QL=21+0.75(23-21)=22.5,QU=2
10、8+0.25(30-28)=28.5,数值型分组数据的四分位数(计算公式),上四分位数:,下四分位数:,数值型分组数据的四分位数(计算示例),QL位置50/412.5,QU位置350/437.5,【例4.6】根据例4.1中的数据,计算50 名工人日加工零件数的四分位数,、定距和定比数据(数值型数据):均值(Mean),一名统计学家遇到一位数学家,统计学家调侃数学家说道:“你们不是说若且,则吗!那么想必你若是喜欢一个女孩,那么那个女孩喜欢的男孩你也会喜欢喽!?”数学家想了一下反问道:“那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!因为它们平均的温度不过是五十度而已!”
11、,统计学家与数学家,如果你的脚已经踩在炉子上,而头却在冰箱里,统计学家会告诉你,平均而言,你相当舒服。,调侃统计学家,1、均值的概念与性质,1)集中趋势的测度值之一2)最常用的测度值3)一组数据的均衡点所在4)易受极端值的影响5)用于数值型数据,不能用于定类数据和定序数据,(一)均值(算术平均数,2、均值计算公式,设一组数据为:x1,x2,xN 简单均值的计算公式为,设分组后的数据为:M1,M2,MN相应的频数为:f1,f2,fK加权均值的计算公式为,简单均值 Simple Mean,原始数据:10591368,加权均值(Weighted Mean),【例4.7】根据第三章表3-9中的数据,计
12、算电脑销售量的平均数,表4-3 某电脑公司销售量数据平均数计算表,加权均值(权数对均值的影响),甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组:考试成绩(X):0 20 100 人数分布(F):1 1 8 乙组:考试成绩(X):0 20 100 人数分布(F):8 1 1,权数与加权,权数与加权,权数与加权,权数与加权,算术平均数的计算取决于变量值和权数的共同作用:变量值决定平均数的范围;权数则决定平均数的位置,3、均值的数学性质,1).各变量值与均值的离差之和等于零,2).各变量值与均值的离差平方和最小,【例】设X=(2,4,6,8),则其调和平均数可由定义计算如下:,再求算术
13、平均数:,求各标志值的倒数:,,再求倒数:,是总体各单位标志值倒数的算术平均数的倒数,又叫倒数平均数,(二)、调和平均数harmean(harmonic mean),例某种蔬菜早上0.4元/斤,中午0.25元/斤,晚上0.20元/斤,某人各买1斤,求平均价格。(算术平均法)例类似地某人早、中、晚各买1元,求平均价格。,1、简单调和平均数(各变量值均为一个单位时使用),式中:x代表各个变量值,n代表变量值项数,(二).加权调和 平均数,适用于总体资料经过分组整理形成变量数列的情况,式中:为第 组的变量值;为第 组的标志总量。,解:,例:晚上白菜0.3元/斤,菠菜0.5元/斤,芹菜0.6元/斤,小
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第四 数据 概括性 度量
链接地址:https://www.31ppt.com/p-6193929.html