统计学贾俊平第4章数据的概括性度量课件.ppt
《统计学贾俊平第4章数据的概括性度量课件.ppt》由会员分享,可在线阅读,更多相关《统计学贾俊平第4章数据的概括性度量课件.ppt(97页珍藏版)》请在三一办公上搜索。
1、1,第4章 数据的概括性度量,4.1 集中趋势的度量4.2 离散程度的度量4.3 偏态与峰态的度量,男性:110 109 90 140 105 150 120 110 110 90 115 95 145 140 110 105 85 95 100 115 124 95 100 125 140 85 120 115 105 125 102 85 120 110 120 115 94 125 80 85 140 120 92 130 125 110 90 110 110 95 95 110 105 80 100 110 130 105 105 120 90 100 105 100 120 100
2、100 80 100 120 105 60 125 120 100 115 95 110 101 80 112 120 110 115 125 55 90女性:80 75 83 80 100 100 90 75 95 85 90 85 90 90 120 85 100 120 75 85 80 70 85 110 85 75 105 95 75 70 90 70 82 85 100 90 75 90 110 80 80 110 110 95 75 130 95 110 110 80 90 105 90 110 75 100 90 110 85 90 80 80 85 50 80 100 80
3、80 80 95 100 90 100 95 80 80 50 88 90 90 85 70 90 30 85 85 87 85 90 85 75 90 102 80 100 95 110 80 95 90 80 90,统计图,统计表,?,引例,三个角度,平均值,形状,集中趋势,偏斜问题,概括性度量,分散趋势,变差,4.1 集中趋势的度量,集中趋势,集中趋势(Central tendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据,
4、集中趋势,集中趋势,均值,中位数,众数,几何平均数,众数,众数(Mode)出现次数最多的变量值不受极端值的影响一组数据可能没有众数或有几个众数主要用于定性数据,也可用于定量数据,众数(续),未分组数据,无众数原始数据:1 2 3 4 5 6 7,一个众数原始数据:1 2 3 3 3 4 5,多于一个众数原始数据:1 2 3 3 4 4 5,分类数据的众数,解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值 所调查的50人中,购买碳酸饮料的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即 Mo碳酸饮料,顺序数据的众数,解:这里的数据为顺序数据。变
5、量为“回答类别”甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即 Mo不满意,数值型数据的众数,分组数据先在次数表中找出次数最多的那一组,称为众数组一般以Mo来表示若取众数组的组中点为众数,则称为粗众数Czuber插补法,数值型数据的众数,Czuber插补法,数值型数据的众数,示例,例解:,中位数,中位数(median)将一组数字由大排至小,位居中间的数值为该组数字的中位数。一般以Me来表示如果一组数列有奇数个观察值,则中位数为排序后数列的中间值如果一组数列有偶数个观察值,则中位数为排序后数列的中间两个观察值的算数平均数,中位数,未分组数据将n个数值由小至大排序
6、若n为奇数,决定中位数所在的位置n/2+1/2若n为偶数,则取第n/2与第n/2+1个之数值的平均数为代表各观察值与中位数差异的绝对值总和为最小。令为任意数,则:,顺序数据的中位数,解:中位数的位置为(300+1)/2150.5 从累计频数看,中位数在“一般”这一组别中 中位数为 Me=一般,数值型数据的中位数,例解66 70 71 76 80 84 92 n=7,则中位数所在的位置为第7/2+1/2()个数值(76)66 70 71 76 80 84 92 96 n=8,中位数所在的位置为第 8/2+1/2=4.5 个,取第n/2(第个)值与第n/2+1(第五个)值的平均数=(76+80)/
7、2=78,数值型数据的中位数,分组数据计算累加次数根据中位数所在的位次n/2 或n/2+1/2,找出中位数所在的组别以下列公式求出中位数:,数值型数据的中位数,数值型数据的中位数,已知第n/2的数值落于该组中,我们想要找出最接近第n/2的位置的一个推估数值,从第n/2个观察值到本组的下界之间共有几个观察值,组距为C,组次数为f,C/f可以看成每个观察值之间的单位距离,n/2,Fi-1,示例,例解:,均值,均值(mean)集中趋势的最常用测度值一组数据的均衡点所在,如同翘翘板的支点用于定量数据,不能用于定性数据资料易受到极端值或离群值得影响,均值,未分组数据总体均值,大N通常代表总体数值的个数,
8、总体均值是特定的一个常数值,均值,样本均值,小n通常代表样本观察值的个数,读作x-bar,样本平均值也一个常数吗?,均值,分组数据加权算术平均数,n,均值(续),加权(weighted)问题,均值(续),例解,均值(续),均值的性质均值是要找到一平衡点,均值(续),事实上,各个观察值与平均数差的总和为0,证明,均值(续),各个观察值与平均数差的平方和为最小,等于0,大于等于0,常数,均值(续),均值容易受到极端值的影响,若数据中有过大或过小的观察值时,不要以平均值来代表集中趋势。,均值(续),可以进行代数运算员工每人加薪5000元,均值(续),员工每人加薪5%,几何平均数,几何平均数(geom
9、etric mean)n 个变量值乘积的 n 次方根数据必须为正值才能计算几何平均数主要用于计算平均百分比(percentages)、比率(ratios)、指数(indexes)、成长率(growth rates)的计算计算公式为:,几何平均数,总体样本,几何平均数,可看作是均值的一种变形,几何平均数,例解 假设你去年薪资加薪百分之五,今年加薪百分之15,薪资的年平均成长率为?,平均增长率,分位数,分位数中位数又称为二分位数,即将数字数据由小至大排序后,切成二部分。大于及小于中位数者刚好各占所有数字数据的一半除了将数据作半切割外,我们也可以将数据切成四等分、十等分、或一百等分四分位数(Quar
10、tiles):Q1,Q2,Q3十分位数(Deciles):D1,D2,D3,百分位数(Percentiles):P1,P2,P3,分位数,百分位数,n小于10,不求十分位数,n100,不求百分位数,Q1=P25,Me=Q2=D5=P50,Q3=P75,顺序数据的四分位数,解:QL位置=(300)/4=75 QU位置=(3300)/4=225 从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中 四分位数为 QL=不满意 QU=一般,25%,25%,25%,25%,Data in Ordered Array:11 12 13 16 16 17 18 21 22,数值型数据的分位数,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学贾俊平第4章 数据的概括性度量课件 统计学 贾俊平第 数据 概括性 度量 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-2138148.html