统计学-数据的描述性分析.ppt
《统计学-数据的描述性分析.ppt》由会员分享,可在线阅读,更多相关《统计学-数据的描述性分析.ppt(81页珍藏版)》请在三一办公上搜索。
1、本章内容,第一节 集中趋势的描述第二节 离散程度的描述第三节 分布的偏态与峰度,集中趋势,集中趋势反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多,而远离中心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。,1.数值平均数:是以统计数列的所有数据来计算的平均数.其特点是统计数列中任何一项数据的变动,都会在一定程度上影响数值平均数的计算结果.2.位置平均数:它不是对统计数列中所有数据进行计算所得的结果,而是根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的.,数值平均数包括算术平均数、调和平均数和几何平均数.,1.算术平均数(均值,Arithmetic
2、Mean),总体均值常用 或 表示,样本均值常用 表示,样本均值 的计算公式:,简单算术平均数:,加权算术平均数:,一、数值平均数,权数的意义和作用,权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用.当各组的次数都相同时,即当 时:加权算术平均数就等于简单算术平均数.,例:计算某车间工人加工零件平均数(组距式数列),解:,关于计算结果的说明,根据原始数据和分组资料计算的结果一般不会完全相等,根据分组数据只能得到近似结果.只有各组数据在组内呈对称或均匀分布时,根据分组资料 的计算结果才会与原始数据的计算结果一致.,(1).各变量值与均值的离差之和等于零.,(2).各变量
3、值与均值的离差平方和最小.,算术平均数的特点,算术平均数适合用代数方法运算,因此运用比较广泛;易受极端变量值的影响,使 的代表性变小;受极大值的影响大于受极小值的影响;当组距数列为开口组时,由于组中值不易确定,使 的代表性也不很可靠;同时要求各单位 标志值在组内是均匀分布的,此时各组的平均数正好等于它的组中值。故用组中值计算得出来的平均数只能是一个近似值。,调和平均数是各个变量值倒数的算术平均数的倒数。,2、调和平均数(又称“倒数平均数”),其计算方法如下:,在加权的情况下:,在社会经济统计学中经常用到的仅是一种特定权数的加权调和平均数。即有以下数学关系式成立:,m是一种特定权数,它不是各组变
4、量值出现的次数,而是各组标志值总量。,调和平均数的特点,如果数列中有一标志值等于零,则无法计算;较之算术平均数,受极端值的影响要小。,例.某蔬菜批发市场三种蔬菜日成交数据如下表,计算三种蔬菜该日的平均批发价格.,3.几何平均数(Geometric Mean),又称“对数平均数”,是另一种形式的平均数,是n个标志值乘积的 n 次方根.主要用于计算平均比率和平均速度.,(1)简单几何平均数,式中G表示几何平均数,表示各项标志值.,(2)加权几何平均数,例 某企业四个车间流水作业生产某产品,一车间产品合格率99%,二车间为95%,三车间为92%,四车间为90%,计算该企业的平均产品合格率.,几何平均
5、数的特点,如果数列中有一个标志值等于零或负值,就无法计算;受极端值的影响较 和 小;它适用于反映特定现象的平均水平,即现象的总标志值是各单位标志值的连乘积。,注:(1),(2)数值平均数主要适用于定量数据,而不适用于定性数据.(3)简单数值平均数适用于未分组的资料,加权数值平均数适用于分组的资料.,1.众数(Mode),一组数据中出现次数最多的变量值.,主要特点:不受极端值的影响.有的数据无众数或有多个众数.,位置平均数,M0,M0,M0,M0,M0,若有两个次数相等的众数,则称复众数。,只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。,下三图无众数:,在单位数很少,或单位数虽多但无
6、明显集中趋势时,计算众数是没有意义的。,说明:如果所有数据出现的次数都一样,那么这组数据没 有众数.,众数主要用于分类数据,也可用于顺序数据和数值型数据,对于未分组数据和单项式分组数据,众数位置确定之后便找到了众数.,适用范围,例:分类数据的众数,例:顺序数据的众数,根据单项数列确定众数;,某种商品的价格情况,众数M0=3.00(元),数值型数据众数的计算方法,根据组距数列确定众数,()利用比例插值法推算众数的近似值。,()由最多次数来确定众数所在组;,表中70-80,即众数所在组。,计算众数的近似值:,下限公式:,上限公式:,众数的特点,众数是一个位置平均数,它只考虑总体分布中最频繁出现的变
7、量值,而不受各单位标志值的影响,从而增强了对变量数列一般水平的代表性。不受极端值和开口组数列的影响。,众数是一个不容易确定的平均指标,当分布数列没有明显的集中趋势而趋均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。,2.中位数(Median),中位数是一组数据按一定顺序排列后,处于中间位置上的变量,由未分组资料确定中位数,数值型数据中位数的计算方法,n为奇数时,则居于中间位置的那个标志值 就是中位数。,n为偶数时,则中间位置的两个标志值的算术 平均数为中位数。,由单项数列确定中位数,某企业按日产零件分组如下:,由组距数列确定中位数,下限公式(较小制累计时用):,上限公
8、式(较大制累计时用):,中位数不受极端值及开口组的影响,具有稳健性。,各单位标志值与中位数离差的绝对值之和 是个最小值。,对某些不具有数学特点或不能用数字测定的 现象,可用中位数求其一般水平。,中位数的特点,负偏,正偏,注:(1)中位数总是介于众数和平均数之间.,(2)皮尔逊经验法则分布在轻微偏斜的情况下,众数、中位数和算术平均数数量关系的经验公式为:,一组工人的月收入众数为700元,月收入的算术平均数为1000元,则月收入的中位数近似值是:,根据卡尔皮尔逊经验公式,还可以推算出:,众数、中位数、平均数的特点和应用,众数不受极端值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时应用中位数不受
9、极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用,数值平均数与位置平均数的适用场合?,案例1:甲班统计学考试情况如下表:,案例2:乙班统计学考试情况如下表:,案例3:丙班统计学考试情况如下表:,问题1、计算甲、乙、丙三个班的平均成绩;该平均值是真实值还是近似值?如是近似值,什么情况下会是真实值?2、计算甲、乙、丙三个班的中位数、众数;3、如要选择从算术平均数、中位数和众数三个平均数中选择一个数来分别代表甲、乙、丙三个班的整体水平,请问你会选择哪个平均数?为什么?4、如要分别反映甲、乙、丙三个班的考试情况,你会选择用哪些指标来衡量?5、如要比较
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 描述 分析
链接地址:https://www.31ppt.com/p-6440883.html