统计学数据的描述性分析ppt课件.ppt
《统计学数据的描述性分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《统计学数据的描述性分析ppt课件.ppt(67页珍藏版)》请在三一办公上搜索。
1、数据的描述性分析,本章内容,第一节 集中趋势的描述第二节 离散程度的描述第三节 分布的偏态与峰度,集中趋势,集中趋势反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多,而远离中心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。,1.数值平均数:是以统计数列的所有数据来计算的平均数.其特点是统计数列中任何一项数据的变动,都会在一定程度上影响数值平均数的计算结果.2.位置平均数:它不是对统计数列中所有数据进行计算所得的结果,而是根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的.,数值平均数包括算术平均数、调和平均数和几何平均数.,.算术平均数(均值, Ar
2、ithmetic Mean),总体均值常用 或 表示,样本均值常用 表示,样本均值 的计算公式:,简单算术平均数:,加权算术平均数:,3.1.1 数值平均数,权数的意义和作用,权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用.当各组的次数都相同时,即当 时: 加权算术平均数就等于简单算术平均数.,例:计算某车间工人加工零件平均数(组距式数列),解:,关于计算结果的说明,根据原始数据和分组资料计算的结果一般不会完全相等, 根据分组数据只能得到近似结果.只有各组数据在组内呈对称或均匀分布时,根据分组资料 的计算结果才会与原始数据的计算结果一致.,(1).各变量值与均值的离
3、差之和等于零.,(2).各变量值与均值的离差平方和最小.,.调和平均数(倒数平均数, Harmonic Mean),调和平均数分为简单调和平均数和加权调和平均数.简单调和平均数标志值的倒数的算术平均数的倒数.,(2) 加权调和平均数,式中,m表示各单位或各组的标志值对应的标志总量.,例.某蔬菜批发市场三种蔬菜日成交数据如下表,计算三种蔬菜该日的平均批发价格.,.几何平均数(Geometric Mean),是另一种形式的平均数,是n个标志值乘积的 n 次方根.主要用于计算平均比率和平均速度.,(1)简单几何平均数,式中G表示几何平均数, 表示各项标志值.,可以看作均值的一种变形,(2)加权几何平
4、均数,例3.1.1 一位投资者持有一种股票,1997,1998,1999,2000年收益率分别为 计算该投资者在这四年内的平均收益率.,例3.1.2 某企业四个车间流水作业生产某产品, 一车间产品合格率99%,二车间为95%,三车间为92%,四车间为90%,计算该企业的平均产品合格率.,练习:某管理局所属的15个企业,2000年按其生产某产品平均单位成本的高低分组资料如下,试计算平均单位成本.,中国工商银行的某笔投资的年利率是按照复利计算的,25年利率分配(按时间数列):有一年是3%,有4年是4%,有8年是8%,有10年为10%,有2年为15%.求平均年利率.,注:(1),(2) 数值平均数主
5、要适用于定量数据,而不适用于定性数据.(3) 简单数值平均数适用于未分组的资料,加权数值平均数适用于分组的资料.,.众数(Mode),一组数据中出现次数最多的变量值.,主要特点: 不受极端值的影响. 有的数据无众数或有多个众数.,说明:如果所有数据出现的次数都一样,那么这组数据没 有众数.,3.1.2 位置平均数,众数主要用于分类数据,也可用于顺序数据和数值型数据,对于未分组数据和单项式分组数据,众数位置确定之后便找到了众数.,适用范围,例:分类数据的众数,例:顺序数据的众数,.中位数(Median),中位数是一组数据按一定顺序排列后,处于中间位置上的变量,负偏,正偏,注: (1)中位数总是介
6、于众数和平均数之间.,(2) 皮尔逊经验法则分布在轻微偏斜的情况下,众数、中位数和算术平均数数量关系的经验公式为:,众数、中位数、平均数的特点和应用,众数不受极端值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用,数值平均数与位置平均数的适用场合?,案例1:甲班统计学考试情况如下表:,案例2:乙班统计学考试情况如下表:,案例3:丙班统计学考试情况如下表:,问题1、计算甲、乙、丙三个班的平均成绩;该平均值是真实值还是近似值?如是近似值,什么情况下会是真实值?2、计算甲、乙、丙三个班
7、的中位数、众数;3、如要选择从算术平均数、中位数和众数三个平均数中选择一个数来分别代表甲、乙、丙三个班的整体水平,请问你会选择哪个平均数?为什么?4、如要分别反映甲、乙、丙三个班的考试情况,你会选择用哪些指标来衡量?5、如要比较甲、乙、丙三个班的考试情况的优劣,你又会选择什么样的指标来衡量?6、甲乙丙三个班的考试成绩分别服从对称分布、左偏分布、右偏分布中的哪种分布?为什么?,先计算各组的累计次数,再按公式 确定中位数的位置,并对照累计次数确定中位数。,由组距数列确定中位数,下限公式:,为中位数组的下限;为总次数;为中位数组前一组的向上累计次数;为中位数组的次数;为中位数组的组距。,组距式变量数
8、列计算众数的公式:,离散程度的描述,反映各变量值远离其中心值的程度(离散程度),从另一个侧面说明了集中趋势测度值的代表程度.,3.2.1 离散程度的常用指标,异众比率,式中, 为变量值的总频数; 为众数组的频数.,异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性越差.,全距(极差),极差(Range)也叫全距,是一组数据的最大值与最小值之差,即:,组距分组数据可用最高组上限最低组下限计算.,四分位差,四分位差(quartile deviation)也称内距或四分间距(inter-quartile range),是指第三四分位数和第一四分位数之差.,四分位差的计算公式为:,把所有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 描述 分析 ppt 课件
链接地址:https://www.31ppt.com/p-1359090.html