第4章数据分布特征的描述.ppt
《第4章数据分布特征的描述.ppt》由会员分享,可在线阅读,更多相关《第4章数据分布特征的描述.ppt(86页珍藏版)》请在三一办公上搜索。
1、第 4章 统计数据特征的描述,4.1 分布集中趋势的测度4.2 分布离散程度的测度4.3 分布偏态与峰度的侧度4.4 茎叶图与箱线图4.5 统计表与统计图 本章小结,学习目标,掌握数据集中趋势和离散程度的测度方法掌握茎叶图和箱线图的制作方法掌握分布偏态与峰度的测度方法掌握统计表和统计图的使用,学习重点,侧度数据集中趋势指标的计算方法及应用侧度数据离散程度指标的计算方法及应用统计表与统计图,学习难点,方差、标准差、变异系数的实质,授课学时,4学时,4.1分布集中趋势的测度,分布集中趋势的测度值是反映数据一般水平的代表值或者数据分布的中心值。一、众数二、中位数三、四分位数四、均值五、几何均值六、切
2、尾均值七、众数、中位数和均值的比较,众数,众数(mode),一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据众数计算公式见书页。,众数(不惟一性),无众数,一个众数,多于一个众数,中位数,中位数(median),排序后处于中间位置上的值,不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据各变量值与中位数的离差绝对值之和最小,即,中位数计算,(1)为分组资料中位数位置=(n+1)/2(奇数项与偶数项)(2)分组资料中位数位置=n/2中位数在累计频数刚刚大于中位数位置的组众数计算公
3、式见书页。,四分位数,四分位数(quartile),排序后处于25%和75%位置上的值,不受极端值的影响主要用于顺序数据,也可用于数值型数据,但不能用于分类数据,四分位数(位置的确定),未分组数据:,分组数据:,均 值,均值(算数平均数)(mean),集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响用于数值型数据,不能用于分类数据和顺序数据注意均值的平均性,简单算数平均数(simple mean),设一组数据为:x1,x2,xn,总体均值,样本均值,加权算数平均数(weighted mean),设一组数据为:x1,x2,xn相应的频数为:f1,f2,fk,总体均
4、值,样本均值,加权算数平均数(例题分析),均值(数学性质),1.各变量值与均值的离差之和等于零,2.各变量值与均值的离差平方和最小,几何平均数,几何平均数(geometric mean),n 个变量值乘积的 n 次方根主要用于计算平均比率或平均速度计算公式为,5.可看作是均值的一种变形,几何平均数(例题分析),【例】一位投资者购持有一种股票,在2000年、2001年、2002年和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率,算术平均:,几何平均:,几何平均数(例题分析),【例】胡锦涛在十七大报告中提出,实现人均国内生产总值(GDP)到202
5、0年比2000年翻两番。,切尾均值,切尾均值(trimmed Mean),去掉大小两端的若干数值后计算中间数据的均值在电视大奖赛、体育比赛及需要人们进行综合评价的比赛项目中已得到广泛应用计算公式为,n 表示观察值的个数;表示切尾系数,,切尾均值(例题分析),【例】谋次比赛共有11名评委,对某位歌手的给分分别是:,经整理得到顺序统计量值为,去掉一个最高分和一个最低分,取1/11,众数、中位数和均值的比较,众数、中位数和均值的关系,众数、中位数、均值的特点和应用,众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用均值易受极端值影响数学性质优良数据
6、对称分布或接近对称分布时应用,4.2 分布离散程度的测度,分布离散程度的测度值反映数据分布离散和差异程度。主要包括:一、极差二、内距三、方差和标准差四、离散系数,极差(range),一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布,R=max(xi)-min(xi),计算公式为,内距(Inter-Quartile Range,IQR),也称四分位差上四分位数与下四分位数之差 内 距=Q3 Q1反映了中间50%数据的离散程度不受极端值的影响可用于衡量中位数的代表性,方差和标准差,方差和标准差(Variance and Standard deviation),1.反
7、映了数据的分布离散程度和差异程度的最常用的测度值。2.反映了各变量值与均值的平均差异。3.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差,总体方差和标准差(simple variance and standard deviation),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,样本方差和标准差(simple variance and standard deviation),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,样本方差自由度(degree of fre
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分布 特征 描述
链接地址:https://www.31ppt.com/p-5635713.html