大二下统计学第三章第三节&第四节.ppt
,3.3 统计数据的离中趋势,3.3.1 变异指标 集中趋势值代表性的测定,变异指标时衡量集中趋势代表性的尺度;变异指标值越大,数据越分散,集中趋势的代表性越小;反之,变异指标值越小,数据越集中,集中趋势值的代表性越大;常用的变异指标有:极差、四 分位差、平均差、方差和标准差。,3.3.2 极差与四分位差,又名全距,是指所研究数据中的最大值与最小值之差。极差表示数据的变动范围,用R表示:,1、极差,未分组数据:,组距分布数列:,2、四分位差,1.离散程度的测度值之一2.也称为内距或四分间距3.上四分位数与下四分位数之差 QD=QU-QL4.反映了中间50%数据的离散程度不受极端值的影响 6.用于衡量中位数的代表性,【例】计算下列数据的四分位差:原始数据:65 72 73 75 78 80 84 88 90,3.3.3 平均差,平均差是总体各单位标志值与其算术平均数的离差绝对值的算术平均数,通常以AD表示。,未分组资料,分组资料,【例】根据表3-2资料计算某班学生英语考试成绩的平均差。,3.3.4 标准差和方差,标准差:总体中各单位标志值与其算术平均数离差平方和的平均数的平方根,用表示;标准差是各项离差的平均数。标准差的平方称为方差,用2表示。,【例】根据表3-2资料计算某班学生英语考试成绩的标准差。,【例】甲班某次数学考试成绩如下表所示,计算:(1)计算算术平均数、中位数和众数;(2)计算全距、平均差、标准差。,3.3.5 离散系数与异众比率,1.变异指标与其相应的均值之比;2.消除了数据水平高低和计量单位的影响;3.表示单位平均数上的差异;4.用于对不同组别数据离散程度的比较;5.计算公式为,1、常用的离散系数是标准差系数:,【例】某班级学生平均身高和平均体重资料如下,试比较平均身高和平均体重代表性的大小。,2、异众比率,适用于定性数据,衡量的是众数的代表性;非众数组的次数占总次数的比率;异众比率越大,众数的代表性越小;异比率越小,众数的代表性越大。,【例】根据下表中的数据,计算 异众比率。,解:在所调查的200人当中,关注非商品广告的人数占44%,异众比率还是比较大。因此,用“商品广告”来反映城市居民对广告关注的一般 趋势,其代表性不是很好.,=0.44=44%,3.4 数据分布形态的测定,偏态:也称偏度,指变量围绕其均值的非对称方向和程度;峰态:也称峰度,指数据分布曲线的凸起度或平坦程度;偏度和峰度主要用于判断总体的分布是否接近于正态分布。,偏态与峰度分布的形状,3.4.1 k阶矩,3.4.2 偏态,1、由中心矩测定偏态,2、由均值与众数之间的关系测定偏态,3、由三个四分位数之间的关系来测定,3.4.3 峰态,1、以正态分布为标准来衡量曲线尖峭程度;2、种类:正态、尖顶、平顶;3、尖峰峰度:次数分布曲线较正态分布曲线更隆起、更瘦更高的曲线;4、平顶峰度:次数分布曲线较正态 分布曲线更平坦、更矮更胖的 曲线;,正态峰度,平顶峰度,尖顶峰度,【例】在某地区抽取的120家企业利润按利润额分组,结果如下:,计算分布的峰度系数。,