标准差的意义课件.ppt
用样本的数字特征估计总体的数字特征,标准差,1,样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.,2,实际问题:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:,甲:,乙:,如果你是教练,你应当如何对这次射击作出评价?如果是一次选拔考核,你应该如何做选择?,计算可得,两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗?,3,4,5,6,7,8,9,10,环数,频率,0.1,0.2,0.3,(甲),4,5,6,7,8,9,10,0.1,0.2,0.3,0.4,环数,频率,(乙),甲成绩比较分散,乙成绩相对集中,看来,平均数还难以概括样本的实际状态,因此,我们还需要从另外的角度来考察这两组数据.,4,思 考:什么样的指标可以反映一组数据 变化范围的大小?,我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围。用这种方法得到的差称为极差,极差最大值最小值,5,在生活中,我们常常会和极差打交道班级里个子最高的学生比个子最矮的学生高多少?家庭中年纪最大的长辈比年纪最小的孩子大多少?这些都是求极差的例子,例1.(口答)求下列各题的极差。(1)某班个子最高的学生身高为1.70米,个子最矮的学生的身高为1.38米,求该班所有学生身高的极差。(2)小明家中,年纪最大的长辈的年龄是78岁,年纪最小的孩子的年龄是9岁,求小明家中所有成员年龄的极差。,6,甲的环数极差=10-4=6乙的环数极差=9-5=4.,极差对极端值非常敏感,在一定程度上表明样本数据的的波动情况但极差只能反映一组数据中两个极端值之间的差异情况,对其他数据的波动情况不敏感,到底是A组还是B组数据更加稳定呢?有必要重新找一个对整组数据波动情况更敏感的指标,本节课我们就要来学习反应一组数据稳定程度的两个量方差、标准差,7,考察样本数据的分散程度的大小,最常用的统计量是标准差 标准差是样本平均数的一种平均距离,一般用s表示,所谓“平均距离”,其含义可作如下理解:,8,于是样本数据x1,x2,xn,到x的平均距离是,平均距离标准差,由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差,9,考虑一个容量为2的样本:,标准差的几何意义,显然,标准差越大,则a越大,数据的离散程度越大;标准差越小,数据的离散程度越小.,标准差用来衡量一批数据的波动大小(即这批数据偏离平均数的大小).,10,标准差的取值范围是什么?标准差为0的样本数据有什么特点?标准差是怎样表现数据的离散程度的?,标准差的取值范围:,0,+),标准差为0的样本数据都等于样本平均数.,标准差表现为:标准差越大,表明数据的离散程度就越大;反之,标准差越小,表明各数据的离散程度就越小。,它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。,标准差的作用:,11,例题分析,例1 画出下列四组样本数据的条形图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;,12,(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.,13,对于城市居民月均用水量样本数据,其平均数=1.973,标准差s=0.868.在这100个数据中,落在区间(-s,+s)=1.105,2.841外的有28个;落在区间(-2s,+2s)=0.237,3.709外的只有4个;落在区间(-3s,+3s)=-0.631,4.577外的有0个.,一般地,对于一个正态总体(,),数据落在区间()、()、()内的百分比分别为68.3%、95.4%、99.7%,这个原理在产品质量控制中有着广泛的应用(参考教材P79“阅读与思考”).,标准差还可用于对样本数据的另外一种解释,14,从数学的角度考虑,人们有时用标准差的平方s2_-方差来代替标准作为测量样本数据分散程度的工具。,步骤:求平均数;作差;平方;再求平均数,15,如果数据 的平均数为,方差为,那么,16,17,练习:从甲乙两种玉米苗中各抽株,分别测得它们的株高如下(单位:cm),问:(1)哪一种玉米长得高?,(2)哪种玉米的苗长得齐?,18,小结,1.用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据.,2.平均数对数据有“取齐”的作用,代表一组数据的平均水平.标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策.,3.对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.,19,4.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案.,20,练习:,(1)如果数据 的平均数为,方差为,中位数为a,求数据3x1+5,3x2+5,3xn+5的平均数、标准差、方差、中位数。,(2)求数据2,1,0,-1,1的方差。,(3)已知40个数据中的前20个数据的平均数和方差分别为60、20,后20个数据的平均数和方差分别为80、40,求这40个数据的平均数和方差。,21,