用样本的数字特征估计总体的数字特征方差标准差讲解课件.ppt
2.2.2用样本的数字特征估计总体的数字特征(2)方差、标准差,学习目标1.明确标准差、方差等数字特征的意义,深刻体会它们所反映的样本特征。2.会用样本的数字特征估计总体的的数字特征,初步体会样本的数字特征的随机性,复习回顾,一.什么是一组数据的众数、中位数及平均数?,中位数:把数据从小到大排列,若数据个数为奇数个,最中间的数据就是中位数;若数据个数为偶数个,则最中间两位数据的平均数就是中位数。,平均数:各数据总和除以数据个数所得的商,众数:一组数据中出现次数最多的数据。,二、众数、中位数、平均数与频率分布直方图的关系,1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。,2、在频率分布直方图中,中位数左边和右边的直方图的面积相等!,3、将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估值平均数.,小明是班里的优秀学生,他的历次数学成绩是96,98,95,93分,但最近的一次考试成绩只有45分,原因是他带病参加了考试期末评价时,怎样给小明评价?,错因分析这种评价是不合理的,尽管平均分是反映一组数据平均水平的重要特征,但任何一个数据的改变都会引起它的变化,而中位数则不受某些极端值的影响本题中的5个成绩从小到大排列为:45,93,95,96,98;中位数是95,较为合理地反映了小明的数学水平,因而应该用中位数来衡量小明的数学成绩正解小明5次考试成绩,从小到大排列为45,93,95,96,98,中位数是95,应评定为“优秀”,样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.,新课引入,有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4乙 9 5 7 8 7 6 8 6 7 7,如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?,两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗?,问题提出:,4 4 5 7 7 7 8 9 9 10,5 6 6 7 7 7 7 8 8 9,4,5,6,7,8,9,10,环数,频率,0.1,0.2,0.3,(甲),4,5,6,7,8,9,10,0.1,0.2,0.3,0.4,环数,频率,(乙),发现什么?,为此,我们还需要从另外一个角度去考察这两组数据!,直观上看,还是有差异的如:甲成绩比较分散,乙成绩相对集中(如图示)因此,我们还需要从另外的角度来考察这两组数据例如:在作统计图,表时提到过的极差 甲的环数极差=10-4=6 乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.,考察样本数据的分散程度的大小,最常用的统计量是标准差 标准差是样本平均数的一种平均距离,一般用s表示,所谓“平均距离”,其含义可作如下理解:,课程讲授,方差、标准差是样本数据到平均数的一种平均距离。它用来描述样本数据的分散程度。在实际应用中,标准差常被理解为稳定性。,1、方差(标准差的平方)公式为:,2、标准差公式为:,在刻画样本数据分散程度上,两者是一致的!,如 试比较以下两组样本数据的分散程度 101,98,102,100,99 1,3,5,7,9,经验总结:标准差用来描述样本数据的分散程度。,标准差,方差、标准差是样本数据到平均数的一种平均距离。它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。,规律:标准差越大,则a越大,数据的离散程度越大;反之,数据的离散程度越小。,性质归纳:,数学应用:,例1、已知有一个样本的数据为1,2,3,4,5,求平均数,方差,标准差。,例2 甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm),甲 25.46,25.32,25.45,25.39,25.36 25.34,25.42,25.45,25.38,25.42 25.39,25.43,25.39,25.40,25.44 25.40,25.42,25.35,25.41,25.39,乙 25.40,25.43,25.44,25.48,25.48 25.47,25.49,25.49,25.36,25.34 25.33,25.43,25.43,25.32,25.47 25.31,25.32,25.32,25.32,25.48,从生产的零件内径的尺寸看,谁生产的质量较高?,解:用计算器计算可得:,说明:1.生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差.2.问题中25.40mm是内径的标准值,而不是总体的平均数.,当堂训练:一次数学知识竞赛中,两组学生成绩如下表:已经算得两个组的平均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由,(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好(4)从成绩统计表看,甲组成绩大于或等于90分的人数为20人,乙组成绩大于或等于90分的人数为24人,所以乙组成绩在高分阶段的人数多,同时,乙组得满分的比甲组得满分的多6人,从这一角度看,乙组成绩较好,1甲、乙两中学生在一年里学科平均分相等,但他们的方差不相等,正确评价他们的学习情况是()A因为他们平均分相等,所以学习水平一样B成绩平均分虽然一样,方差较大的,说明潜力大,学习态度端正C表面上看这两个学生平均成绩一样,但方差小的成绩稳定D平均分相等,方差不等,说明学习不一样,方差较小的同学,学习成绩不稳定,忽高忽低答案C,2在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88,若样本B数据恰好是样本A都加上2后所得数据,则A、B两样本的下列数字特征对应相同的是()A众数B平均数C中位数D标准差答案D解析B样本数据恰好是A样本数据加上2后所得的众数、中位数、平均数比原来的都多2,而标准差不变,3已知样本9,10,11,x,y的平均数是10,方差是2,则xy()A98B88 C76D96答案D,课程小结,1、方差(标准差的平方)公式为:,2、标准差公式为:,方差、标准差是样本数据到平均数的一种平均距离。它用来描述样本数据的分散程度。在实际应用中,标准差常被理解为稳定性。,3.对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.,4.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20种可能抽样,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案.,