样本的数字特征评估.ppt
用样本数字特征,估计总体数字特征,初中学过众数、中位数和平均数的概念,这些数据都是反映样本信息的数字特征。,众数、中位数、平均数,1、众数:一组数据中重复出现次数最多的数称为这组数的众数。,2、中位数:把一组数按从小到大的顺序排列,把处于最中间位置的那个数(或最中间位置的两个位置的平均数)称为这组数据的中位数。,3、平均数:设有n个数x1,x2,xn,一、求数据的众数、中位数、平均数,例1:某工厂人员及工资构成如下:,(1)指出这个问题中周工资的众数、中位数、平均数,(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?,200元,220元,300元,23,2200,1500,1100,2000,100,周工资众数,,6900,周工资中位数,,周工资平均数,,(22001+2506+2205+20010+1001)23=690023=300,因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。,分析:众数为,中位数,平均数为。,200,220,300,变式训练:,某公司的33名职工的月工资(以元为单位)如下:,(1)求该公司职工月工资的平均数、中位数、众数;,(2)假设董事长的工资从5500元提升到30000元,副董事长的工资从5000元提升到20000元,那么新的平均数、中位数、众数又是什么?(精确到元),(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈谈你的看法。,(1)众数1500元,中位数1500元,平均数2091元;,5500,5000,30000,20000,(2)众数1500元,中位数1500元,平均数3288元;,频率直方图较好地表示数据的分布情况,但频率分布直方图看不出原始数据,因此由频率直方图求出的众数、中位数、平均数与由原始数据求出的有一定的误差。,二、利用频率直方图求众数、中位数、平均数,0.125,频率/组距,1 2 3,0,0.25,0.625,例2:如右图为一组数据的频率直方图,求其众数、中位数和平均数。,众数的估计值为最高矩形的中点,众数的估计值为2.5,利用频率直方图求众数、中位数、平均数,在频率分布直方图中,中位数左右两边的直方图面积应该相等,由此估计中位数的值。,0.5-0.1251-0.251=0.125,0.1250.625=0.2,中位数的估计值为2.2,0.125,频率/组距,1 2 3,0,0.25,0.625,利用频率直方图求众数、中位数、平均数,平均数的估计值,从式子能得出什么结论?,平均数的估计值等于频分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。,0.1250.5+0.251.5+0.6252.5=2,平均数的估计值为2,(课本P72),众数的估计值为最高矩形的中点,在频率分布直方图中,中位数左右两边的直方图面积应该相等,由此估计中位数的值。,平均数的估计值等于频分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。,利用频率直方图求众数、中位数、平均数,练习:在城市居民月均用水量样本数据的频率分布直方图中,估计出众数、中位数、平均数。,众 数2.25t,中位数2.02t,平均数2.02t,众数、中位数、平均数优缺点,众数、中位数、平均数优缺点,知识探究(二):标准差,样本的众数、中位数、平均数常不能较好反映数据的实际情况,我们还需要一个统计数字,来刻画数据的离散程度。,标准差,思考1:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7 甲、乙两人本次射击的平均成绩分别为多少环?,思考2:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?,环数,甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定.,思考3:对于样本数据x1,x2,xn,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?,(公式中含有绝对值,运算不太方便,通常改为下面公式计算),思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s表示.假设样本数据x1,x2,xn的平均数为,则标准差的计算公式是:,标准差的范围是什么?标准差为0的数据有何特点?标准差的大小说明数据分布有何特点?,标准的范围是s0,标准差为0的数据都相等,标准越大,数据越分散,离散程度越大;标准差越小,数据越集中,离散程度越小。,由于要求算术平方根,及单位的变化,我们有时用标准差的平方S2(称为方差)来代替标准差。在刻画样本数据的分散程度上,方差与标准差是一样的,在解决实际问题时,一般多采用标准差。,标准差与方差,巩固练习:,1、计算数据1,2,3,4,5的平均数和方差。2、比较甲、乙两名运动员10次射击成绩的稳定性。甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7 3、抛硬币20次,正面12次,反面8次。如果抛得正面得3分,抛到反面得1分,则平均得分是,得分的方差是。,2.2,0.96,探究:,若数据x1,x2,xn的平均数是,标准差是s,又a,b是常数。求:(1)ax1+b,ax2+b,axn+b的平均数;(2)x1+b,x2+b,xn+b的标准差;(3)ax1,ax2,axn的标准差;(4)ax1+b,ax2+b,axn+b的标准差,课堂小结:,1、求数据的众数、中位数、平均数,(1)众数:一组数据中重复出现次数最多的数称为这组数的众数。,(2)中位数:把一组数按从小到大的顺序排列,把处于最中间位置的那个数(或最中间位置的两个位置的平均数)称为这组数据的中位数。,(3)平均数:设有n个数x1,x2,xn,课堂小结:,2、由频率分布直方图求众数、中位数、平均数。,(1)众数的估计值为最高矩形的中点,(2)在频率分布直方图中,中位数左右两边的直方图面积应该相等,由此估计中位数的值。,(3)平均数的估计值等于频分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。,课堂小结:,3、求标准差、方差:,(1)标准差,(2)方 差,(3)标准差(方差)反映了数据的离散程度,标准差(方差)越大,数据离散程度也越大。,jin,今日作业:,学案与测评(同步测试),P64 第5课时,用样本的数据特征估计总体的数据特征,