用样本估计总体(一)ppt课件.pptx
《用样本估计总体(一)ppt课件.pptx》由会员分享,可在线阅读,更多相关《用样本估计总体(一)ppt课件.pptx(82页珍藏版)》请在三一办公上搜索。
1、2.2.1用样本的频率分布估计总体分布(一),为天地立心,为生民立命,为往圣继绝学,为万世开太平,横渠四句,如何从样本数据中提取基本信息来估计总体的情况呢?,抽样是统计的第一步,接下来就要对样本进行分析。,2.2 用样本估计总体,一、用样本的频率分布估计总体的分布,二、用样本的数字特征估计总体的特征,平均数、中位数、众数、,极差、方差、标准差,频率分布表、频率分布直方图、频率折线图、,下表给出100位居民的月均用水量表,上面这100个数据比较散乱,从中很难看出居民用水量的分布情况,必须对数据进行整理,我们可以用:,频率分布直方图,频率分布表,第一步: 求极差: (数据组中最大值与最小值的差距)
2、,最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1,第二步: 决定组距与组数: (注意取整),当样本容量不超过100时, 按照数据的多少, 常分成512组.为方便组距的选择应力求“取整”. 本题如果组距为0.5(t). 则,第三步: 将数据分组:( 给出组的界限),所以将数据分成9组较合适.,0, 0.5), 0.5, 1), 1, 1.5),4, 4.5) 共9组.,第四步: 列频率分布表.,组距=0.5,0.04,0.08,0.08,0.16,0.3,0.15,0.44,0.22,0.25,0.5,1,2.00,0.02,0.04,0.04,0.08,0.1,0.
3、3,0.15,0.05,为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,月均用水量/t,频率组距,0.50.40.30.20.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,月均用水量/t,频率组距,0.50.40.30.20.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,月均用水量/t,频率组距,0.50.40.30.20.1,0.5
4、 1 1.5 2 2.5 3 3.5 4 4.5,O,为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,月均用水量/t,频率组距,0.50.40.30.20.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,月均用水量/t,频率组距,0.50.40.30.20.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,月均用水量/t,频率组距,0.50
5、.40.30.20.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,月均用水量/t,频率组距,0.50.40.30.20.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,月均用水量/t,频率组距,0.50.40.30.20.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,为了
6、直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,月均用水量/t,频率组距,0.50.40.30.20.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,频率/组距,月均用水量/t,(组距=0.5),小长方形的面积=?,小长方形的面积总和=?,月均用水量居民人数最多的在哪个区间?,第五步: 画出频率分布直方图.,同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断.分别以1和0.1为组距重新作图,然后谈谈你对图的印象.,频率分布直方图的特征:1.频率分布直方图
7、频率分布表更直观地反映了样本的分布规律.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。,如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,你能对制定月用水量标准提出建议吗 ?,88%的居民月用水量在3t以下,可建议取a=3.,小结: 画频率分布直方图的步骤: 第一步: 求极差: (数据组中最大值与最小值的差距) 第二步: 决定组距与组数: (强调取整) 第三步: 将数据分组 ( 给出组的界限) 第四步: 列频率分布表. (包括分组、频数、频率、频率/组距) 第五步: 画频率分布直方图(在频率
8、分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.),组距:指每个小组的两个端点的距离组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。,注意,(2)纵坐标为:,练习:,例 某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58.(1)列出样本频率
9、分布表; (2)画出频率分布直方图;(3)估计年龄在3252岁的知识分子所占的比例约是多少.,(1)极差为67-28=39,取组距为5,分为8组.,分 组 频数 频率 27,32) 3 0.06 32,37) 3 0.06 37,42) 9 0.18 42,47) 16 0.32 47,52) 7 0.14 52,57) 5 0.10 57,62) 4 0.08 62,67) 3 0.06 合 计 50 1.00,样本频率分布表:,(2)样本频率分布直方图:,(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在3252岁的知识分子约占70%.,课堂练习,2(2006年全国卷II
10、)一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在2500,3000(元)月收入段应抽出_人.,0.0001,0.0002,0.0003,0.0004,0.0005,月收入(元),频率/组距,25,1000 1500 2000 2500 3000 3500 4000,课堂练习,A. 0.27,78B. 0.27,83C. 2.7,78D. 2.7,83,A,2.2.1用样本的频率分布估计总体分布(二),频率分布直方图如下
11、:,连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图,频率分布折线图,由于样本是随机的,不同的样本的得到的频率分布折线图不同,即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,频率分布折线图是随着样本的容量和分组情况的变化而变化的。,利用样本频分布对总体分布进行相应估计,(3)当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲线总体密度曲线。,(2)样本容量越大,这种估计越精确。,(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?,总体密度曲线,频率组距,月均用水量/t,a,b,(图中阴影部分的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 估计 总体 ppt 课件

链接地址:https://www.31ppt.com/p-1427526.html