欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    统计学ch2统计数据收集和整理.ppt

    • 资源ID:6599259       资源大小:581.50KB        全文页数:54页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学ch2统计数据收集和整理.ppt

    第二章统计数据的收集、整理与显示,统计数据的收集统计调查统计数据的整理统计数据的显示,suyl,1,2.1 统计数据的收集统计调查,统计调查的意义统计数据收集是根据统计研究的目的要求,采用科学的形式和方法,获取所研究变量数据的过程,在社会经济统计中也称为统计调查。它是进行统计数据整理和分析的必要前提。对统计数据收集的基本要求是:准确性、及时性、完整性。准确性是指收集的统计数据真实可靠,如实的反应客观实际。及时性是指在规定的时间内,提供及时有效的统计数据。完整性指对应该调查的单位和项目要无一遗漏,数据要相互配套,才能全面系统的反应所研究现象总体的特征。,suyl,2,suyl,3,统计数据收集方式的分类,按照获取途径不同,统计数据可以分为原始数据和次级数据。原始数据是直接从各调查单位的收集数据。次级数据亦称二手数据,是从如统计年鉴、报刊、互联网或有关部门业务管理资料中获取的经过加工整理的数据。相对而言,二手数据的收集比较容易,数据收集的成本低、时间快。但是,二手数据并不一定是为研究者的特定目的而产生的因此在使用二手数据时,要注意数据的定义、内涵、计算口径和计算方法,避免错用、误用、滥用。,suyl,4,统计调查方案,(一)确定调查目的 确定调查目的就是明确一项调查所要解决的问题。第六次全国人口普查的目的是查清2000年以来我国人口数量、结构、分布和居住环境等方面的变化情况,为科学制定国民经济和社会发展规划,统筹安排人民的物质和文化生活,实现可持续发展战略,构建社会主义和谐社会,提供真实准确、完整及时的人口统计信息支持。,suyl,5,(二)确定调查对象、调查单位和填报单位 调查对象是所要调查事物的全体,由许多个别单位构成,即统计总体。调查单位是所要调查的具体单位,是调查项目的具体承担者,即总体单位。调查单位要与调查的填报单位或报告单位相区别。填报单位是向上报告调查内容、提交统计数据的单位,它可能与调查单位一致,也可能不一致。如调查工业生产情况(目的),所有的工业企业是总体(对象),每一个工业企业是调查单位,同时每一个工业企业也是填报单位;而调查工业生产设备情况,所有的工业生产设备是调查对象,每一台设备是调查单位,每一个工业企业是填报单位。(三)确定调查项目 调查项目是具体的调查内容,是调查单位具有的特征,由一系列品质标志和数量标志构成。(四)调查表与问卷设计为了便于调查和汇总,应该把调查项目按一定顺序排列在表格中,这就是调查表。一个调查单位填写一份的调查表称为单一表,若干个调查单位填写一份的调查表称为一揽表。(五)确定调查组织形式和方法,suyl,6,(六)确定调查时间确定调查时间一是指确定标准时间,即调查资料所属的时间,二是指调查期限,即整个调查工作从开始到结束的时间,包括调查登记的时间、数据处理的时间、数据分析的时间。对时期现象,标准时间是一段时间,如2003年第三产业营业收入调查,标准时间是2003年1月1日至2003年12月31日,调查工作时间是2004年1月1日至1月31日;对时点现象,标准时间是某一时刻,例如第六次全国人口普查按照划分的普查区域进行,普查小区划分工作于2010年8月底前完成。在人口普查机构统一领导下,公安机关进行户口整顿,户口整顿工作于2010年9月底前完成。人口普查登记以前,普查员、普查指导员要对普查小区的人口和居住情况进行摸底,摸底工作于2010年10月28日前完成。人口普查的登记工作,从2010年11月1日开始到11月10日以前结束。普查登记结束后,普查指导员应当组织普查员按照规定的方法进行全面复查,复查工作应于2010年11月15日前完成。事后质量抽查工作应于2010年11月底前完成。国务院人口普查办公室应于2011年12月31日前完成人口普查全部数据的汇总工作。(七)确定其它事项包括确定调查机构、培训计划、是否需要试点、经费预算、资料报送程序和方法、数据公布时间等。,suyl,7,统计数据收集的方式,统计调查的组织形式,suyl,8,按范围不同划分全面调查优点:资料齐全、能够满足各级政府领导管理需要;不存在代表性误差。缺点:耗费大,易产生登记性误差。应用:搜集重要的、基础性数据。非全面调查优点:耗费小(人财物时间),不易产生登记性误差。缺点:存在代表性误差;不是所有层次政府领导都能够得到其管辖范围的数据。应用:广泛。,suyl,9,1.普查,概念:为了了解重要的国情国力资料而专门组织的一次性全面调查。作用:调查内容详细、提供重要国情国力资料;提供抽样框。普查应该注意:统一规定普查的标准时间。规定统一的普查期限。统一规定普查内容和指标解释,不得任意改变或增减项目。同类普查,各次调查的项目应尽可能一致,以便于历史资料的对比研究。同类普查应尽可能按周期进行,以便观察现象发展变化的过程和规律。,2统计报表,统计报表是以基层单位的原始记录为依据,依照国家有关法规,自上而下地统一布置,按照统一的表式、统一的项目、报送时间和程序,自下而上地逐级地定期提供统计资料的一种调查形式。3重点调查重点调查是在调查对象中选择一部分重点单位进行调查的一种非全面调查。所谓重点单位,是指所调查标志的表现在其标志总量中所占比重大的少数单位。,suyl,10,suyl,11,2.抽样调查,广义的抽样包括概率抽样和非概率抽样。概率抽样也称随机抽样,是指按照随机原则从总体中抽取部分单位构成样本。非概率抽样也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。非概率抽样常用的方式主要有方便抽样和判断抽样。,suyl,12,方便抽样是指不考虑抽样的概率,纯粹以便于取得样本的方式进行抽样。判断抽样是指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本进行调查的抽样方式。非概率抽样操作简便、时效高、成本低。适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。,suyl,13,概率抽样和非概率抽样是性质不同的两种抽样类型,在调查中采用何种抽样类型,取决于研究问题的性质、使用数据要说明的问题、调查对象的特征、调查费用、调查时间等多方面的因素。统计上所说的抽样一般都是指概率抽样,抽样调查一般都是指随机抽样调查。本教材若无特别说明,抽样均指概率抽样,抽样调查也即对随机样本的调查。,suyl,14,次级资料的收集,次级资料又称第二手资料,是指以前或别人已经收集好的、并经过一定程度整理的统计资料。次级资料的收集通常称为文案调查,是指利用单位内部和外部的各种信息和情报资料,对所需数据资料进行调查;也称为间接调查、桌面调查和二手资料调查。这种调查不受时空限制,可以获得实地调查难以取得的大量历史资料。次级资料包括内部资料和外部资料。内部资料主要指企业或单位内部相关的数据或档案。外部资料指通过统计部门、信息咨询机构、电台和电视台、图书和报刊杂志、互联网络等渠道公布的有关资料,,统计数据收集的具体方法,1直接观察法直接观察法是调查人员深入现场对调查单位进行直接观察、记录和计量。2.报告法报告法是指被调查者按照调查者的要求,根据自己的实际情况如实填报调查内容,以信函、传真、计算机网络等方式向调查者报送数据的方法。3.访问法访问法也称采访法、询问法,是由调查人员提问、被调查者回答来获取数据的方法。除了以上几种传统的调查方法以外,随着计算机网络技术的普及,电子邮件调查法、WED站点调查法、计算机电话辅助调查等以互联网络为平台进行调查的方法应运而生,其应用范围日益广泛。,suyl,15,2.2统计数据的整理,统计数据整理的意义统计整理是指根据统计研究的需要,将统计调查阶段所搜集到的大量个体资料进行科学的分类汇总、加工处理,或对已经经过加工的次级资料再加工,使之系统化、条理化,成为能够反映事物总体特征的综合资料的过程。内容 数据处理:分类、汇总、表现(制表)数据管理:输入、贮存、更新、输出步骤 审核原始资料、数据的分类汇总 数据的表现、数据保管和发布,suyl,16,统计分组,1、概念-统计分组就是根据统计研究的需要,将总体中的所有单位按照一定的标志分为若干部分。对总体分;对个体合。突出组与组之间的差异、抽象组内各单位差异作用 划分类型、反映结构比例、揭示依存关系2、原则 科学性、完备性、互斥性 3.统计分组的种类按分组标志的性质不同分为品质标志分组和数量标志分组。品质标志分组就是从属性上区分各种类型组。,suyl,17,suyl,18,分布数列-统计分组整理的基本结果,1.概念:将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组单位数在总体单位数中所占的比重,这样形成的数列称为分布数列,它表明总体单位在各组的分布状况。构成要素分组标志的具体表现(各组名称或变量值)次数(频数或 频率)2.种类,suyl,19,(1)品质数列,按品质标志分组形成的分布数列,suyl,20,表2-1 某公司职工文化程度状况,文化程度 工人数 比重(%)小学 400 8初中 1500 30高中 2600 52大学 500 10合计 5000 100,品质标志,suyl,21,性别是品质标志,suyl,22,(2)变量数列,单项式数列一个变量值为一个组;适合于:离散型变量且变动范围小 组距数列以一定区间的变量值为一个组;适合于:离散型变量变动范围大、连续变量 等距数列 异距数列 概念:组限(开口、闭口)组距(等距、异距)组中值,suyl,23,某企业日产量,日产量是数量标志,下一个,suyl,24,suyl,25,3.分布数列的编制组距数列,步骤确定全距=最大值-最小值;(排序)先确定组数确定组距确定组限 表现现象的度、规定的界限 体现分布的集中趋势 考虑到习惯、便于对比,suyl,26,某月啤酒公司60个销售点的销量,48 71 52 53 36 41 69 58 47 60 53 29 41 72 81 37 43 58 68 42 73 62 59 4451 53 47 66 59 52 34 49 73 29 47 1639 58 43 29 46 52 38 46 80 58 51 67 54 57 58 63 49 40 54 61 58 66 47 50 单位:桶 excel,suyl,27,啤酒销售量的分布数列(表2-3),销售桶数 销售点数 频率(%)19以下 1 1.72029 3 5.03039 5 8.34049 16 26.75059 20 33.36069 9 15.07079 4 6.780以上 2 3.3 合计 60 100.0,suyl,28,4.累计次数分布,suyl,29,某班学生考试成绩次数表,suyl,30,累计次数分布的应用:将全社会从业人员按收入水平分组,从低收入到高收入组汇总计算向上累计频率,得洛伦茨曲线。,A,B,20世纪初意大利经济学家基尼,根据洛伦茨曲线找出了判断分配均等程度的指标基尼系数:,累计人数(%),0,累计收入(%),绝对平均曲线,绝对不均等曲线,实际分配曲线,suyl,31,基尼系数(洛伦茨系数)=A/(A+B),表示收入(或财富)的不均等程度。在01 之间。系数越大,表示收入分配越是趋向不均等,洛伦茨曲线的弧度越大 联合国有关组织规定:高度平均 比较平均 差距相对合理 差距偏大 两极分化0 0.2 0.3 0.4 0.5,suyl,32,5.次数分布类型和次数分布图,(1)次数分布类型钟型分布中间多、两头少对称分布如正态分布左偏分布(负偏)右偏分布(正偏)U型分布 J型分布,suyl,33,频数分布的类型,suyl,34,(2)次数分布图,分组数据频数分布的特征常用直方图显示。以柱形图的形式对频数分布进行图形化描述得到的图叫直方图。直方图是用于展示组距数列分布特征的一种图形,它是在直角坐标中,用横轴表示数据的分组,纵轴表示频数或频率,这样各组与相应的频数就形成了一个矩形,用矩形的宽度和高度(即面积)来表示频数分布。对于等距数列,各组频数可以直接作为直方形的高度。但对于异距数列,由于各组组距不同,频数的差异不能直接表明数据分布的特征。这时就需要根据频数密度来绘制直方图,以准确反映各组数据分布的特征。其方法是:以各组频数密度(频数密度频数/组距)为各组直方形的高度,或先确定标准组距,将标准组距乘以各组频数密度得到标准组距频数,再以各组的标准组距频数为各组直方形的高度。,suyl,35,suyl,36,suyl,37,suyl,38,2.3统计表和统计图(一)统计表,1统计表的概念把经过调查整理汇总计算而得到的统计数据按一定的结构和顺序,系统地排列在一定的表格内,就形成了统计表。统计表是表现统计数据的基本工具。2统计表的构成统计表从形式上看一般由总标题、横行标题、纵列标题、数字资料等要素构成,必要时可以在表的下方加上表外附加。,suyl,39,表外附加,横行标题,数据,纵列标题,表2-7 2006年三次产业对国内生产总值增长的贡献率和拉动 总标题,资料来源:中国统计年鉴 2007,中国统计出版社。产业拉动指GDP增长速度与各产业贡献率之乘积产业贡献率指各产业增加值增量与GDP增量之比,suyl,40,3统计表的种类,统计表按照分组情况不同,可分为简单表:对总体未经过任何分组,按总体单位排列的统计表称为简单表;简单分组表:对总体按一个标志分组的统计表称为简单分组表复合分组表:对总体按两个及以上标志进行层叠分组的统计表称为复合分组表 将不同时间的数据按照时间顺序排列形成的统计表,就是时间序列表,suyl,41,对于定类数据的描述和分析,通常需要用列联表进行交叉分析。列联表又称为交叉表,它是由两个以上的变量进行交叉分类的频数分布表,可以同时用于汇总两个变量的数据和检验两个变量之间的关系的方法。,suyl,42,200家饭店的质量等级与餐价的列联表,suyl,43,4统计表的设计规则,由于使用者的目的及统计数据的特点不同,统计表在形式和结构上会有较大差异,但其设计的基本要求是一样的,要便于使用者进行比较、分析及阅读,“科学、实用、简练、美观”仍然是设计统计表的基本要求。,suyl,44,编制统计表的基本规则,为了使统计表科学、规范、实用、简练,在编制统计表时一般应注意下列几项规则。1.统计表的各种标题,特别是总标题的表达,力求简明,确切地反映出表的基本内容。总标题一般需要表明统计数据的时间(When)、地点(Where)以及何种数据(What),即标题内容应满足3W要求。2.表中不要罗列太多和过于庞杂的内容,尽可能做到简明扼要。,suyl,45,3.表中的行和列各栏,一般应按先局部后整体的原则排列,即先列各个项目,后列总计。当没有必要列出所有项目时,可以先列总计,而后列出其中一部分的项目。4.如果统计表的栏数较多,通常要加以编号,在横行标题和计量单位等栏,用甲、乙、丙等文字标明;纵列标题各栏,用(1)、(2)、(3)等数字编号。5.表中数字应该填写整齐,对准位数,同栏数字的单位、小数位要一致。若有相同数字应全部填列,不得写“同上”字样。当不应有数字时用“”表示。,suyl,46,6.统计表中必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表头的右上方。如果表中需要分别注明不同单位时,横行的计量单位可以专设一拦;纵拦的计量单位,要与纵标目写在一起。7.必要时统计表应该加注说明或注解。例如,某些指标有特殊的计算口径,某些资料只包括一部分地区,某些数字是由估算来插补等,都要加以说明,此外还要注明统计资料的来源,以便查考。说明或注解一般写在表的下端,作为表外附加。,suyl,47,图2-7 2006-2007年我国直辖市区生产总值图,统计图 1柱形图,suyl,48,2饼图,图2-10 某地区居民对住房满意度,suyl,49,3环形图,环形图与饼图类似,主要用于反映现象的结构,但两者又有区别。环形图可以在一个图上显示多个总体的结构,其中每一环是一个总体数据系列,这样有利于我们比较不同总体的结构差异。,2006年我国东、西部居民人均消费支出构成,suyl,50,4线图,线图是在直角坐标上用折线表现数据变化的图形,主要用于显示时间序列数据,反映现象随时间变化的特征。,全国城乡居民家庭人均收入,suyl,51,5雷达图,2006年我国东西部地区居民人均消费支出构成,suyl,52,茎叶图,茎叶图是反映原始数据的图形。它由茎和叶两部分构成。通过茎叶图,可以看出数据的分步形状及数据的离散状况,如分布是否对称,数据是否集中,是否有离群点等等。绘制茎叶图关键是设置好树茎。制作茎叶图时,首先把一个数字分成两部分,通常是以该数据的高位数值作为树茎,而且叶上只保留该数值的最后一个数字。如125分成12 5,12分成1 2,前部分是树茎,后部分是树叶。茎叶图类似于横置的直方图,与直方图相比,茎叶图既能够给出数据的分布状况,又能够给出每一个原始数据。而直方图虽然能够很好的显示数据的分布,但不能保留原始数值。在应用方面,直方图通常适用于数据量大的情况,茎叶图通常适用于小批量数据。,suyl,53,某电脑公司某年4个月销售量,suyl,54,某电脑公司某年4个月销售量,

    注意事项

    本文(统计学ch2统计数据收集和整理.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开