数据的收集、整理与显示.ppt
《数据的收集、整理与显示.ppt》由会员分享,可在线阅读,更多相关《数据的收集、整理与显示.ppt(174页珍藏版)》请在三一办公上搜索。
1、第二章 数据的收集、整理与显示,第一节 数据的收集第二节 数据的整理第三节 数据的显示,第一节 数据的收集,一、数据概述二、现有统计资料的主要来源三、数据收集的方法四、统计调查的形式五、统计调查体系六、统计调查(数据收集)方案设计,第一节 数据的收集,一、数据概述(数据的概念、计量尺度及分类)(一)、数据的概念所谓数据就是人们对现象进行调查研究所收集、整理、分析和解释的事实和数字,是对客观现象进行计量的结果。数据收集就是根据统计研究预定的目的和任务,运用相应的科学的调查方法和手段,有计划、有组织的向客观实际收集资料的过程。,(二)、数据的计量尺度,定类尺度,定序尺度,定距尺度,定比尺度,精确程
2、度,良好,1980,134公斤,中国,国籍:,健康状况:,出生年份:,体重:,定类尺度,按现象性质差异进行的辨别与区分。测量结果形成定类变量或定类指标。,定类变量或指标确切的值是以文字表述的,可以用数值标识,但仅起标签作用。,定类变量或指标的各类别间是平等的,没有高低、大小、优劣之分。,例如:,性别、种族、运动项目等等,定类尺度(分类尺度),分类,第1类3个,第2类5个,第3类2个,第4类1个,定序尺度,按现象顺序差异进行的辨别与区分。测量结果形成定序变量或定序指标。,定序变量或指标确切的值是以文字表述的,也可以用数值标识,也仅起标签作用。,定序变量或指标各类别间有高低优劣之分,不能随意排列。
3、,定序尺度(分类排序),受教育程度:文盲、小学、中学、大学、大学以上国家:发达国家、发展中国家医院:三级甲、三级乙、三级丙台风预警颜色:黄色、橙色、红色、黑色军衔等级 中国人民解放军军官衔分为3等10级,即将官3级(上将、中将、少将)、校官4级(大校、上校、中校、少校)、尉官3级(上尉、中尉、少尉)。志愿兵役制士兵按军衔等级分为:高级士官(六级土官、五级士官);中级士官(四级士官、三级士官);初级士官(二级士官、一级士官)。职称:初级、中级、高级(副高级、正高级),定距尺度,按现象绝对数量差异进行的辨别与区分。测量结果形成定距变量或定距指标。,定距变量或指标的值以数字表述,有计量单位,可以进行
4、加减运算。,定距变量或指标各类别间自然有大小之分,但没有绝对的零点,不能乘除计算。,两地最高温度相差3沈阳最低温度较大连最低温度低5大连最高温度是沈阳最高温度的2倍,温度,天气预报:沈阳:最高温度3,最低7 大连:最高温度6,最低2,有计量单位C或F,是对次序之间间距进行的测定。每一间隔相等,50度与40度相差10度,30度与20度相差10度。也没有绝对零度。C和F的0度位置不一样,只是一种水平,不表示“没有”或不存在“,按现象绝对差异与相对差异进行的辨别与区分。测量结果形成定比变量或定比指标。,定比变量或指标确切的值也以数字表述,有计量单位,可以进行加减运算。,定比变量或指标有绝对意义上的零
5、点,既可以加减运算,也可以乘除运算。,定比尺度,零高度,零重量,零体积,零面积,零人口,零产量,零资产,真正的零:一无所有,定距尺度与定比尺度的区别,定距尺度中“0”表示一个具体数值,不表示“没有”或“不存在”,定比尺度中“0”表示“没有”或“不存在”。定距尺度 0-273.15-123.15 26.85定比尺度 0K 150K 300K,定距尺度与定比尺度的区别(续),在实际应用中定距尺度与定比尺度差别微不足道,往往不作区分。例如在SPSS Statistics软件中,数据的计量尺度被分为3类:名义(Nominal)有序(Ordinal)度量(Scale),四种计量尺度的比较,计量尺度,数学
6、特性,“”表示该尺度所具有的特性,定序尺度 定类数据定序尺度 定序数据定距尺度 定距数据定比尺度 定比数据,计量类型 数据类型,范畴例:性别:男-女范畴由排序导出例:满意度:高-低,等距区间,能加减0有含义例:摄氏度:0oC,成绩:80,等距区间,能加减乘除0无含义,如0收入=没收入有意义的比值例:收入:100,统计数据的计量与类型,定类数据定序数据定距数据 定比数据,定性数据,定量数据,定类变量例:性别、经济类型,定序变量例:教育程度、产品等级,数字变量(离散、连续)例:成绩、年龄、产量,统计数据的计量与类型,练习题,一、数据概述,(三)数据类型1、按反映现象的特征不同,分:品质数据和数量数
7、据(定性数据和定量数据)(见上一PPT)2、按数据的变化态势分:横截面数据和时间序列数据。3、按数据收集方法分:观测数据和实验数据4、按数据的来源分:直接数据和间接数据,横截面、时间序列和面板数据,横截面数据(Cross-sectional data)是在同一时点或是大约在同一时点所收集的数据。例如2008年我国各直辖市的GDP。时间序列数据(Time series data)是按时间顺序取得的一系列数据。例如我国历年的GDP。面板数据(Panel Data):对多个事物在不同时期或时点上进行测量得到的数据。如1990-2008年全国各个省份的GDP,二、现有统计资料的主要来源,间接来源:1.
8、统计年鉴2.有关期刊3.有关网站,第一节 数据的收集,数据的来源直接来源,直接来源,统计调查方式,选择适合调查方式的方法,数据收集方法,第一节 数据的收集,三、数据收集的方法1.直接观察法2.报告法(通讯法)3.采访法4.登记法5.实验设计调查法6.其他调查法,第一节 数据的收集,四、统计调查的形式,四、统计调查的形式,(一)全面调查与非全面调查统计调查按调查的范围划分,可分为全面调查和非全面调查两大类。1、全面调查:是对调查对象的所有单位一一进行调查。普查、全面统计报表都属于全面调查。2、非全面调查:对调查对象其中的一部分单位进行调查。,1、全面调查,1)普查普查是专门组织的一种全面调查,它
9、主要是用以调查某些不能或不宜用定期的全面报表搜集的统计资料。普查有主要特点:第一,它是一次性(非连续性)的调查。第二,它是一种全面调查,可获得大量详细、全面的资料。如:人口普查;经济普查;农业生产情况普查;2010年11月1日,全国第6次人口普查,1、全面调查,2)全面统计报表制度全面统计报表制度是依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。全面统计报表的实施范围,是调查对象的全部单位均要填报。统计报表的主要特点:第一,资料的来源是各个基层单位的原始记录。第二,逐级上报和
10、汇总的。第三,属于经常性(连续性)调查,调查项目相对稳定。,2、非全面调查,1)抽样调查。抽样调查是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象总体特征作出具有一定可靠程度的推算。A)特点:第一,按随机原则抽取样本。第二,根据部分调查的实际资料对调查对象总体的数量特征作出估计。第三,抽样误差可以事先计算并加以控制。B)适用范围:第一,不可能或不必要进行全面调查的社会现象。第二,对普查资料进行必要的修正。,续:,C)抽样调查的理论基础概率论和数理统计的有关定理。D)抽样调查对数据的要求:所研究的变量是随机变量。E)抽样调查应遵循的原则:第一,随机原则
11、。第二,最大抽样效果原则。,抽样调查的应用案例,抽样调查的方法是透过部分来推断总体。比如要研究一个城市的家庭小汽车问题,按照传统统计报表制,只能通过各区、各居委、各小区、各单位层层发放调查表,再层层上报,每个家庭填一张表。而用抽样调查的方法,只需要调查两三百个家庭就足以比较准确地推断出整个城市的情况。当然,这两三百户家庭要通过科学的抽样来决定。,【专栏21】,抽样调查的应用案例,1936年,美国总统大选前夕,当时,调查业在美国也刚刚起步,该届总统大选的候选人有两位,就是兰登和罗斯福。当时有一本杂志叫文学文摘,它随杂志发了1000万张预选票,最后收回237万张,统计结果是兰登获胜。同时,有一位研
12、究人员叫乔治盖洛普,他运用了与刚才不同的方法科学抽样的调查方法,在全美国选取了1000个样本,他的分析结果是罗斯福获胜。大选结果是罗斯福获得选票1800万张,而兰登只获得选票700万张。这件事使得盖洛普所采用的这种调查方法在全球引起了轰动。,【专栏21】,抽样调查的应用案例,从此,抽样调查在西方得到了普遍认可,盖洛普用他的名字创办的调查公司也常胜不衰。到现在为止,盖洛普调查公司还是全球声誉最好的调查公司,我们国家申办奥运时,就请盖洛普调查公司来做民意调查,调查结果是中国有百分之九十几的支持率,这个数据没有人怀疑,这个数据也是中国获胜的一个重要法码。,【专栏21】,2、非全面调查,2)重点调查:
13、是指在调查对象中,只选择一部分重点单位进行的非全面调查。重点单位:着眼于现象量的方面而言,尽管这些单位在全部单位中只是一部分,但它们在所研究现象的标志总量中却占有绝大的比重,在总体中具有举足轻重的作用。重点单位选多选少,要根据调查任务确定;选中的单位,管理应比较健全,统计力量应比较充实,统计基础应比较巩固,这样才能准确、及时地取得资料。例:某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量80%的五个大型水泥厂的生产情况进行调查,属于重点调查。3)典型调查:典型调查是一种专门组织的非全面调查。根据调查的目的,在对所研究的对象进行初步分析的基础上,有意识地选取若干具有代表性的单位进行
14、调查和研究,借以认识事物发展变化的规律。有人也认为它是“目的抽样”,以若干具有代表性的单位为样本。国企改革成功的典型:宝钢、海尔、联想上市公司内幕交易的典型:基金老鼠仓劳动模范:先进典型三好学生:先进学生典型注重性质方面的调查,四、统计调查的形式,(二)经常性调查与一次性调查。统计调查按时间标志可分为连续性(经常性)和不连续性(一次性)调查两大类。1、连续性(经常性)调查:是指随着研究现象的变化,连续不断地进行调查登记。如统计报表制度。如:客流量调查;人流量调查;信息流量调查 产量调查;资金流调查。2、不连续性(一次性)调查:是指间隔一段较长的时间对事物的变化进行一次性调查,如普查、典型调查。
15、银行不良贷款余额调查;产品库存量调查等。,四、统计调查的形式,(三)定期报表形式与专门调查统计调查按组织形式可分为定期报表形式和专门调查。1、定期报表制度是按国家统一规定的表式和内容,定期地向各级领导机构报送统计资料的一种形式。2、专门调查是为某一专题研究而组织的专项调查,如抽样调查、典型调查、普查。如:2008年,奶粉三聚氰胺含量的专项调查 2010年8月,甘肃“泥石流”人员伤亡情况调查 人民币升值对出口企业的影响调查 房贷利率升高对贷款者还贷的影响调查 空置房调查,第一节 数据的收集,五、统计调查体系统计调查方法体系:建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调
16、查、科学推算和少量的全面报表综合运用的统计调查方法体系。普查和全面报表都是全面调查,但两者不能互相替代。,续:,抽样调查虽然是一种非全面调查,但它能够解决全面调查无法或难以解决的问题,抽样调查调查单位少,调查项目就可以多一些,以便对某一社会经济现象进行更深入的研究,也可以节省调查费用,又可以满足统计时效性的要求。所以,我国统计调查体系是以经常性的抽样调查为主体。如果调查任务只要求掌握基本情况,而现象总体中又有部分单位能比较集中地反映研究项目的数量特征,则可采用重点调查。在统计调查体系中,适度地采用了科学的推算方法。,第一节 数据的收集,六、统计调查(数据收集)方案设计,调查的任务和目的 调查对
17、象和调查单位 调查项目 调查表和问卷设计 调查时间和调查期限 调查工作的组织实施计划,一个完整的调查方案应包括以下内容:,调查的任务就是为管理和决策部门提供相关的、准确的、可靠的、有效的和当前的信息。确定调查目的,就是明确在调查中要解决哪些问题,通过调查要取得什么样的资料,取得这些资料有什么用途等问题。,(一)调查的任务和目的,六、统计调查(数据收集)方案设计,调查的目的,2006年全国开展第二次农业普查;其目的是:1)收集年度间变动缓慢的农业结构性数据 2)为抽样调查提供样本框。主要调查:农业生产经营单位的数量、规模和结构;耕地资源;农业生产条件;劳动力就业和流动;农村社会福利事业等基本内容
18、,调查的目的,2009年上海市第二次全国R&D资源清查的目的1.全面调查了解R&D活动的总体规模和分布情况2.研发队伍的规模和素质状况3.研发资源的投入、成果及产出效益情况4.政府对R&D活动扶持政策的落实情况,调查对象就是需要调查的那些社会现象的总体,总是由性质上相同的许多调查单位所组成的;调查单位就是组成调查总体的具体单位。需要指出的是,调查单位与填报单位有区别。填报单位是负责向上报告调查内容、提交统计资料的单位。调查单位是调查项目的承担者,可以是人、企事业单位,也可以是物。,(二)调查对象和调查单位,六、统计调查(数据收集)方案设计,调查对象、调查单位、报告单位,2006年我国第二次农业
19、普查的对象:中华人民共和国境内的各种类型的农业生产经营单位和农村住户调查单位:每一个农业生产经营单位和农村住户填报单位:基层组织,调查对象、调查单位、报告单位,上海市第二次全国R&D资源清查的对象(范围)国民经济中R&D活动相对密集行业的法人单位 范围包括:农、林、牧、渔业、采矿业、制造业、电力、燃气及水的生产供应业等等,六、统计调查(数据收集)方案设计,调查项目是指向调查单位需要调查的内容。也就是确定向调查单位登记些什么问题,这些问题在统计上叫标志。调查项目一般就是调查单位的各个标志的名称。究竟选择什么标志和选择多少标志,是拟定调查提纲的重要问题。,(三)调查项目,调查项目,上海市全国第二次
20、R&D资源清查的调查内容:1.R&D活动人员数量、素质及其工作量情况2.R&D经费支出、用途及来源情况3.研发用仪器设备等固定资产拥有情况4.R&D项目的研究类型、组织方式及社会经济目标等情况5.R&D专利等自主知识产权的拥有及使用情况6.技术引进、消化、吸收和技术改造情况7.政府给予研发活动的税收减免情况等,把调查提纲中的各个调查项目按照一定的顺序排列在一定的表格上,就构成了调查表。调查表是统计调查的核心部分。调查表的内容一般由表头、表体和表脚三部分组成。调查表的形式一般分为单一表和一览表在市场研究和调查中,调查项目和调查表通常表现为一张调查问卷(见专栏2-2)。,(四)调查表和调查问卷,六
21、、统计调查(数据收集)方案设计,续1,问卷调查是一种特殊的调查形式,常用于民意测验或市场调查。根据调查目的,在调查对象中随机选择或有意识地确定调查单位,以书面文字或表格形式了解被调查者的意见,调查者自愿、自由地回答问卷中所提出的问题。,续2,调查问卷的设计是调查方案设计的核心内容,其在调查中十分重要,它是将调查目的转化为一些被调查者可以回答的问题的重要环节。调查问卷在结构上一般都由开头部分、甄别部分、主体部分和背景部分组成。问卷设计的内容一般包括调查中所提问题的设计、问题答案的设计、提问顺序的设计、编码的设计、量表的设计以及问卷版面格式的设计等。,手机游戏调查问卷(部分),尊敬的女士/先生:您
22、好!我们是xx大学在校学生,为搜集毕业论文资料发放此问卷。本问卷针对您使用手机/手机游戏的行为进行一些调查,大概会占用您5分钟时间。所有调查项目不涉及个人隐私。您有手机吗?A、有(继续提问)B、没有(结束提问)甄别问题,【专栏22】,手机游戏调查问卷(部分),1、您每天用于手机游戏的时间是:封闭式问题A、不使用 B、10分钟以内 C、10-60分钟 D、1小时以上 2、请列出您经常玩的手机游戏的名字(最多3个;如不玩游戏,请填“0”):开放式问题_,【专栏22】,手机游戏调查问卷(部分),3、您下载手机游戏的主要方式是(如不玩游戏,请选“其它”项并填“0”):半封闭式问题A、网上下载并通过数据
23、线传输B、通过WAP网站下载C、到手机服务中心安装 D、通过百宝箱下载 E、其它(请注明)4、您了解手机游戏信息的主要渠道有(最多选3项;如不玩游戏,请选“其它”项并填“0”):A、手机玩家网站/论坛 B、移动梦网 C、手机服务提供商(SP)网站 D、手机杂志 E、其它(请注明),【专栏22】,调查时间指调查资料所属的时间。从资料的性质看,如果所要调查的某一时期的现象,所登记的资料是该时期内从第一天起至最后一天止的累计数。如果所要调查的是某一时点的水平,就是明确规定统一的标准时点。如:第二次经济普查的标准时点为:2008年12月31日24时。第二次经济普查的时期资料为2008年度 调查期限是指
24、整个调查工作的起止时限。包括搜集资料或报送资料的整个工作所需的时间。如第二次经济普查的调查期限为:2009年1月1日5月31日。,(五)调查时间和调查期限,六、统计调查(数据收集)方案设计,要使统计调查工作顺利进行,就要做好组织工作,其主要内容包括:1.建立调查工作的办事机构和领导机构;2.配备调查人员;3.做好调查前的准备工作;4.确定调查试点。,(六)调查工作的组织实施计划,六、统计调查(数据收集)方案设计,思考题 Thinking Challenge,在你读书的大学里,一般会有几个餐厅,在研究餐厅的经济效益时,需要了解学生对餐厅的评价,请思考:用什么办法可以知道学生对学校餐厅食物的评价?
25、,自习内容,1、问卷调查设计和提问2、调查中的误差,第二节 数据的整理,一、数据整理概述二、统计分组三、频数分布,一、数据整理概述,(一)统计数据整理的内容:汇总性整理和再整理(二)数据整理的程序1、统计数据的审核。2、资料的分组和汇总。分组,即对资料按其性质和特点,划分为若干类;汇总,加总计算形成各项统计指标。统计分组和统计指标是整理的中心工作。3、数据的表示与描述:计算频数(频率)、编制统计表或绘制统计图。4、统计资料的积累、保管和公布。,1、统计数据的审核原始数据,审核的内容:1)完整性审核 检查应调查的单位或个体是否有遗漏;所有的调查项目或指标是否填写齐全;2)准确性审核 检查数据是否
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 收集 整理 显示
链接地址:https://www.31ppt.com/p-6050230.html