数据收集与整理综述课件.ppt
《数据收集与整理综述课件.ppt》由会员分享,可在线阅读,更多相关《数据收集与整理综述课件.ppt(57页珍藏版)》请在三一办公上搜索。
1、第二章 统计数据的收集与整理,1、了解各种统计调查方式和方法的特点 和适用场合;2、明确统计数据的误差类型;3、掌握统计分组和图表显示数据的方法。,主要内容(一)数据的计量(二)数据的搜集方式与方法(三)统计数据的整理(四)统计数据的质量,1、定类尺度(列名尺度)Nominal scale 将研究对象按某种属性特征对其进行平行的分类或分组,并给每一类别定名。定类尺度是最粗略、精度最低的计量尺度,也是最基本的尺度。按现象性质差异进行的辨别与区分。确切的值是以文字表述的。各类别间是平等的,没有高低、大小、优劣之分。性别、种族、运动项目等等,第一节 数据的计量尺度,2、定序尺度(顺序尺度)Ordin
2、al scale 是对事物之间等级差别或顺序差别的一种测度。它是把各类事物按一定特征的大小、高低、强弱等顺序排列起来,构成定序数据。按现象顺序差异进行的辨别与区分。确切的值是以文字表述的,也可以用数值标识,也仅起标签作用。各类别间有高低优劣之分,不能随意排列。,是把定序排列的各类事物间的差距,以一定的度量单位明确起来,构成定距的数据。这是比前两种尺度更精确的计量尺度,一般要求建立某种物理的量度单位。按现象绝对数量差异进行的辨别与区分。值以数字表述,有计量单位。可以进行加减运算。各类别间自然有大小之分,但没有绝对的零点,不能乘除计算。,3、定距尺度(间隔尺度)Interval scale,天气预
3、报:石河子9月5日最高温度28,最低173月20日最高温度4,最低2,二者最高温度相差243月20日最低温度较9月5日最低温度低199月5日最高温度是3月20日最高温度的7倍,温度,是量度层次最高的数据测定尺度。它是在定距尺度的基础上增加了一个绝对零点,并抽象掉事物的度量差异的测定尺度。按现象绝对差异与相对差异进行的辨别与区分。确切的值也以数字表述,有计量单位,可以进行加减运算。有绝对意义上的零点,既可以加减运算,也可以乘除运算。,4、定比尺度(比例尺度)Ratio scale,高 层次 低,列名尺度,顺序尺度,间隔尺度,比例尺度,对 宗教、种族、民族、性别、党派、国别、职业等等品质方面的差异
4、进行测量,定类测量,对于人的主观态度定序尺度,第二节 统计数据的来源,统计数据主要来源于两种渠道;一是来源于直接调查和科学实验;二是来源于别人调查或试验的数据。一、统计数据的直接来源及获取 统计数据的直接来源有两个渠道,一是专门组织的调查(所得结果称为观测数据),二是科学试验(所得结果称为试验数据)。统计调查是获得直接数据的重要手段。,统计调查方式,普查,抽样调查,统计报表,直接数据获取的方式,普查是一种专门组织的、对总体全部单位进行的一次性调查。普查往往涉及面广,资料要求细,需要耗费较多的人、物、财力和时间。一方面不宜多采用,另一方面要搞好普查的组织工作。(人口普查、农业普查、经济普查)中华
5、人民共和国成立以来,已成功地进行了六次人口普查,这些普查分别于1953、1964、1982、1990、2000年进行,第六次为2010年。,(一)普查,普查的组织形式:一是组织专门的普查机构,配备一定数量的普查人员,对调查单位直接进行登记;二是利用被调查单位的原始记录和核算资料,由调查单位发放一定的调查表格,由被调查单位填报。,特点:,工作量大,时间性强,需要大量人力、物力和财力,但收集的信息资料比较全面、系统、准确可靠。,任务:,搜集重要的国情国力和资源状况的全面资料,为政府制定长期规划、宏伟发展目标、重大决策提供全面、详细的信息和资料,为搞好定期调查和开展抽样调查奠定基础,原则:,规定统一
6、的标准时点、普查期限、调查项目和指标。,(二)统计报表制度,由政府部门组织,采用统一的表格、统一规定的指标内容、统一规定的报送程序和报送时间,自上而下布置,自下而上报告。,任务:,搜集国民经济和社会发展基本情况的资料,为制订国民经济和社会发展计划和检查计划执行情况服务。,优点:,A、精心周密设计、高度统一、规范B、回收率高,内容相对稳定,便于资料 积 累、对比C、层层上报、逐级汇总,可以满足各部门需要,特点:,调查范围:全面报表、非全面报表 全面报表:要求调查对象每一个单位都填报。非全面报表:要求调查对象中的部分单位填报。内容和实施范围:国家统计报表部门地方报送周期长短:日报、旬报、月报、季报
7、、半年报、年报 报送单位不同:基层统计报表、综合统计报表。,种类:,(三)抽样调查,特点:,1按随机原则从总体中抽取样本;,2以样本指标(统计量)为依据,推断总体参数,检验总体的某种假设;,3抽样误差可以事先计算并加以控制。,优点:经济灵活、时效性强、适应面广和准确性高,是在对研究对象进行全面分析的基础上,有意识地选择部分有代表性单位进行调查优点:调查范围小、省时力、具体深入缺点:具有主观性,是在研究对象中只选择一部分重点单位进行调查以了解总体情况的一种非全面调查优点:省时、省力、不带主观性。,比重较大,人为选择的典型单位,(四)重点调查,(五)典型调查,直接数据获取的方法,统计资料搜集方法,
8、问卷调查,观察法,网上调查法,实验法,二、统计数据的间接来源及获取,统计数据的间接来源主要是公开出版或公开报道的数据(图书、报纸、杂志、统计年鉴、互联网),还有的是未公开出版需购买的数据。在引用这些数据时,一定要注明数据来源,以尊重他人劳动成果。(文献研究法),三大国际组织与中国国家统计局中国GDP数据对比表(单位:10亿元),数据来源:维基百科,间接数据取得的途径,1.统计部门和政府部门公布的有关资料,如各类统计年鉴2.各类经济信息中心、信息咨询机构、专业调查机构等提供的数据3.各类专业期刊、报纸、书籍所提供的资料4.各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料5
9、.从互联网或图书馆查阅到的相关资料,提供统计数据的部分政府网站,三、统计数据的误差,是指统计数据与客观现实之间的差距。误差主要来源:登记性误差和代表性误差。,1登记性误差(非抽样误差)是指由于调查者或被调查者的人为因素所造成的误差。调查者所造成的误差:调查方案中有关的规定或解释不明确导致的填报错误;调查员粗心,在记录调查结果时出现错误;调查员的态度、情绪以及责任心等。被调查者所造成的误差:不理解调查方案中有关规定或解释不明确导致的填报错误;因人为因素干扰形成的有意虚报或瞒报调查数据等。注:登记性误差理论上讲是可以消除的。,2代表性误差(抽样误差)是指用样本数据进行推断时所产生的误差。所有样本可
10、能的结果与总体真值之间的平均性差异。依据随机原则抽取样本,样本不同,就会得到不同的观测结果。代表性误差通常无法消除,但事先可以进行控制和计算。影响代表性误差大小的主要因素:样本容量:样本容量越大,代表性误差就越小总体的离散程度:总体中各个体间的差异越大,抽样误差也就越大,第三节 数据整理和频数分布,数据的预处理,数据分组与频数分布,数据的展示,数据整理过程,统计数据的整理是将收集到的各种原始数据条理化、系统化,使之符合统计分析与推断要求。整理数据的中心任务:分组、编制频数分布表。,一、数据的审核与筛选(一)审核 准确性 时效性 一致性(二)筛选 剔出某些不符合要求的数据或明显错误 的数据;选出
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 收集 整理 综述 课件
链接地址:https://www.31ppt.com/p-2157280.html