统计基础知识与统计实务第一讲.ppt
2023/10/21,1,内容包括:Ch1 绪论Ch2 统计调查Ch3 统计整理,第一讲:统计基础知识之一,2023/10/21,2,“没有统计,其它科学可以存在,但是很渺小”一个著名医生说:“医学若无统计就不是科学”,引子:初识统计,2023/10/21,3,香港城市大学管理科学系介绍统计专业时用了四句话:各大机构和国际企业均设立完善的信息系统;统计是信息系统中不可缺少的一项功能;所有具规模的企业均视数据库为“金矿”;统计学便是开采这个“金矿”的最有效工具。,2023/10/21,4,台湾辅仁大学的一位教授说:“统计即生活,统计即人生”。,平均数中庸法则 平均数代表中间水平,集中趋势;人生一切行为,应既不过分自我膨胀,也不过分自我矮化,适中而行,保持平衡的心性,才能乐观进取,发挥潜能。,2023/10/21,5,尿布和啤酒 一个有趣的统计应用实例,在一个超级市场的货架上,你会发现一个有趣的现象,尿布和啤酒赫然摆在一起销售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。,这不是一个笑话,而是发生在美国沃尔玛超市的真实事件,并且一直为商家所津津乐道。原来,美国的太太经常叮嘱她们的丈夫下班以后要为孩子买尿布,而丈夫们在买完尿布之后又顺手带回了自己爱喝的啤酒,因此啤酒和尿布在一起购买的机会是最多的。,2023/10/21,6,是什么让沃尔玛发现了尿布与啤酒之间的关系呢?正是使用了统计上的数据挖掘技术,经过对沃尔玛超市一年多的原始交易数据进行详细分析,才发现了这对神奇的组合。,2023/10/21,7,统计学在经济中的一些应用,宏观经济统计(人口普查、经济普查)市场研究财务分析经济预测人力资源管理,2023/10/21,8,市场研究,企业要在激烈的市场竞争中取得优势,首先必须了解市场,要了解市场,则需要广泛的市场调查,取得所需的信息,并对这些信息进行科学的分析,以便作为生产和经营的依据,这些都需要统计的支持。,2023/10/21,9,财务分析,上市公司的财务数据是股民投资选择的重要参考依据。一些投资咨询公司主要是根据上市公司提供的财务和统计数据进行分析,为股民提供投资参考。企业自身的投资,也离不开对财务数据的分析,其中要用到大量的统计方法。,2023/10/21,10,经济预测,企业要对未来的市场状况进行预测,经济学家也常常对宏观经济或某一方面进行预测。例如,企业要对自己产品的市场潜力作出预测,以便及时调整生产计划,这就需要利用市场调查取得数据,并对数据进行统计分析。经济学家在预测通货膨胀时,要利用有关生产价格指数、失业率、生产能力等统计数据,然后利用统计模型进行预测。,2023/10/21,11,人力资源管理,当今社会,人才是一项非常珍贵的资源,在企业竞争中起着关键性的作用。对企业来说,有效的人力资源管理机制的建立将有助于企业保留、吸引和激励人才,从而推动企业发展战略实现。利用统计方法对企业员工的年龄、性别、受教育程度、工资等进行分析,并对企业制定工资计划、奖惩制度的依据。,2023/10/21,12,统计的应用领域概览,2023/10/21,13,统计的具体应用领域之一,actuarial work(精算)agriculture(农业)animal science(动物学)anthropology(人类学)archaeology(考古学)auditing(审计学)crystallography(晶体学)demography(人口统计学)dentistry(牙医学)ecology(生态学)econometrics(经济计量学)education(教育学)election forecasting and projection(选举预测和策划)engineering(工程)epidemiology(流行病学)finance(金融)fisheries research(水产渔业研究)gambling(赌博)genetics(遗传学)geography(地理学)geology(地质学)historical research(历史研究)human genetics(人类遗传学),2023/10/21,14,统计的具体应用领域之二,hydrology(水文学)Industry(工业)linguistics(语言学)literature(文学)manpower planning(劳动力计划)management science(管理科学)marketing(市场营销学)medical diagnosis(医学诊断)meteorology(气象学)military science(军事科学)nuclear material safeguards(核材料安全管理)ophthalmology(眼科学)pharmaceutics(制药学)physics(物理学)political science(政治学)psychology(心理学)psychophysics(心理物理学)quality control(质量控制)religious studies(宗教研究)sociology(社会学)survey sampling(调查抽样)taxonomy(分类学)weather modification(气象改善),2023/10/21,15,统计学非常有用!,但统计不是万能的!,因为统计能帮助我们进行数据分析,并从分析中得出有用的结论,但对统计结论的进一步解释,则需要更多的专业知识。,2023/10/21,16,第一章 总论,内容包括:1.1 统计的涵义1.2 统计学中的基本概念1.3 统计的任务与过程,重点:基本概念,2023/10/21,17,1.1 统计的涵义,一、什么是统计?统计是指对某一现象有关的数据进行搜集、整理、计算和分析等一系列活动。统计的多重含义:统计工作、统计资料和统计学,2023/10/21,18,统计工作,统计的含义之一,政府统计:国家统计局、职能部门企事业单位统计:工厂统计机构等经营统计:调查咨询公司、统计事务所等其它:如研究性统计机构等,利用科学的方法搜集、整理、分析和提供关于社会经济现象数量资料的工作的总称,2023/10/21,19,是统计工作的成果。是指用来反映各种社会经济现象和过程的数据资料的总称,也可称为统计数据。,统计的含义之二,统计资料,2023/10/21,20,是阐述统计方法的一门科学和理论。研究如何搜集、整理、分析数据资料从而认识数量规律的一门方法论科学。,统计学,统计的含义之三,Statistic is the science for learning from data.,2023/10/21,21,二、三者的关系,第一,统计工作与统计资料是统计活动过程与活动成果的关系。第二,统计工作与统计学是统计实践与统计理论的关系。第三,统计工作是先于统计学而发展起来的。,2023/10/21,22,1.2 统计学中的基本概念,三对基本概念:一、(统计)总体与总体单位二、(统计)指标与标志三、变异与变量,2023/10/21,23,统计总体,总体是在一定的研究目的下,所要研究事物的全体,它是由客观存在的、具有某种共同性质的众多个别事物构成的整体。调查对象,总体单位,总体单位构成总体的个别事物即个体。总体单位是所要研究具体问题的承担者。调查单位。,一、(统计)总体与总体单位,2023/10/21,24,总 体,总体单位,总体的特点:大量性 同质性 变异性,总体由总体单位构成,要认识总体必须从总体单位开始,总体是统计认识的对象。例:研究某班学生的学习情况 某市的工业生产情况 某市的工业生产设备情况,2023/10/21,25,统计总体的种类,指所包含的单位数目有限的总体,指所包含的单位数目无限的总体,有限总体,无限总体,个体的数量,总体与总体单位的相互关系,随着研究目的的不同,总体与总体单位可以互相转化。,2023/10/21,26,例如:,1、研究目的:调查所有国有企业国有资产的使用情况总体:所有国有企业 总体单位:每个国有企业,2、研究目的:调查一个国有企业内部各部门国有资产的使用情况总体:这个国有企业 总体单位:企业内部的每个部门,总体与总体单位可以转换,2023/10/21,27,4、研究目的:研究一个企业的职工人数总体:一个企业总体单位:每一个职工,3、研究目的:研究一个城市的企业规模总体:该市所有企业总体单位:每一个企业,总体与总体单位可以转换,2023/10/21,28,二、(统计)指标与标志(一)指标(index),指数量的特征是指标量的规定性。统计指标离不开数值。,用来说明总体的数量特征的名称,或者名称及其数值(有两种理解),指标内容和所包括的范围,即指标质的规定性。,定义,2023/10/21,29,例如:,1、进行全国人口普查活动,全国人口总数是一个指标。或者,全国人口总数为12.9533亿人也是一指标注意:指标都是能用数值来表示的,2、2000年我国进出口总额4700亿美元。则名称进出口额,数值4700亿美元。,2023/10/21,30,如:职工性别、工资水平、所有制性质、职工人数等,定义,说明总体单位属性特征的名称,品质标志,数量标志,表示事物质的属性特征,表示事物量的属性特征,(用文字表示),(用数字表示),(二)标志(Attribute),按照标志的性质不同,分为,例如,性别、职称、学历、政治面貌等,例如,工资、年龄等,分类,2023/10/21,31,标志,标志值,品质标志,标志表现(标志值)每个总体单位在标志下的具体表现或取值。,2023/10/21,32,(三)指标与标志的区别,1.指标是描述总体特征的;而标志是描述总体单位特征的。前者范围大些,后者的范围小些。2.指标都是能用数值表示的,而标志分为可用数值表示的数量标志、与不能用数值表示的品质标志。,2023/10/21,33,(四)指标与标志的联系,1.指标数值是由标志值计算或汇总来的;如,以某一个省份为总体,其总人口指标的数值是由其总体单位的标志值所属各城乡人口数,汇总得出的。2.指标和标志有时可以转换。当以某一个城市为总体时,该市人口数就成为指标数值了。,2023/10/21,34,三、变异与变量,(一)变异(Variance):同一总体内的每个总体单位之间除了具有同质性(称为不变标志),还具有差异性(称为变异标志),而且还细分为品质变异与数量变异。变异,是指同一总体中的总体单位在选定的标志下,其标志表现存在差异,这种差异叫变异。,2023/10/21,35,例如:,1、如考察某企业所有职工这一总体的情况其中每一位职工这个总体单位按照学历(品质)标志,其表现为高中及以下、大学、研究生,这三个不同的表现。具有差异性(属于品质变异)。2、若按照工资(数量)标志,每一个职工的工资水平也高低不同,也具有差异性(属于数量变异)。3、若按照职工性别(品质)标志,其表现为男、女两种不同标志表现,2023/10/21,36,(二)变量(variable),1.定义:可变的数量标志。或者数量变异标志。2.变量值 变量的具体表现或取值。3.变量的分类:连续变量:身高、体重、产值等。需要测算或计算.离散变量:企业数目、职工人数等。需要计数。注意:“年龄”作为特殊的连续变量,通常只取整数。,2023/10/21,37,总体与总体单位、指标与标志、变异与变量之间的联系,见教材P7 的图示1-1,以及下面的说明。,总体(同质),总体单位(变化),组合,无限总体-抽样调查,有限总体-抽样调查、全面调查,标志(单位),指标(数量),说明,说明,数量,品质,汇总,变换(总体个体),变异(可变),变量(连续、离散),数量变异标志,变量值,具体表现,汇总,相互转换,2023/10/21,38,统计越秀区男性人口年龄、爱好情况,不变标志,变异标志,数量标志,连续变量,取整数,品质标志,例如:,2023/10/21,39,对安徽财贸学院的学生状况进行调查安徽财贸学院的所有学生是总体安徽财贸学院的每一位学生是总体单位性别、民族是品质标志年龄、体重、身高是数量标志,也称变量,2023/10/21,40,1.3 统计的任务与过程,一、统计的任务根据中华人民 共和国统计法的规定,我国统计的基本任务是,对国民经济和社会发展情况进行统计调查、统计分析、提供统计资料和统计咨询意见,实行统计监督。共计三方面任务。,2023/10/21,41,统计活动的过程举例,2023/10/21,42,统计活动过程图示,2023/10/21,43,二、统计的过程:,包括:1.统计的工作过程2.统计的认识过程两个方面,2023/10/21,44,(一)统计的工作过程,统计设计统计调查统计整理统计分析统计预测与决策,第六次全国人口普查方案(包括总则、标准时点、对象和内容、宣传工作等),绘制普查小区图、编制普查小区各户户主姓名底册、入户调查,光电录入、按省市进行汇总,公布人口普查资料,2023/10/21,45,(二)统计的认识过程,从定性认识(统计设计)到定量认识(统计调查和统计整理),再到定量认识与定性认识相结合(统计分析),2023/10/21,46,总结要点,本章作为课程内容的开篇,简要介绍了统计的含义、统计学的基本概念、统计的任务与过程等内容。,2023/10/21,47,第一章 练习思考题,目的:要对北京市的私有工业企业进行调查。已知:北京市共有私有工业企业3000家,全年的工业总产值为1亿元,职工人数为20万人;其中,有一家水泥生产厂,有职工1000人,其中有800名男职工,全年工业总产值为200万元。要求:区分其中的总体、总体单位、标志和指标,并指出标志和指标的类型。,2023/10/21,48,第一章 其他练习题,见习题册P1 单选题:3、4、5、8、10P2 多选题:2、10P2 判断题:6、10、11,2023/10/21,49,第二章 统计调查,这是统计工作的起点,是以获得所需要的统计资料为目的搜集统计资料的过程。,重点:调查种类,2023/10/21,50,包括如下五小节内容,2.1 统计调查的概念与种类2.2 统计调查方案2.3 统计调查方式2.4 统计资料搜集的方法2.5 调查资料的质量控制,2023/10/21,51,2.1 统计调查的概念与种类,一、概念、作用二、统计调查的要求三、统计调查的种类,2023/10/21,52,一、统计调查的概念、作用,(一)概念:就是根据研究目的和任务,运用各种科学的调查方法,有计划的、有组织地搜集统计资料的工作过程。一般是指向各个总体单位搜集资料,为原始资料(尚待汇总整理的一手资料),但有时也指次级资料(已加工整理的二手资料)。,1、搜集原始资料直接获得、未整理2、搜集次级资料间接获得、加工整理,2023/10/21,53,(二)统计调查的作用,统计工作中的调查、整理和分析等环节是彼此密切联系的。其中,统计调查是整个统计工作的基础环节。如果调查工作做得不好,得到的资料残缺不全或有错误,就会影响到整个后续的统计工作。,2023/10/21,54,二、统计调查的要求,1.准确性:统计资料要符合客观实际,要真实可靠。2.及时性:要在规定时间内提供有关资料,以保证时效。,衡量统计工作质量的重要标志,准确性,及时性,2023/10/21,55,三、统计调查的种类,1、全面调查和非全面调查调查对象范围2、连续调查和不连续调查调查登记时间3、统计报表调查和专门调查调查组织方式,对全国的人口进行普查,对全国钢铁生产重点单位调查,按月上报钢铁产量,对2006年大学毕业生分配情况调查,月报,北京路人流量调查,2023/10/21,56,2.2 统计调查方案,一、确定调查目的二、确定调查对象、调查单位和报告单位三、设计调查项目和调查表四、确定调查方式和方法五、制定调查地点、时间及组织实施计划,2023/10/21,57,一、确定调查目的,所谓调查目的,就是统计调查要解决哪些问题?获取哪些资料?资料有何用途?调查目的确定是设计统计调查方案的首要问题。其确定的具体要求是要做到简明扼要。例如,我国2010年人口普查的目的是.人口总数、性别比、年龄结构等。,2023/10/21,58,二、确定调查对象、调查单位和报告单位,1.调查对象:相当于本章第一节介绍的“统计总体”概念。2.调查单位:类似于“总体单位”。3.报告单位:是负责向上级部门或单位报告或提交调查内容的单位(这里指自然人或法人)。注意:调查单位与报告单位的区别。二者有时一致,有时不一致。例如,P13,习题册P5 33-35题,2023/10/21,59,2023/10/21,60,三、设计调查项目和调查表,(一)调查项目及注意的问题:P13调查项目,是指向调查单位所要调查的内容,即调查单位的各个标志的名称。注意的问题:1.涵义明确2.既需要、又有可能获得资料3.项目之间有联系,2023/10/21,61,(二)调查表含义及其构成形式,将调查项目按一定的结构和顺序排列成的表格。构成:表头、表体、表脚,见表2-1调查表的种类:单一表和一览表。,2023/10/21,62,2023/10/21,63,四、调查时间和调查期限,调查时间:资料所属时间,包括时期或时点。调查期限:指调查工作从开始到结束的时间长度,包括登记、整理、分析和完成调查报告的时间。,2023/10/21,64,五、制定调查工作的组织实施计划,包括:设立领导机构和办事机构;调查人员的选择、组织和培训;调查试点;资料报送办法;调查表格、文件印刷;经费预算及开支办法等。,2023/10/21,65,2.3 统计调查的方式,一、定期统计报表二、各种专门调查:分为(一)普查、(二)重点调查、(三)抽样调查(四)典型调查三、各种统计调查方式的结合运用,2023/10/21,66,一、定期统计报表,是按国家有关规定,自上而下统一布置,自下而上按照统一要求提供基本统计资料的一种报告制度。优点:法定性、统一和及时、准确、可满足各级领导机关了解资料的需要缺点:缺乏灵活性;需要大量的人力、物力和财力;调查效益差;基层负担重;易受行政干扰而造成信息失真等。,2023/10/21,67,二、专门调查,(一)普查含义:为了某一特定目的而专门组织的一次性全面调查。我国统计调查方法以周期性普查为基础的主要原因:搜集国家重要国情、国力资料的需要;,2023/10/21,68,优点:所得数据比全面统计报表更全面系统、准确、可靠;可以使资料分组更详细;一种快速普查,可以在很短时间内取得某种急需资料。组织方式:(1)组织专门的普查机构(2)由被调查单位填报,2023/10/21,69,(二)重点调查,重点调查的含义:属于非全面调查,是从调查对象的全部调查单位中选择一部分重点单位进行调查的一种调查方法。其中,重点单位是指总体中具有举足轻重的那些单位,这些单位数目可能不多,但它们的标志总量(即标志值之和)却占总体标志总量的绝大部分。可以通过重点单位反映总体的基本情况。如,选择我国少数几个大的钢铁(或石油、煤炭、化工)生产基地,就可基本把握全国总体钢铁生产的基本状况。,2023/10/21,70,(三)抽样调查,含义的要点:非全面调查,随机原则,由样本指标推算总体指标优点:社会投入少;具有很高的精确度;可以测算抽样误差;减少了行政干预,故具有较高的准确性和真实性。,2023/10/21,71,(四)典型调查,含义:根据研究的目的,在对总体进行初步的全面分析基础上,从总体中有意识地选择一个或几个具有代表性的单位进行的调查。该种调查可以加深对全面调查资料的认识。,重点调查与典型调查的区别 重点调查和典型调查都是非全面调查。主要是调查的着眼点不同。重点调查是选取一部分重要样本进行调查,这些重要样本在量的方面占优势,可以进行定量调查;而典型调查是有目的的选取有代表性的样本进行调查,侧重该样本的质的方面,可以进行定性调查。,2023/10/21,72,通过调查鞍钢、首钢、宝钢等几个大钢铁基地来了解我国钢铁的基本状况 通过对几个小型的新型节能型钢铁企业来了解我国钢铁节能情况,重点调查,典型调查,量方面的差异,质方面的差异,例如:,2023/10/21,73,2.4 统计资料搜集的方法,一方面,搜集为加工整理的原始资料另一方面,搜集已经被他人整理或用过的资料,为我所用,成为次级资料或文案资料。,2023/10/21,74,一、初级资料的搜集方法,(一)直接观察法(二)报告法(三)面谈访问法:入户访问法、街上拦截访问法(四)邮寄访问法(五)电话访问法(六)互联网访问法见教材P19-22:了解各种搜集方法的优缺点,2023/10/21,75,二、次级(文案)资料的搜集方法:步骤:判别所需资料 寻找资料 清理补充,三、企业事业单位统计资料的搜集(一)原始记录:最初性、直接性(二)统计台帐:按时间顺序登记、汇总或几类资料的账册。又分:进度台账与历史台账(三)企业内部报表,2023/10/21,76,四、统计资料报送的组织形式,1.传统的报送方式:2.计算机数据处理和远程传输3.其他报送方式:网上报送,2023/10/21,77,2.5 统计调查资料的质量控制,主要是针对调查误差而言的。所谓误差,是指调查所得数据与调查总体真值之间的差距。,2023/10/21,78,一、统计调查误差的种类,登记性误差:由于调查过程的各个环节上工作不准确而造成的,如计量、登录、计算等环节出现的误差。登记性误差在全面调查和非全面调查中都存在,它在调查工作中是可以避免和减少的。代表性误差:又称抽样误差,是以样本指标值(或样本统计量)估计总体指标值(或总体参数)而产生的误差。代表性误差只有在非全面调查中存在,该误差不可以避免,但可以计算。,2023/10/21,79,二、控制统计调查误差的途径,(一)控制登记误差的方法(二)控制代表性误差的方法:保证随机性、调整样本容量,改变调查方式,等,2023/10/21,80,第二章 练习题,见习题册P3-5 单选题:3、6、8、12、14、15、20、21、25、26、28、36-38P5-7 多选题:6、7、11、12、P7 判断题:1、4、7、12,2023/10/21,81,3.1 统计整理的内容与方法3.2 统计分组3.3 次数分布3.4 数据录入与质量控制3.5 统计表,第三章 统计资料的整理,重点:编制数列,2023/10/21,82,3.1 统计资料整理的内容与方法,一、概念:统计资料整理,又称统计整理,是统计调查工作的继续和深化;是指对原始资料进行审核、分组、汇总的过程。又是进行统计分析和预测的基础和前提。是达到统计研究的目的,完成统计工作必不可少的重要环节,起到承前启后的作用。,2023/10/21,83,二、统计整理的内容(见教材P26),包括四个方面:资料的审核与检查 对指标综合汇总、分组、汇总出各组单位数和指标总数 编制统计表与分析表 资料的系统积累,2023/10/21,84,三、统计整理的方法,基本方法是:分组、汇总、编制统计图表以下将分别介绍!,2023/10/21,85,3.2 统计分组,一、统计分组的概念1.统计分组:是根据统计研究任务和对象的特点,按照一定的分组标志将统计总体(研究对象)划分为性质不同的若干组成部分。2.理解要点:(1)分组对象是总体(2)应有分组标志(3)对总体而言是“分”,对总体单位而言是“合”,2023/10/21,86,二、统计分组的作用,1.发现现象的特点与规律 2.将复杂现象划分为各种类型;3.说明总体现象中各组成部分的内部结构;4.揭示现象之间的联系、依存和制约关系。见教材P28-29,2023/10/21,87,举例:不同教育阶段接受不同形式教育的赞同比率(%)(2002.03),民办 国办 外国学龄前 46.5 37.5 16九年义务 0 96.5 3.5高中 5 76.5 18.5大学及以后 1 9.5 89.5各类培训班 26.5 3.0 70.5,属于揭示总体内部结构与规律问题,2023/10/21,88,三、统计分组方法选择分组标志和划分各组界限,(一)选择分组标志的原则1.要从研究目的和任务出发来选择分组标志;如,分析工人文化素质,应选文化程度或技术等级为标志。若分析劳动力素质,应选年龄为标志。2.要选择最能反映被研究现象本质或主要特征的标志3.选择分组标志不能脱离现象所处的具体历史条件和经济条件。,2023/10/21,89,(二)分组方法,1.按照品质标志与数量标志分组2.按主要标志与辅助标志分组,2023/10/21,90,四、统计分组体系,(一)简单分组与平行分组体系,平行分组特点是标志间为并列关系,(属品质标志),(属品质标志),(属数量标志),2023/10/21,91,(二)复合分组与复合分组体系,某一企业全部职工,1.按性别分,2.按工资水平分,男职工,女职工,2.按工资水平分,复合分组特点是标志之间为嵌套关系,2023/10/21,92,五、统计工作中常用的分组,(一)按生产资料所有制性质(现在改为按经济类型)分(二)按国民经济行业分:农业、工业、工业和能源、建筑业、运输和邮电,等,见目录。(三)按单位隶属关系分:中央或地方(四)按地区分详见中国统计摘要2005,2023/10/21,93,3.3 次数分布,一、次数分布的概念按某一标志分组之后的总体,再按照顺序进行排列,列出各组中的总体单位数,形成总体单位数在各组间的分布的数列,称为次数分布数列,简称分配数列。也称为次数分布。因为各组的总体单位数叫做次数,或频数。常用f表示。,两个组成要素分组和次数,2023/10/21,94,二、分配数列的种类,1.按品质标志分组品质分配数列2.按数量标志分组变量分配数列对于变量(分配)数列而言,又分为单项式变量数列、组距式变量数列。品质数列分配数列 单项式变量数列 变量数列 组距式变量数列,2023/10/21,95,品质,数量,连续变量,例如:,品质数列品质标志,变量数列数量标志,2023/10/21,96,三、变量(分配)数列的编制,(一)单项式分组单项式变量数列:单项式分组是将一个变量值作为一组,这样的分组所形成的变量分配数列这样的分组所形成的变量分配数列叫单项式变量数列,简称单项式数列。如,P35中的表3-6为单项式分组;其编制比较简单。,2023/10/21,97,(二)组距变量数列的编制,通过组距式分组组距式变量数列:组距式分组是以变量值变动的一定范围作为一组,这样的分组所形成的变量分配数列叫组距式变量数列,简称组距数列。例如,P35:表3-7为组距式分组其编制方法关键是以下四个方面基本要素:组距与组数、等距与异距、组限与组中值、频数与频率,2023/10/21,98,1、组距与组数,组距:组距数列中,每组上限与下限之差,叫组距。即:组距=上限-下限,组数:将某一个变量数列划分为多少个组,组距与组数呈反向关系,2、等距数列与异距数列,等距数列:各组组距相等异距数列:各组组距不等,2023/10/21,99,3、组限与组中值,组限:组距数列中,每一组标志值变动范围的两个数,叫组限,其中较小的数叫下限,较大的数叫上限。,组中值:每一组标志值中点位置的数值叫组中值。即:组中值=(上限+下限)/2;下限+(上限-下限)/2;上限-(上限-下限)/2,对于开口的首组和末组,要确定组限、组中值要特别注意:首组开口的下限和组中值计算公式:首组上限-邻组组距/2末组开口的上限和组中值计算公式:末组下限+邻组组距/2,(),(),(),2023/10/21,100,对离散变量,当变量值不多时,变成单项式即可。若变量值很多需要分组时,相邻两组的上、下限一般用相邻的两个不同数值(或差值为1)。对连续变量分组时,相邻两组的上、下限可重叠,也可不重叠。若重叠,即为同一个数值,应遵循“组上限不在组内”原则。如表3-7种的500为首组的上限,应属于第二组。同理,550应属于第三组。,2023/10/21,101,组距=50,组数=6,上限=700下限=650组中值=675,开口组上限=750组中值=725,计算,2023/10/21,102,计算某村农民人均收入最高426元,最低270元,据此分为六组,组距?某连续变量数列,且相邻两组的上、下限重叠,其末组为开口组,下限为200,又知其邻组的组中值为170,末组组中值?,开口组上限260,2023/10/21,103,4.关于频数与频率,频数(frequency),是指分配数列中各组的单位数,也称为次数。作用:频数越大,表明该组的标志水平的作用越大,相当于该组的权数,反映重要性。频率:是频数与总体单位数相比,是个百分数,也称比率或比重。,2023/10/21,104,四、次数分布的表示法,(一)列表法(二)图示法1.直方图2.折线图3.曲线图4.饼图EXCEL电子表格软件都可以画出。,2023/10/21,105,直方图,0,4,6,8,2,100,200,300,400,500,组距=100,频数=8,比重=40%,折线图,0,4,6,8,2,50,150,250,350,450,组中值=150,频数=4,无意义,组距=100,2023/10/21,106,五、正态分布(normal distribution),形状为“中间大,两头小”,而且对称的形状。在整个统计学的学科体系中,占有非常重要的地位!,2023/10/21,107,3.4 数据录入汇总与质量控制,一、计算机汇总的步骤1.编程2.编码3.数据录入4.数据编辑5计算与制成分析图和表格。,2023/10/21,108,一、统计表的概念及作用将统计资料整理结果表现出来的一种形式。它是用纵横交叉的线条所绘制的表格来表现统计整料。分广义的统计表与狭义统计表。,3.5 统计表,2023/10/21,109,统计表的作用,1.阅读方便、直观、一目了然2.便于比较对照不同的项目,从中容易发现规律。3.便于汇总和审查4.便于计算和分析。,2023/10/21,110,1.从形式上,统计表由总标题、横行标题、纵栏标题和指标值四个部分组成。除此之外,在统计表下方增列补充资料。2.从内容上,统计表由主词和宾词两个部分组成。主词是统计表的主体,是总体单位的名称或分组的排列;宾词指的是各项指标,由纵栏标题和指标值组成。,二、统计表的构成和内容(可以从两个角度考察),2023/10/21,111,三、统计表的分类,简单表:主词没有进行任何分组所形成的统计表,且主词只是对总体各单位名称的罗列或按照时间顺序简单排列。如表3-11 简单分组表:主词按某一个标志分组所形成的统计表,如表3-10 复合分组表:主词按两个或两个以上标志重叠进行分组所形成的统计表。如表3-12,按主词加工方法不同分类,2023/10/21,112,对广义的统计表,按作用不同,分为,1.调查表2.汇总表或整理表3.分析表,2023/10/21,113,四、统计表的编制规则,1.总标题:简明、确切2.统计表的内容:简明、扼要、系统3.各行和各栏:先列具体项目,再列总计4.主词:按分组标志的层次不同要移行排列5.栏目编号:横行各栏用(甲)、(乙)、(丙)等文字标明;纵列各栏用(1)、(2)、(3)等数字编号,有计算关系的也可表示为:(4)=(2)+(3)等形式按国际惯例:采用“三线表”,且统计表两端不封口。形状多为长方形。,2023/10/21,114,编制统计表规则,表中数字:书写工整、清楚、位数要对准;其中,特殊情况处理办法:表内数值不存在用“”,数字暂缺用“”,免填的数字用“”。表内不允许出现空白单元格,也不许出现“同左”、“同上”等字样。计量单位:表内数字只有一种单位,可在表格右上角注明;若不同,则横行单位可专门设置一栏,纵栏单位要与纵栏标题写在一起。附注或说明:在表格下方标明,具体指:资料来源、填表时间、填表人、审核人等。,2023/10/21,115,第三章 练习题,见习题册P7-9 单选题:1、2、3、4、7、12、15、17、18、20、24P9-11 多选题:2、3、8、13、14、19P12 综合应用题,