统计学原理相关计算辅导.ppt
《统计学原理相关计算辅导.ppt》由会员分享,可在线阅读,更多相关《统计学原理相关计算辅导.ppt(107页珍藏版)》请在三一办公上搜索。
1、统 计 整 理,一、统计分组的概念 根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称统计分组。总体的变异性是统计分组的客观依据。统计分组是总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体。,二、统计分组的种类,统计分组按其任务和作用不同,分为类型分组、结构分组和分析分组。类型分组的目的是划分经济类型,结构分类的目的是研究同质总体的构成,分析分组的目的是研究现象总体内部诸标志间的依从和制约关系。,下表是我国1994和1995年国民生产总值按照三产业分组情况(类型分组),1994和1995年某市居民人均月生活费收入情
2、况(结构分组),某市某年某月按照商品流转额分组的流通率水平情况(分析分组),统计分组按分组标志的多少分为简单分组和复合分组。简单分组是将总体按一个标志进行分组,复合分组是将总体按两个或两个以上的标志重叠起来进行分组。,统计分组按分组标志的性质分为品质分组和变量分组。,三、统计分组的方法(1)品质标志分组方法 品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。,(2)数量标志分组方法 按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。数量标志分组方法从
3、以下几个方面来说明:,当碰上组与组之间界限不易划分时,按照统一的划分标准或分类目录进行编制。如:,单项式分组和组距式分组(a)单项式分组 对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。如学生按姓名分组,均可采用单项式分组。,某地区职工家庭数按照儿童数分组情况,(b)组距式分组 离散变量如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。如以总产值、商品销售额、劳动生产率、工资
4、等为标志进行分组,就只能是相邻组限重叠的组距式分组。在相邻组组限重叠的组距式分组中,若某单位的标志值正好等于相邻两组的上下限的数值时,一般把此值归并到作为下限的那一组(适用于连续变量和离散变量)。,等距分组和不等距分组 等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。不等距分组即各组组距不相等的分组。,组限和组中值 组距两端的数值称组限。其中,每组的起点数值 称为下限,每组的终点数值称为上限。上限和下限的差称组距,表示各组标志值变动的范围。组中值是上下限之间的中点数值,以代表各组标志值的一般水平。组中值的计算是有假定条件的,即假定各组标志值的变化是 均匀的(与组距式分组
5、的假定条件相同)。组中值=(上限+下限)2;对于第一组是“多少以下”:缺下限开口组组中值=上限1/2邻组组距 最后一组是“多少以上”的开口组:缺上限开口组组中值=下限+1/2邻组组距。,(550),(400),四、变量分配数列编制的步骤,将原始资料按其数值从小到大重新排列 只有把得到的原始资料按其数值大小重新排列顺序,才能看出变量分布的集中趋势和特点,为确定全距、组距和组数作准备。,确定全距 全距是变量值中最大值和最小值的差数。确定全距,主要是确定变量值的变动范围和变动幅度。如果是变动幅度不大的离散变量,即可编制单项式变量数列,如果是变量幅度较大的离散变量或者是连续变量,就要编制组距式变量数列
6、。,确定组距和组数 组距的大小和组数的多少,是互为条件和互相制约的。当全距一定时,组距大,组数就少;组距小,组数就多。在实际应用中,组距应是整数,最好是或的整倍数。在确定组距时,必须考虑原始资料的分布状况和集中程度,注意组距的同质性,尤其是对带有根本性的质量界限,绝不能混淆,否则就失去分组的意义。在等距分组条件下,存在以下关系:组数=全距/组距,确定组限 组限要根据变量的性质来确定。如果变量值相对集中,无特大或特小的极端数值时,则采用闭口式,使最小组和最大组也都有下限和上限;反之,如果变量值相对比较分散,则采用开口式,使最小组只有上限(用“XX以下”表示),最大组只有下限(用“XX以上表示)。
7、如果是离散型变量,可根据具体情况采用不重叠组限或重叠组限的表示方法,而连续型变量则只能用重叠组限来表示。,编制变量数列 经过统计分组,明确了全距、组距、组数和组限及组限表示方法以后,就可以把变量值归类排列,最后把各组单位数经综合后填入相应的各组次数栏中。,根据资料编制分配数列(组距分别为80-100,100-120,120-140,140-160),例如:某车间同工种40名工人完成个人生产定额百分数如下,第一步:各个数据从小到大排列:,第二步:确定全距,第三步:确定组距,158-87=71,714=17.75,提示:,为了计算简便,我们把组距定为20,且上限和下限取整数.则有四组:80-100
8、,100-120,120-140,140-160,第四步:编制变量数列.,注意:编制变量数列原则为上限不在内原则,一、平均指标的概念、特点和种类,1、概念:平均指标又称统计平均数,用以反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平的综合指标。2、平均指标的特点:()把总体各单位标志值的差异抽象化了;()平均指标是个代表值,代表总体各单位标志值的一般水平。,平均值,综合指标,按标志值所处的位置确定的平均数分:,众 数 中位数,3、平均指标的种类有:,按总体所有标志值计算的平均数分:,算术平均数调和平均数几何平均数,静态平均数,动态平均数,二、平均指标的计算、算术平均
9、数的计算算术平均数是计算平均指标的最常用方法,它的基本公式形式是总体标志总量除以总体单位总量。由于资料的不同,算术平均数有两种计算形式:即简单算术平均数和加权算术平均数,公式为:,(a)简单算术平均数计算公式:,x代表算术平均数、x代表各单位标志值、代表总和符号、n代表总体单位数,(b)加权算术平均数计算公式:,x代表算术平均数、x代表各单位标志值、代表总和符号、f代表标志值出现的次数,x代表算术平均数、x代表各单位标志值、代表总和符号、f代表标志值出现的次数,当公式中各组次数相等时,则加权算术平均数又可以转化为简单算术平均数,即:,例1、古冶区华云制衣厂2003年6月份按工人劳动生产率高低分
10、组人数资料情况如下:,试计算该企业工人平均劳动生产率。,解:根据题意列计算表如下:,_ xf24070 x=66 件/人 f 366,55657585,95,产量Xf,8250 6500 5250 25501520,24070,已知,X=下限+邻组组距/2,例2、古冶区华云制衣厂2003年6月份按工人劳动生产率高低分组的人员分布资料情况如下:,试计算该企业工人平均劳动生产率。,解:根据题意列计算表如下:,=,55 40.98%+6527.32%+7519.13%+858.20%+954.37%=66 件/人,已知,由第一列求的,、调和平均数的计算 在实际工作中,有时由于缺乏总体的单位数资料,而
11、不能直接计算平均数,这时就可采用调和平均数计算。因此在统计工作中,调和平均数常常被作为算术平均数的变形来使用。调和平均数也有简单调和平均数和加权调和平均数两种形式,公式分别为:,简单调和平均数:,加权调和平均数:,x代表算术平均数、x代表各单位标志值、代表总和符号、n代表总体单位数,x代表算术平均数、x代表各单位标志值、代表总和符号、m代表各组标志总量,过度语:以上我们介绍了本节课的第一个重点内容,但上述两个公式 应用条件都是直接或者见解已知总体的单位数资料,如果缺乏总体的单位数资料又该怎么办呢?这就需要计算调和平均数的计算,上面我们讲到:当公式中各组次数相等时,则加权算术平均数又可以转化为简
12、单算术平均数,同理,当公式中各组标志总量相等时,则加权调和平均数又可以转化为简单调和平均数。,例3、古冶区华云制衣厂2003年6月份按工人劳动生产率高低分组的生产班组数和产量资料如下:,试计算该企业工人平均劳动生产率。,解:根据题意列计算表如下:,已知,f=m/x,150 100 70 30 16,366,三、变异指标的计算:1、变异指标的概念:变异指标又称标志变动度,它综合反映总体各个单位标志值的差异程度或离散程度,分为以下几种:全距、平均差、标准差和变异系数。2、变异指标的作用有:反映现象总体总单位变量分布的离中趋势;说明平均指标的代表性程度;测定现象变动的均匀性或稳定性程度。,3、标准差
13、是总体中各单位标志值与算术平均数的离差平方的算术平均数的平方根,又称为均方差,是测定标志变动程度的最主要的指标。计算公式如下:,4、变异系数是以相对数形式表示的变异指标。常用的是标准差系数。变异系数的应用条件是:当所对比的两个数列的水平高低不同时,就不能采用全距、平均差或标准差进行对比分析,因为它们都是绝对指标,其数值的大小不仅受各单位标志值差异程度的影响,而且受到总体单位标志值本身水平高低的影响;为了对比分析不同水平的变量数列之间标志值的变异程度,就必须消除数列水平高低的影响,这时就要计算变异系数。计算方法如下:,要求:分别计算两品种的单位面积产量。计算两品种亩产量的标准差和标准差系数。假定
14、生产条件相同,确定哪一品种具有较大稳定性,宜于推广。,解:根据题意得计算表如下:,解:,抽样估计,一、抽样的基本概念,、全及总体和样本总体 全及总体是我们所要研究的对象。样本总体是我们所要观察的对象。两者是有区别:全及总体又称母体,简称总体,它是指所要认识的,具有某种共同性质的许多单位的集合体。样本总体又称子样,简称样本,是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。,.全及指标和抽样指标 全及指标:根据全及总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的综合指示。,、样本容量和样本个数 样本容量是指一个样本所包含的单位数。样本个数指从一个总体中可能抽取的样本个数
15、。,抽样指标:由样本总体各单位标志值计算出来反映样本特征,用来估计全及指标的综合指标。,、重复抽样和不重复抽样,重复抽样:它是这样安排的,要从总体N个单位中随机抽取一个容量为n的样本,每次从总体中随机抽取一个单位,并把它看作一次实验,连续进行n次实验构成一个样本,每次抽出的一个单位,把结果登记下来,又重新放回,参加下一次抽选。,不重复抽样:它是这样安排的,要从总体N个单位中随机抽取一个容量为n的样本,每次从总体中随机抽取一个单位,并把它看作一次实验,连续进行n次实验构成一个样本,但每次抽出的一个单位不参加下一次抽选。,二、抽样误差的概念及影响因素,1、抽样误差:是指由于随机抽样的偶然因素使样本
16、各单位的结构不足以代表总体各单位的结构而引起抽样指标和全及指标之间的绝对离差。,2、抽样误差影响因素:,三、抽样平均数的平均误差、极限误差计算 1、抽样平均误差的实质:抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差,说明样本指标代表性的大小。,重复抽样:,不重复抽样:,2、抽样极限误差概念和计算,抽样极限误差:在做抽样估计时,应该根据所研究对象的变异程度和分析任务的要求确定可允许的误差范围,在这个范围内的数字都是有效的,我们把这种允许的误差范围称为抽样的极限误差。,xx,例、某学校进行一次英语测验,为了解学生的考试情况,随机重复抽选部分学生进行调查,所得
17、资料如下:,试以95.45%的可靠性估计该校学生英语考试的平均成绩的范围。,65,55,组中值,解:根据题意列计算表如下:,四、抽样成数的平均误差、极限误差计算,重复抽样:,不重复抽样:,例、某学校进行一次英语测验,为了解学生的考试情况,随机重复抽选部分学生进行调查,所得资料如下:,试以95。45%的可靠性估计该校学生英语考试成绩在80分以上的学生所占的比重的范围。,成数的平均数为P,即表示总体中具有某种性质的单位数在总体单位数中所占的比重,pp20.049960.0999280分以上学生所占的比重的范围:pp0.480.099920.38010.5799在95.45概率保证程度下,该校学生成
18、绩在80分以上的学生所占的比重的范围在38.01%57.99%之间。,例、某学校进行一次英语测验,为了解学生的考试情况,随机重复抽选部分学生进行调查,所得资料如下:,试以95。45%的可靠性估计该校学生英语考试成绩在80分以上的学生所占的比重的范围。,成数的平均数为P,即表示总体中具有某种性质的单位数在总体单位数中所占的比重,pp20.049960.0999280分以上学生所占的比重的范围:pp0.480.099920.38010.5799在95.45概率保证程度下,该校学生成绩在80分以上的学生所占的比重的范围在38.01%57.99%之间。,相关分析,一、相关的概念和种类、相关的概念相关分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 原理 相关 计算 辅导
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6332789.html