财务会计统计学.ppt
《财务会计统计学.ppt》由会员分享,可在线阅读,更多相关《财务会计统计学.ppt(183页珍藏版)》请在三一办公上搜索。
1、统计学,第一章 总论第二章 统计数据的描述分析第三章 概率与概率分布第四章、统计量及其抽样分布第五章 参数估计第六章 参数假设检验第七章列联分析和方差分析第八章 一元线性回归第九章 多元线性回归第十章 时间序列分析第十一章 统计指数,第一章 总论,一、统计学的产生和发展二、统计学及其学科性质三、统计学的几个基本概念四、统计调查五、统计整理统计软件介绍,返回,一、统计学的产生和发展(一)政治算术学派(英国:威廉.配第1623-1687)用大量的数字对英国、法国和荷兰三国的经济实力进行比较,用数字、重量、尺度等定量的方法进行分析比较,并配以朴素的图表来表达其思想和观点。马克思评价其为“政治经济学之
2、父”约翰格朗特编制世界上第一张死亡率统计表,返回,(二)国势学派(德国:康令1606-1681)“国势学”课程,并于1749年用“统计学”取代缺乏数字内容,用文字描述与政治算术学派共存200多年,但政治算术学派影响要大(三)数理统计学派(比利时:凯特勒1796-1874)把概率论、大数法则、误差法则、正态分布等概率方法引入统计学,并认为其适合任何观察科学的通用方法。是数理统计学的奠基人和先驱者,被尊称为“统计学之父”,瑞士数学家 J.贝努里(1654-1705)首次在推算法中给出了贝努里定理的大数法则。法国数学家拉普拉斯(17491827)概率论分析:总结了前人的成果,并以大数法则为桥梁,使概
3、率论与政治算术联系起来;德国大数学家高斯(17771855)是另一位将概率论引入统计学的杰出贡献者。利用最大似然法等数学知识将误差理论和概率分布理论结合起来,提出误差分布曲线,使用最小二乘法和高斯分布最终建立了误差理论。,英国统计学大师费希尔(R.Fisher,亦译为费舍或费雪)建立了样本分布、区间估计以及假设检验等综合理论,确立了数理统计学的数学框架。,返回,二、统计学及其学科性质1、统计学(statistics):the science of collecting,analyzing,presenting,and interpreting data.Copyright 1994-2000
4、Encyclopaedia Britannica,Inc.(不列颠百科全书)统计学是一门收集、处理、分析和解释数据并从数据中得出结论的科学。其目的是探索数据的内在数量规律性,从而为有关决策提供依据.搜集数据整理数据分析数据解释数据2、争论:“方法论学科”“实质性学科”1)、描述统计和推断统计描述统计:注重汇总、图表显示、概括分析推断统计:研究用样本数据推断总体数量特征2)、应用统计学和数理统计学,返回,反映客观现象的数据,描述统计(统计数据的搜集、整理、显示和分析等),返回,三、统计学的几个基本概念(一)总体和样本1、总体是由具有某种共同性质的许多个体组成的整体,构成总体的个体称为总体单位。两
5、层含义:统计学研究的是大量现象的数量特征,总体包含了大量现象;统计单位具有某一共同性质,但其他的性质、特征是不同的,便于在差异中寻找规律。,返回,2、样本,(二)参数和统计量,(三)标志和指标1、标志是说明总体单位特征的名称,分为数量标志和品质标志。2、指标是说明总体综合数量特征的名称 按其反映数量特点的不同,分为数量指标和质量指标。按其反映的时间特征的不同分为时期指标和时点指标。,(四)变量分类变量:分类数据顺序变量:顺序数据数值型变量:数值型数据,(五)存量与流量时期指标时点指标2009年中国国内生产总值为335,353亿元(49,092.81亿美元,同期日本为5.07万亿美元),比上年增
6、长8.7.产业:第一产业增加值35477 亿元,增长 4.2%;第二产业增加值156958亿元,增长9.5%;第三产业增加值142918亿元,增长8.9%。,返回,四、统计调查 统计报表制度:国家统计报表 部门统计报表 地方统计报表 专门调查:普查 典型调查 重点调查 抽样调查,返回,数据的误差抽样误差 80人 10人,无偏估计 非系统性误差非抽样误差:抽样框误差 回答误差 无回答误差 系统性误差 调查员误差 测量误差,返回,五、统计整理 1、统计分组:统计分组是将统计总体按照一定标志区分成若干个组成部分的一种统计分析方法。按分组标志的不同,分为:品质数列 单项数列:一个变量值是一个组 变量数
7、列 组距数列:两个变量值构成的区间是一个组,返回,2、频数分布:统计分组后,每个组分配的总体单位数称为频数或次数 频数/总体单位总数=频率(比率)分布类型1)钟型分布2)J型分布3)U型分布,(a)对称分布,(b)偏态分布,钟形分布,返回,J型U型分布,返回,3、统计表:例、一批钢材,抽样测试其抗张力,随机抽取76个样本观察值如下:(单位:kg/cm2)41.0 37.0 33.0 44.2 30.5 27.0 45.0 28.5 40.6 34.831.2 33.5 38.5 41.5 43.0 45.5 42.5 39.0 36.2 27.538.8 35.5 32.5 29.5 32.6
8、 34.5 37.5 39.5 35.8 29.142.8 45.1 42.8 45.8 39.8 37.2 33.8 31.2 31.5 29.529.0 35.2 37.8 41.2 43.8 48.0 43.6 41.8 44.5 36.536.6 34.8 31.0 32.0 33.5 37.4 40.8 44.7 40.0 41.540.2 41.3 38.8 34.1 31.8 34.6 38.3 41.3 44.2 37.130.0 35.2 37.5 40.5 38.1 37.3,一批钢材抗张力分组表,累计频数分布数列1)各组频数向上、向下累计形成的数列。2)在经济学中的应用。
9、洛伦茨曲线基尼系数=A/(A+B),统计表的格式和注意事项(p77-p78)横行标题:对象(总体(常以年份形式表示)、总体分组、总体各单位)纵栏标题:统计指标交叉部分:指标值注意事项:数据居中,小数点对齐左右不封口;表下面注明资料来源。,表头,列标题,行标题,数字资料,附加,统计表的结构,统计图(直方图和饼图),返回,第二章 统计数据的描述分析,返回,第一节 集中趋势分析第二节 离中趋势分析第三节 偏度和峰度分析,第一节 集中趋势分析集中趋势指一组数据中心点的位置所在,是数据分布的中心,描述集中趋势的指标有平均数、中位数、众数等。代表数据的一般水平。一、众数二、中位数三、平均数三个测度值间的关
10、系,返回,某单位80个工人一周生产的零数 单位:个 65 78 88 65 58 76 69 66 80 64 77 78 60 65 85 74 73 65 66 79 74 85 59 69 60 87 85 86 64 93 76 62 91 49 74 78 75 79 86 68 87 97 92 82 66 94 75 56 85 77 67 89 78 79 88 83 73 69 84 95 55 79 77 58 80 68 77 87 70 78 79 61 47 69 89 96 66 76 81 99Min=47 max=99,众数,一、众数(M0)1、众数是指一组变量
11、值中出现次数最多的变量值,一般用M0表示。可以测度分类数据、顺序数据和数值型数据。一组数据可能没有众数,也可能有两个甚至多个众数。2、众数的确定未分组资料:M0就是出现次数最多的变量值。有时众数不止一个,上例中,78、79各出现5次,都是M0,数据分布是双峰的。,返回,分组资料:在等距分组的情况下,频数最多的组是众数组,在该组内确定众数。,二、中位数及分位数1、中位数把一批数按照从小到大的顺序排列,处于数列中点的变量值就是Me确定方法未分组资料:(n+1)/2中位数的位置。前例Me=77分组资料:根据向上或向下累计频数分布数列,按照 确定中位数所在的组,然后确定值。,返回,返回,2、分位数上四
12、分位数QU=3n/4下四分位数QL=n/4,三、平均数(一)、算术平均数(均值)分为简单算术平均数和加权算术平均数,返回,例、某单位80工人一周生产零件数。1、简单算术平均数2、加权算术平均数,众数,某单位某周生产零件数资料表,3、算术平均数与数学期望对于离散型随机变量X,设它的概率密度函数P(Xi)为,则数学期望为:实际上算术平均数等于期望值简单算术平均数:xi1/n加权算术平均数情况:xini/n,4、算术平均数的缺陷10 15 20 25 70去掉70后,从这个角度讲算术平均数不及众数和中位数,(二)、几何平均数两种应用:年均增长率及银行复利计息平均利率(三)、调和平均数倒数平均数的倒数
13、:,返回,四、综合(平均数、众数、中位数)1、三个测量度与三种类型数据间的对应关系2、三个测度值间的关系,第二节 离中趋势分析,一、离中趋势概念1、离中趋势是数据分布的又一特征,它表明数据的离散程度,反应各变量值与均值间的平均偏离程度。2、意义:首先,可以衡量算术平均数的代表性大小。例:均值都为150的两组数 50,100,150,200,250 100,125,150,175,200其次,进行产品质量管理和决策。3、离中趋势测度经常用到的指标有:异众比率、极差、平均差、方差和标准差、四分位差、离散系数等,它们也被称为变异指标。,返回,二、异众比率(非众数组频数所占比例)一般来说,异众比率越大
14、,数据离散程度越大主要测度分类数据,也可适用其他数据,三、四分位差1、四分位差用数列中第3/4位次与1/4位次的变量值之差除以2来表示。主要用于测度顺序数据,也可适用其他类型数据2、意义:剔除了极端值,说明50%数据分布状况;与中位数配合说明数据分布是否对称。若分布对称,则Q2-Q1=Q3-Q2=(Q3-Q1)/2若不相等,则是非对称的。,四、极差1、极差也称为全距,是一组变量中最大值与最小值的离差,表明变量值变动的范围。用R表示极差,其计算公式是:2、缺点:易受极端值的影响。,五、平均差1、平均差是指变量值与其算术平均数的离差绝对值的算术平均数,用符号A.D表示。计算公式:2、优缺点:,优点
15、:恰当反应了数据与平均数间的平均偏离程度,缺点:表达式中有绝对值,在数学处理上较麻烦,六、方差与标准差1、方差与标准差是测定离中趋势最常用的指标。标准差是方差的平方根。2、计算公式(总体数据):P99 一般表达式与概率表达式 A.D3、标准分数(相对位置的度量)指某个具体数据偏离平均数几个标准差,以其反映该数的出类拔萃(或差)程度:,自由度(degree of freedom),自由度的概念由统计学家R.A Fisher提出是指数据个数与附加给独立的观测值的约束或限制的个数之差从字面涵义来看,自由度是指一组数据中可以自由取值的个数当样本数据的个数为n时,若样本平均数确定后,则附加给n个观测值的
16、约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k,七、离散系数(标准差系数、变异系数)特别注意:离散系数是比较数据间离散程度的最终指标,返回,第三节 偏度和峰度分析,一、偏态1、分布的偏态就是分布的不对称2、偏态的测量方法主要是两种:一种是Pearson偏态系数,二是三阶中心距。Pearson偏态系数以平均数与众数之差除以标准差来衡量偏斜程度,用SK表示。其计算公式为:当SK=0时,呈对称分布;当SK0时,分布是右偏(正偏)的;当SK0时,分布是左偏(负偏)的。,返回,矩法估计就是利用中心矩来衡
17、量分布的偏度。用公式表示为:,二、峰度1、峰度是变量分布的又一性质,它指的是分布曲线的高峰形态,也是分布曲线的尖峭程度2、衡量指标:峰度是用变量的四阶中心矩除以标准差四次方,并将结果再减3,用公式表示为:当峰度指标K0时,表示频数分布比标准正态分布更集中,分布呈尖峰状态;K0时表示频数分布比标准正态分布更分散,分布呈平峰。,返回,第三章 概率与概率分布,一、随机事件的概率及法则P(A)=该事件的可能数/总的可能数加法法则:P(AUB)=P(A)+P(A)-P(AB),返回,二、贝叶斯公式,P(AB)=P(A)P(B/A)P(AB)=P(B)P(A/B)所以:P(A)P(B/A)=P(B)P(A
18、/B)即:P(A/B)=P(A)P(B/A)/P(B)当然:P(Ai/B)=P(Ai)P(B/Ai)/P(B),三、密度与概率分布,离散型变量的密度即变量概率连续性变量的密度表示出现可能性的高低,但具体某个变量值的概率P(X)=0变量所有可能取值的概率之和等于1(对于连续性变量密度在定义域上的积分为1)期望值就是平均数,四、正态分布,1、正态分布的分析均转化为标准正态分布2、灵活计算标准正态分布的区间概率3、以大概率反过来求大概率区间的临界值4、二项分布的正态近似:二项分布XB(n,p)近似于XN(np,np(1-p))当n很大,p很小时,二项分布近似于泊松分布:,返回,第四章、统计量及其抽样
19、分布,一、统计量与抽样分布的概念二、三大推断分布三、常用统计量分布,返回,统计量样本函数称为统计量。设是来自总体X的一个样本,是 的函数,若 是连续函数且其中不含任何未知参数,则称 是一个统计量。抽样分布统计量的概率分布称为抽样分布,总体的分布已知时,统计量的分布是确定的。,返回,一、统计量与抽样分布概念,二、三大推断分布,(一)分布1、设 是来自总体N(0,1)的一个样本,则称统计量服从自由度为n的 分布,记为。自由度是指包含的独立变量的个数。2、性质:(1)设,且 独立,则 即 分布具有可加性。,返回,(2)分位点(根据查分位点(即临界点)一定要掌握)若对于给定的,0 1,存在使得 则称点
20、 为 分布的上 分位点,如图所示。,(二)t分布1、定义:设XN(0,1),Yx2(n),且X,Y相互独立,则称随机变量即服从自由度为n的t分布,记Tt(n)。t分布又称学生氏(student)分布特别的(P164):,2、性质关于y轴呈对称分布;当 时,近似于N(0,1)分布。分位点对于给定的,0 1,称满足的点 为t分布的分位点。,(三)F分布1、设UX2(n1),VX2(n2),且U、V相互独立,则服从自由度为(n1,n2)的F分布,记为2、性质F分布是非对称的分位点对于给定的,0 1,称满足为F分布的分位点。,返回,三、常用统计量分布,1、样本均值统计量的抽样分布。(1)正态总体,方差
21、已知(2)总体非正态,方差未知,大样本(中心极限定理P166)(3)正态总体,方差未知,小样本2、样本方差s2的抽样分布:,返回,3、两样本均值差的抽样分布(1)已知(2)未知,但两者相等,小样本(P165),4、两总体方差比的分布5、样本成数的抽样分布,返回,第五章 参数估计,第一节 参数估计的理论依据第二节 区间估计第三节 样本容量的确定,返回,第一节 参数估计的理论依据,根据中心极限定理样本平均数与总体平均数的联系 可以求出样本平均数在某区间内的概率进一步可以求出在一定的概率保证下样本平均数在哪一个范围之内通过转换可得出在相应概率保证下总体平均数的估计区间:,返回,同样的逻辑,可以推广到
22、样本平均数的其他分布:,参数估计的无偏性和有效性(p181),点估计时:估计量的期望值等于总体参数表现为无偏性估计量的方差越小,表明估计越有效越一致,返回,第二节 区间估计(p198-p200),一、总体均值(比例)的区间估计(包括两个独立总体均值差的估计)二、方差的区间估计三、匹配样本问题,一、总体均值(比例)的区间估计(包括差值的估计)1、正态总体、方差已知,或非正态总体、大样本(以s代替),返回,2、正态总体、方差未知、小样本(该处抽样成数不讨论)3、非正态总体、方差未知、小样本 不可求,返回,二、方差的区间估计,方法:找出涉及方差的分布如果单个总体方差涉及卡方分布 两个总体方差比涉及F
23、分布单个总体:,返回,两个总体的方差比较:,返回,三、匹配样本问题,两个独立样本:产品两种组装方法所需时间(两种方法各抽取12人)解答方法为两个独立总体均值差的区间估计:见p192,均值差的估计范围为:0.14分钟7.26分钟,返回,产品两种组装方法所需时间(同一组人用两种方法)两种组装方法时间差D的估计区间为:3.03t0.025(11)*2.88/3.46即:3.032.201*0.83,估计范围为:1.2分钟4.9分钟,返回,第三节 样本容量的确定,决定样本容量的因素1、总体方差一定2、给定允许误差E3、给定概率保证程度,返回,在既定的总体方差情况下,要达到给定的允许误差和概率保证,则唯
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 财务会计 统计学
链接地址:https://www.31ppt.com/p-4282601.html