第四章数据的描述性分析.ppt
《第四章数据的描述性分析.ppt》由会员分享,可在线阅读,更多相关《第四章数据的描述性分析.ppt(114页珍藏版)》请在三一办公上搜索。
1、2023/6/23,华政商学院,第四章 数据的描述性分析,综合指标分析法 综合指标是指根据总体或者样本的数据计算的综合测量值。能够反映具体时间、地点、条件下研究对象的数量特征。,(Central tendency and dispersion),2023/6/23,华政商学院,例1:怎样描述2010年上海经济状况,GDP为13698亿元,财政收入为7532亿元,固定资产投资为4829亿元,进出口为3221亿美元,顺差为165亿元,GDP增长率为12.4%,一二三产业构成比为:1:45:54.人均GDP为73124元,农村人均消费12927元,城市人均消费为28947元.,2023/6/23,华
2、政商学院,例2:2010年上海以及长宁区人口结构,平均值?方差?分布?,2023/6/23,华政商学院,原始数据,2023/6/23,华政商学院,相对指标的种类,第一节 相对程度的描述,2023/6/23,华政商学院,1、偿债能力分析:流动比率=流动资产/流动负债 产权比率=负债总额/所有者权益2、营运能力分析:存货周转率(次数)=主营业务成本/平均存货,存货周转天数=360/存货周转率(次数)3、盈利能力分析:销售净利率=净利润/销售收入 净资产收益率=净利润/平均净资产 4、每股收益:每股收益=(净利润优先股股利)/年末普通股股数,市盈率=普通股每股市价/普通股每股收益 5、发展能力分析:
3、总资产增长率=本年总资产增长额/年初资产总额 6、杜邦财务分析体系(工商银行财务报表),2023/6/23,华政商学院,某企业年计划工业增加值为200万元,实际完成220万元,计划完成相对指标为 超额绝对值=220-200=20万元对产量、产值求计划完成程度指标时大于1表示超额完成计划,小于1表示未完成计划,1、,2023/6/23,华政商学院,2、,2023/6/23,华政商学院,恩格尔系数,消费中用于食品的支出,全部消费支出,联合国粮食及农业组织将恩格尔系数作为衡量一个国家或地区富裕程度的标准:恩格尔系数在59%以上为贫困,50%59%为温饱,40%50%为小康,30%40%为富裕,低于3
4、0%为最富裕。我国居民家庭恩格尔系数(%)1978年农村与城镇分别为67.7和57.5,1990年为58.8和54.2。2003年我国发布的第一份中国教育与人力资源问题报告中指出:农村与城镇居民家庭的恩格尔系数分别降至47.7%(小康)和37.9%(富裕)。但是很多专家都撰文指出了恩格尔系数在中国的失灵现象。这方面争论非常多,说明在中国光看恩格尔系数不一定很准确。,2023/6/23,华政商学院,2009中国统计年鉴相关数据显示,2008年畜牧业职工平均工资为10803元,证券业为172123元,二者相差15.93倍,2008年畜牧业就业人员平均劳动报酬为11018元,证券业为167995元,
5、二者相差15.25倍,3、,2023/6/23,华政商学院,2023/6/23,华政商学院,1、研究某一现象本期对上期的影响,以上期作为基期2、消除季节变动对于现象发展的影响,以上年同期为基期3、为了突出某一现象的发展速度,以历史重要的时刻为基,基期的选取,上海的国民生产总值,2023/6/23,华政商学院,例:某年某地区年平均人口数为100万人,在该年度内出生的人口数为8600人。则该地区,5、,2023/6/23,华政商学院,例:某地区某年末现有总人口为100万人,医院床位总数为24700张。则该地区,2023/6/23,华政商学院,6、,2023/6/23,华政商学院,指标对比要有可比性
6、;相对指标要与总量指标结合运用;多种相对指标结合运用。,七、相对指标应用的原则,2023/6/23,华政商学院,比较两厂经济效益,不可比,不可比,可比,2023/6/23,华政商学院,1998年相对于1997年,美国的GDP增长速度为3.9,同期中国GDP增长速度为7.8,恰好为美国的2倍;但根据同期汇率(1美元兑换8.3元人民币),1998年中国GDP总量约合9671亿美元,约相当于同期美国GDP总量84272亿美元的1/9。,相对指标应当结合总量指标使用,2023/6/23,华政商学院,结构相对数比例相对数比较相对数动态相对数计划完成相对数强度相对数,(部分与总体关系)(部分与部分关系)(
7、横向对比关系)(纵向对比关系)(实际与计划关系)(关联指标间关系),多种相对指标应当结合运用,2023/6/23,华政商学院,数据分布的特征,2023/6/23,华政商学院,数据分布的特征和测度,峰 度,偏 度,2023/6/23,华政商学院,指总体中各单位的次数分布从两边向中间集中的趋势,用平均指标来反映。,集中趋势,第二节 集中趋势的描述,对集中趋势的描述就是找数据的一般水平的中心值或者代表值,2023/6/23,华政商学院,平均指标的种类,算术平均数 调和平均数 几何平均数 中位数 众数,2023/6/23,华政商学院,下面是一个小故事:一个人到某公司求职,经过调查,得出关于该公司工资的
8、一些数据,如果是你,应该如何选择?,2023/6/23,华政商学院,公司员工的月薪如下:,2023/6/23,华政商学院,我们有三种方法选择集中趋势:(1)根据频数:哪个变量值出现次数越多,就选择哪个变量值,比如民主决策的表决机制。(众数)(2)根据居中:比如一个城镇居民的生活水平,居中的是小康家庭,那么就用小康家庭来代表该城镇的生活水平。(中位数)(3)根据平均:用平均数来代表变量的平均水平。(算术平均数),2023/6/23,华政商学院,(一)算术平均数(Mean),计算公式:未分组数据:按照单变量分组数据:按照组距分组:X为组中值,概念:,直接承担者,2023/6/23,华政商学院,1.
9、对于未分组资料简单算术平均数 求某周世博会入园人数34、35、32、35、41、45、51(万人)的算术平均数。39万人,2023/6/23,华政商学院,2、分组数据(单个变量分组),2023/6/23,华政商学院,加权均值(组距分组),运用条件1、各组变量用中值代表2、假设条件是数据在组中的分布是均匀或者对称的,2023/6/23,华政商学院,对于分组资料加权算术平均数*,2023/6/23,华政商学院,权数的意义和作用,权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用。当各组的次数都相同时,即当f1=f2=f3=fn时,加权平均数就是算术平均数权数的意义:可以表示
10、结构,例如社会发展结构,产业结构等。带有权数公式的记忆方法应用:基金,绩点的计算,2023/6/23,华政商学院,算术平均数的性质,可以分析现象之间的依存关系(收入和文化程度),平均值是一个重要的统计量,可以推断总体的平均值,不适合于定类数据和定序数据,受极端值影响较大。,2023/6/23,华政商学院,变量值与其算术平均数的离差之和衡等于零,即:变量值与其算术平均数的离差平方和为最小,即:,3、算术平均数的主要数学性质,计算方法:average(num1,num2,),2023/6/23,华政商学院,(二)调和平均数(Harmonic mean),计算加权平均数时,在不知道每组的频数,而只知
11、道每组的观测值之和时,则用调和平均数。是加权算术平均数的另外一种表现形式,原来只是计算时使用了不同的数据!,2023/6/23,华政商学院,某理财产品第一季度在三个银行网点销售额的资料如下,求一季度该理财产品在三个销售点的平均价格和总销售平均价格。,2023/6/23,华政商学院,2023/6/23,华政商学院,(三)几何平均数,概念:该标志总量不能表示称为总量的和,而是乘积。应用:主要用于时间衔接,动态数据的评价。如:计算平均发展速度,平均比率计算公式 1.简单几何平均数:,2.加权平均数:,2023/6/23,华政商学院,【例】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为
12、95、92、90、85、80,求整个流水生产线产品的平均合格率。,分析:,设最初投产100A个单位,则第一道工序的合格品为100A0.95;第二道工序的合格品为(100A0.95)0.92;第五道工序的合格品为(100A0.950.920.900.85)0.80;,2023/6/23,华政商学院,因该流水线的最终合格品即为第五道工序的合格品,故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:,即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。,2023/6/23,华政商学院,因该流水线的最终合格
13、品即为第五道工序的合格品,故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:,即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。,2023/6/23,华政商学院,例2.一位投资者持有的某只股票,在2006年、2007年、2008年和2009年收益率分别为4.5%、2.0%、-3.5%、5.4%。计算该投资者在这四年内该股票的平均收益率。,四年平均收益率102.04%-1=2.04%,计算方法:geomean(num1,num2,.),2023/6/23,华政商学院,1.中位数:把总体单位某一数量
14、标志的各个数值按大小顺序排列,位于正中处的变量值,即为中位数,用Me表示。,不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。,中位数的作用:,二、位置平均数,2023/6/23,华政商学院,如果统计资料中含有异常的或极端的数据,就有可能得到非典型的甚至可能产生误导的平均数,这时使用中位数来度量集中趋势比较合适。,比如有5笔付款:9元,10元,10元,11元,60元 平均付款为100/5=20元。很明显,这并不是一个好的代表值,而中位数10元是一个更好的代表值。,2023/6/23,华政商学院,中位数的计算,1、原始数据:(1)先把所有数据按大小顺序排列,如果总体单位数为奇数,则取
15、第(N+1)/2 位上的变量值为中位数;(2)如果总体单位数为偶数。因为居中的数值不存在,按惯例,取第 N/2位和第(N+1)/2 位上的两个变量值的平均作为中位数。,2023/6/23,华政商学院,例 求54,65,78,66,43这些数字的中位数。例、求54,65,78,66,43,38 这些数字的中位数。,你会吗?,2023/6/23,华政商学院,2.对于分组资料(1)单项数列:根据(N+1)/2在累计频数分布中找到中位数所在组,该组变量值就是Me。,中位数,2023/6/23,华政商学院,当根据组距数列求中位数时,要采用所谓的比例插值法:先根据(N+1)2在累计频数分布中找到中位数所在
16、组,然后假定该组中各变量值是均匀分布的,再用以下任何一种方法求出中位数(注意:此处用的是向上累计)。,(2)变量数列,按中位数所在组的上限:,按中位数所在组的下限:,上面的公式假定中位数组的频数在该组内均匀分布,2023/6/23,华政商学院,根据前面的数据,计算50 名工人日加工零件数的中位数,2023/6/23,华政商学院,特点:1、不受极端值的影响,在出现极端值时候,可以用中位数代替算术平均数,房价中位数 2、在缺乏计量手段时,可以用中位数近似代替算术平均数 3、受抽样变动的影响较大(与算术平均数相比)4、各变量值与中位数的离差绝对值之和最小,即,中位数,2023/6/23,华政商学院,
17、3.四分位数,将总体中的各单位分割成相等的四部分,则这三个分割的变量值就是四分位数。若以Q1、Q2、Q3分别代表第一、第二、第三四分位数。Q2 即中位数,Q1、Q3的算法分别是,不受极端值的影响.主要用于定序数据,也可用于数值型数据,但不能用于定类数据,2023/6/23,华政商学院,(二)众数(Mode),众数:是在一组资料中,出现次数(或频数)呈现出“峰”值的那些变量值,用Mo表示。例子:在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。,2023/6/23,华政商学院,1.对于未分组资料 直接观察 首先,将所有数据顺序排列;然后,只要
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 数据 描述 分析

链接地址:https://www.31ppt.com/p-5292759.html