欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    《应用统计学》PPT课件.ppt

    • 资源ID:1400649       资源大小:916.51KB        全文页数:78页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    《应用统计学》PPT课件.ppt

    主讲:马媛20015年3月,应 用 统 计 学,课程的重要性个人参与社会生活的需要 专业学习的需要总学时:54 学 分:3分,第一章 绪论,统计学的产生和发展统计数据与统计学统计学的分科统计学的基本概念,学习内容,学习目标,理解统计学的含义理解统计学与统计数据的关系了解统计学的分科了解统计学的发展过程,一、统计学的产生与发展,统计:统计工作、统计数据、统计学,古典统计学阶段(17世纪中叶19世纪初),国势学派:使用记述、对比的方法研究国家基本国情,政治算术学派:使用数字、图表等统计方法,研究英国、法国、荷兰三国的国情、国力,概率论学派:研究随机现象,近代统计学阶段(19世纪初20世纪初),现代统计学阶段(20世纪初至今),历史上著名的统计学家,拉普拉斯,高斯,卡尔皮尔逊,1749-1827,1857-1936,1777-1855,二、统计学与统计数据,收集、整理、显示和分析统计数据的科学,目的是探索数据的内在数量规律性。,数据搜集:取得数据数据表述:图表展示数据数据分析:分析数据数据解释:结果的说明,研究过程,收集数据(取得数据),分析数据(研究数据),实际问题,统计规律,正常条件下新生婴儿的男女性别比为107:100投掷一枚质地均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/6农作物的产量与施肥量之间存在相关关系,三、统计学的分科,统计方法,描述统计,推断统计,参数估计,假设检验,1.使用方法,描述统计学(descriptive statistics),研究数据收集、整理和描述的统计学分支 内容搜集数据整理数据展示数据描述性分析 目的描述数据特征找出数据的基本规律,0,25,50,Q1,Q2,Q3,Q4,¥,x = 30 s2 = 105,研究对象:确定性现象,推断统计学(inferential statistics),研究如何利用样本数据来推断总体特征的统计学分支内容参数估计假设检验目的对总体特征作出推断,研究对象:不确定性现象,描述统计与推断统计的关系,2.应用领域,理论统计学与应用统计学,理论统计研究统计学的一般理论研究统计方法的数学原理应用统计研究统计学在各领域的具体应用国民经济统计学,人口统计学,管理统计学,3.统计学与其他学科的关系,与数学的关系,以数学为基础,但不同于数学,与专业课程的关系,是专业课程的工具,通过使用可以帮助我们发现研究领域所存在的规律,进一步结合专业知识对它进行阐释可以形成新的理论,数学:抽象 无量纲 演绎为主,统计学:具体 有量纲 归纳与演绎,统计工作不是把数字随便填到几个格格里去,而应当是用数字来说明所研究的现象在实际生活中已经充分呈现出来和正在呈现出来的各种社会类型。 -列宁全集,四、几个基本概念,1. 总体和样本,总体(population)所研究的全部个体的集合,其中的每一个个体称为总体单位总体单位具有大量性、同质性、异质性样本 (sample)从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本容量,2. 标志和指标,说明总体单位属性和特征的名称,品质标志:总体单位质的特征,数量标志:总体单位量的特征,姓名 性别 年龄 学历 工龄 收入,王小二 男 56 研究生 28 30万,标志名称,标志值,企业名称 所属行业 员工人数 年销售额,(变量),标志:,指标:综合反应总体数量特征的概念和数值,具有可量性和综合性,理论:指标名称、核算方法、计量单位,实践:时间、空间、数值,常用指标:总量指标 相对指标 平均指标,2014年我国国内生产总值568845亿元,按可比价格计算,比上年增长7.7%。全年全国粮食总产量达到60194万吨,比上年增加1236万吨,增长2.1%。全年城镇居民人均总收入29547元。其中,城镇居民人均可支配收入26955元,比上年名义增长9.7%,扣除价格因素实际增长7.0%。全年农村居民人均纯收入8896元,比上年名义增长12.4%,扣除价格因素实际增长9.3%。2013年全国居民收入基尼系数为0.473 。,总结:统计学数据的科学,设置科学的指标,获取真实的数据,运用科学的分析方法,第二章 统计数据的描述,统计数据的来源统计数据的整理分布集中趋势的测度分布离散程度的测度统计图与统计表,学习内容,了解统计数据的来源和数据的质量要求掌握数值型数据的整理方法掌握数据集中趋势和离散程度的测度方法掌握茎叶图和箱线图的制作方法了解分布偏态与峰度的测度方法掌握统计表和统计图的使用,学习目标,第一节 数据的收集,一、直接渠道,1. 普查(census),为特定目的专门组织的全面调查通常是一次性或周期性的,非经常一般需要规定统一的标准调查时间数据的规范化程度较高应用范围比较狭窄,统计调查是按照预定的统计任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集资料的全过程。,2. 抽样调查(sampling survey),从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法,特点:经济性、时效性、适应面广、准确性高,3. 统计报表,按国家统一规定的表式,统一的指标项目,统一的报送时间,自下而上逐级定期提供基本统计资料的调查方法。,4. 重点调查,在所要调查的总体中选择一部分重点单位进行调查,重点单位是着眼于现象量的方面,尽管这些单位在全部单位中只占一部分,但是它们的某一主要标志的标志总量在总体标志总量中有绝大比重。,重点单位的选择着眼于它所研究现象主要标志总量的比重,因而它的选择不带有主观因素。,5. 典型调查,有意识地选取若干具有代表性的单位进行调查和研究,借以认识事物发展变化的规律。,虽然抽样调查、重点调查、典型调查都属于非全面调查,但是只有抽样调查可以用来推断总体的数量特征。重点调查和典型调查所得资料只能形成对总体的定性认识,不能上升为总体的定量结果。,解剖麻雀:总体内部个体间差异很小划类选典:总体内部个体间差异较大,二、间接渠道,统计部门和政府部门公布的有关资料,如各类统计年鉴各类专业期刊、报纸、书籍所提供的资料各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料从互联网或图书馆查阅到的相关资料,补充:文献检索,系统检索,追溯检索,浏览检索,选取合适的数据库和检索的关键词,Science Citation Index,平时的积累,三、数据的误差,1. 抽样误差,由于抽样的随机性所带来的误差 所有样本可能的结果与总体真值之间的平均性差异,影响抽样误差 大小的因素,样本容量的大小,总体的变异性,2. 非抽样误差,除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异 存在于所有的调查之中,抽样误差可计算和控制,非抽样误差的控制,调查员的挑选调查员的培训调查过程控制调查结果进行检验、评估,3. 误差的控制,第二节 数据的整理,一、数据的预处理,数据的审核,逻辑审核,计算检查,保证数据的完整性和准确性,目的,二、统计分组,根据统计研究的需要,将数据按照某个属性分成不同的组别,1.单变量值分组,适用于品质标志分组及数量标志分组中变量值较少时,2. 组距分组,【例】某车间30名工人每周加工某种零件件数如右表试对数据进行分组。,组距分组 (要点),将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况需要遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组,组距分组(思路),先确定组数,再确定组距,先确定组距,再确定组数,组数越多,组距越小,最终分组结果需要反应出总体内各单位的实际分布特征,例:66 69 74 76 78 80 82 84 88 89,组距分组(几个概念),下限(low limit) :一个组的最小值上限(upper limit) :一个组的最大值组距(class width) :上限与下限之差组中值(class midpoint) :下限与上限之间的中点值,频数分布表,3. 累积频数,向上累积频数,(以下累积),变量值由小到大排列,表示某个变量值的位置,或者小于等于某个变量值的个数,向下累积频数,(以上累积),变量值由大到小排列,表示某个变量值的位置,或者大于等于某个变量值的个数,例:P19 表2.9,三、数据分布的图示和类型,1. 直方图(histogram),用矩形的宽度和高度来表示频数分布的图形在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图,2. 折线图(frequency polygon),折线图也称频数多边形图是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的,次数分配的类型,对称分布,右偏分布,左偏分布,正J型分布,反J型分布,U型分布,几种常见的频数分布,四、洛伦茨曲线,描述收入和财富分配性质的曲线,分析该国家或地区分配的平均程度20世纪初美国经济学家、统计学家洛伦茨(M.E. Lorentz)根据意大利经济学家巴雷特(V. Pareto)提出的收入分配公式绘制而成,累积的收入百分比,累积的人口百分比,绝对公平线,基尼系数,20世纪初意大利经济学家基尼(G. Gini)根据洛伦茨曲线给出了衡量收入分配平均程度的指标A表示实际收入曲线与绝对平均线之间的面积B表示实际收入曲线与绝对不平均线之间的面积如果A=0,则基尼系数=0,表示收入绝对平均如果B=0,则基尼系数=1,表示收入绝对不平均基尼系数在0 和1之间取值 一般认为,基尼系数若小于0.2,表明分配平均;基尼系数在0.2至0.4之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;基尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距。,第三节 集中趋势的测度,一、众数(mode),一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据,无众数原始数据: 10 5 9 12 6 8,一个众数原始数据: 6 7 9 8 7 7,多于一个众数原始数据: 25 28 28 36 42 42,应用:市场中价格的确定含义:最典型的,最普遍的,二、中位数(median),排序后处于中间位置上的值,Me,50%,50%,不受极端值的影响,主要用于顺序数据,也可用数值型数据,但不能用于分类数据,【例】 9个家庭的人均月收入数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9,【例】:10个家庭的人均月收入数据排 序: 660 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9 10,其他位置平均数,四分位数(quartile),QL,QM,QU,25%,25%,25%,25%,十分位数(decile),D1 D2 D3 D9,百分位数(percentile),P1 P2 P99,三、均值(mean),x1 ,x2 ,xNx1 ,x2 , ,xn,设一组数据为:,样本,总体,总体均值,样本均值,1、简单算术平均(simple arithmetic mean),2、加权算术平均(weighted arithmetic mean),设一组数据为: x1 ,x2 , ,xn相应的频数为: f1 , f2 , ,fn,总体,样本,变形公式,变量值,权重,性质,各变量值与均值的离差之和等于零,各变量值与均值的离差平方和最小,四、几何平均(geometric mean),适用条件,变量值以相对数的形式出现,且变量值相乘有意义,应用,计算平均发展速度平均收益率流水线的产品合格率,某产品要经过生产流水线连续作业的四道工序才能完成。某月份各工序产品的合格率分别为98%、95%、95%、97%,计算整个流水线产品合格率?,某银行为鼓励用户长期存款,以复利方式计息,某10年期存款的年利率第14年为3%、第57年年为4.5%、第810年为5.5%。则10年的平均年利率?,平均年利率为4.19%,五、众数、中位数、均值的比较,1、数量关系,2、众数、中位数、均值的特点和应用,众数,不受极值的影响,易于理解,最典型的,尤其适用于类型变量,不唯一,中位数,不受极值的影响,数据分布偏斜程度较大时应用,均值,数学性质稳定,易受极值影响,数据对称分布或接近对称分布时应用,前三季度,全国农村居民人均现金收入8527元,同比名义增长11.8%,扣除价格因素实际增长9.7%。全国城镇居民人均可支配收入22044元,同比名义增长9.3%,扣除价格因素实际增长6.9%。根据城乡一体化住户调查,前三季度全国居民人均可支配收入14986元,同比名义增长10.5%,扣除价格因素实际增长8.2%。全国居民人均可支配收入中位数13120元,同比名义增长12.1%。,2014年三季度宏观经济数据,第四节 离散程度的测度,一、极差(range),R = max(xi) - min(xi),一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响,二、内距(Inter-Quartile Range, IQR ),上四分位数与下四分位数之差 IQR= Q3 Q1反映了中间50%数据的离散程度不受极端值的影响,三、方差和标准差,(variance, standard deviation),未分组数据:,分组数据:,总体方差和标准差,未分组数据:,分组数据:,注意:样本方差用自由度n-1去除!,自由度(degree of freedom),一组数据中可以自由取值的数据的个数当样本数据的个数为 n 时,若样本均值确定后,只有n-1个数据可以自由取值,其中必有一个数据不能自由取值例如,样本有3个数值,当 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差2时,它是2的无偏估计量,变形公式:,同随机变量的方差,四、标准差的作用,判断变量的离散程度,判断某一变量取值是否一致,判断某一变量落在某一区间的概率,切比雪夫定律:,判断某一变量值在数据集合中的位置,标准化值,五、离散系数 (coefficient of variation ),例:甲乙两组工人加工零件数如下,60 65 70 75 80,2 5 7 9 12,甲组,乙组,离散系数:标准差与其相应的均值之比,或,消除了数据水平高低和计量单位的影响,用于对不同变量离散程度的比较,【 例 】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度,结论: 计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度,第五节 偏态系数与峰度系数,一、偏态系数,反映变量偏斜程度的指标,通常SK取值在-3+3之间,绝对值越大,表明偏斜程度越大,大于0为正偏(右偏),小于0为负偏(左偏),等于0为对称分布,二、峰度系数,是对数据分布平峰或尖峰程度的测度,K=0 正态分布K0 尖峰分布K0 平峰分布,第六节 统计表与统计图,一、统计表,表2.11 某厂职工人数统计表2007年12月31日,性别,人数(人),比率(),男 女,253115,68.7531.25,表头,行标题,列标题,数字资料,合计,368,100.00,资料来源:,附加,合理安排统计表的结构,长方形表格,长宽保持适当比例;表头一般应包括表号、总标题和表中数据的性质;满足3W要求:数据的时间(when)、地点(where)、何种数据(what)上下两端用粗线,表内用细线绘制,两端采用开口式;注解或资料来源,统计表的设计,科学、实用、简练、美观,二、统计图,1.茎叶图(stem-and-leaf display),用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留一位数字茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息,茎叶图(例题分析),2、箱线图(box plot),用于显示未分组的原始数据的分布 箱线图它由一个箱子和两条线段组成,显示出一组数据的5个特征值,首先找出一组数据的5个特征值,即最大值、最小值和三个四分位数连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接,箱线图的绘制方法,箱线图(例题分析),分布的形状与箱线图,未分组数据多批数据箱线图 (例题分析),8门课程考试成绩的箱线图,

    注意事项

    本文(《应用统计学》PPT课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开