数据及其图表展.ppt
《数据及其图表展.ppt》由会员分享,可在线阅读,更多相关《数据及其图表展.ppt(86页珍藏版)》请在三一办公上搜索。
1、数据分析,有趣的统计,女性眨眼的次数几乎是男性的两倍使用右手的人的平均寿命比“左撇子”的人的平均寿命长9年你至少和其他900万个人一起过生日中国说英语的人比美国的多世界上最有价值的品牌是这样一个顺序:万宝路、可口可乐和百威 你相信这些结论都是正确的吗?他们可以用统计方法进行检验,资料来源:Mario F.Triiola 著初级统计学,统计的滥用,大约在一个世纪以前,政治家Benjamin Disraeli曾有一个著名的论断:“有三类谎言:谎言、糟透的谎言和统计。”他还说:“图并没有说谎,是说谎者在画图”历史学家Andrew Lang说,一些人使用统计“就像喝醉酒的人使用街灯柱支撑的功能多于照明
2、统计滥用不好的样本过小的样本误导性图表局部描述故意曲解,资料来源:Mario F.Triiola 著初级统计学,数据分析在企业管理中的应用,数据分析在企业管理中的应用,数据的预处理 分类和顺序数据的整理与显示 数值型数据的整理与显示 统计表,统计研究的过程,实际问题,什么是统计数据?(data),对现象进行测量的结果 不是指单个的数字,而是由多个数据构成的数据集 不仅仅是指数字,它可以是数字的,也可以是文字的,ABC.,0123.,统计数据的分类,统计数据的分类,统计数据的分类(按计量尺度分),分类数据(categorical data)只能归于某一类别的非数字型数据对事物进行分类的结果,数据
3、表现为类别,用文字来表述例如,人口按性别分为男、女两类 顺序数据(rank data)只能归于某一有序类别的非数字型数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等 数值型数据(metric data)按数字尺度测量的观察值结果表现为具体的数值,对事物的精确测度例如:身高为175cm、168cm、183cm,统计数据的分类(按收集方法分),观测的数据(observational data)通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据试验的数据(experimental data)在试
4、验中控制试验对象而收集到的数据比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据,统计数据的分类(按时间状况分),截面数据(cross-sectional data)在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2003年我国各地区的国内生产总值数据时间序列数据(time series data)在不同时间上收集到的数据描述现象随时间变化的情况比如,1996年至2003年国内生产总值数据,数据分析工具(统计软件),典型的统计软件SASSPSSMINITABSTATISTICAExcel,3.1 数据的预处理,3.1.1 数据审核
5、3.1.2 数据筛选3.1.3 数据排序,作者识别,17871788年,Alexander Hamilton,John Jay和James Madison为了说服纽约人认可宪法,匿名发表了著名的85篇论文。这些论文中的大多数作者已经得到了识别,但是,其中的12篇论文的作者身份引起了争议。通过对不同单词的频数进行统计分析,我们现在可以得出结论,James Madison最有可能是这12篇论文的作者。对于这些存在争议的论文,认为James Madison是原创作者的说法占主导地位,而且几乎可以肯定这种说法是正确的。,资料来源:Mario F.Triiola 著初级统计学,数据的预处理,数据审核检查
6、数据中的错误数据筛选找出符合条件的数据数据排序升序和降序寻找数据的基本特征,数据筛选与排序,数据筛选(data filter),当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选数据筛选的内容将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除,用Excel进行数据筛选,8名学生的考试成绩数据,数据筛选(data filter),数据排序(data rank),按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索排序有助于对数据检查纠错,以及为重新归类或分组等提供依据在某些场合,
7、排序本身就是分析的目的之一排序可借助于计算机完成,数据排序(方法),分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分数值型数据的排序递增排序:设一组数据为x1,x2,xn,递增排序后可表示为:x(1)x(2)x(n),3.2 分类和顺序数据的整理与显示,3.2.1 分类数据的整理与图示3.2.2 顺序数据的整理与图示,数据的整理与显示(基本问题),要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的对分类数据和顺序数据主要是作分类整理对数值型数据则主要是作分组整理适合于低层次
8、数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据,分类数据的整理与图示,分类数据的整理(基本过程),1.列出各类别,3.制作频数分布表4.用图形显示数据,分类数据的整理(可计算的统计量),频数(frequency):落在各类别中的数据个数比例(proportion):某一类别数据占全部数据的比值百分比(percentage):将对比的基数作为100而计算的比值比率(ratio):不同类别数值的比值,分类数据整理频数分布表(例题分析),【例】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购
9、买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。右边就是记录的原始数据,用Excel制作频数分布表,分类数据的图示条形图(bar Chart),用宽度相同的条形的高度或长短来表示各类别数据的图形有单式条形图、复式条形图等形式主要用于反映分类数据的频数分布绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图,分类数据的图示条形图(例题分析),分类数据的图示饼图(pie Chart),也称圆形图,是用圆形及圆内扇形的面积来表示数值大小的图形主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用绘制圆形图时,总体中各部分所占的百
10、分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的,分类数据的图示饼图(例题分析),顺序数据的整理与图示,顺序数据的整理(可计算的统计量),1.累积频数(cumulative frequencies):各类别频数的逐级累加2.累积频率(cumulative percentages):各类别频率(百分比)的逐级累加,顺序数据的频数分布表(例题分析),【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1非常不满意;2不满意;3一般;4满意;5非常满意。,顺序数据的频数分布表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 及其 图表
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6296302.html