《人大版贾俊平第五版统计学第3章数据的图表展示.ppt》由会员分享,可在线阅读,更多相关《人大版贾俊平第五版统计学第3章数据的图表展示.ppt(29页珍藏版)》请在三一办公上搜索。
1、第3章 数据的图表展示,3.1 数据的预处理,3.1.1 数据审核,适用性,时效性,完整性审核,准确性审核,应调查的单位是否有遗漏所有的调查项目是否填写齐全,数据是否有错误是否存在异常值,应尽可能使用最新的统计数据,来源、口径以及有关的背景材料是否符合自己分析研究的需要,3.1.2 数据筛选3.1.3 数据排序,例3.1,3.1.4 数据透视表,例3.2,3.2 品质数据的整理与展示,3.2.1 分类数据的整理与展示1.频数与频数分布频数:落在各类别中的数据个数。将各类别及落在其中的相应频数列出,用表格形式表现出来,称为频数分布。例3.3,2.分类数据的图示(1)条形图是用宽度相同的条形的高度
2、或长短来表示数据变动的图形条形图有单式、复式等形式在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率例3.3,(2)帕累托图不同类别的数据根据其频率降序排列的,并在同一张图中画出累积百分比图用双直角坐标系表示,左边纵坐标表示频数,右边纵坐标表示频率,(3)饼图用圆形及园内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用,例3.3,(4)环形图环形图是由两个及两个以上大小不一的饼图叠在一起,挖去中间的部分所构成的图形,3.2.2 顺序数据的整理与图示1.累积频数和累积频率可以是向上累计频数,也可以是向下累计频数。向上累计频数分布是
3、先列出各组的上限,然后由标志值低的组向标志值高的组依次累计频数。向下累计频数分布是先列出各组的下限,然后由标志值高的组向标志值低的组依次累计频数。例3.5,3.3 数值型数据的整理与展示,3.3.1 数据分组将原始数据按照某种标准分成不同的组别,用于观察数据的分布特征,分组方法,单变量值分组,组距分组,实例某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127
4、 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121,单变量值分组表,等距分组表(上下组限重叠),等距分组表(上下组限间断),等距分组表(使用开口组),3.3.2 数值型数据的图示1.分组数据:直方图用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram),2.未分组数据:茎叶图和箱线图(1)茎叶图用于显示未分组的原始数据的
5、分布,由“茎”和“叶”两部分构成,其图形是由数字组成的,以该组数据的高位数值作树茎,低位数字作树叶,(2)箱线图将一组数据从大到小排列,分别计算出他的上边缘,上四分位数,中位数,下四分位数,下边缘,还有一个异常值。,中位数,QU,X最大值,X最小值,QL,不同分布的箱线图,分布的形状与箱线图,未分组数据多批数据箱线图,8门课程考试成绩的箱线图,3.时间序列数据:线图时间一般绘在横轴,指标数据绘在纵轴图形的长宽比例要适当,其长宽比例大致为10:7一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断例3.8,4.多变量数据的图示(1)散点图用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式例3.9,(2)气泡图展示三个变量之间的关系例3.9,(3)雷达图,数据类型及图示,3.4 合理使用图表,3.4.1 鉴别图形优劣的准则,强调数据间的比较,有对图形的统计描述和文字说明,服务于一个明确的目的,让读者的注意力集中在图形内容上,避免歪曲,显示数据,好图,3.4.2 统计表的设计,行标题,列标题,数字资料,附加,表头,19971998年城镇居民家庭抽样调查资料,
链接地址:https://www.31ppt.com/p-2266682.html