描述数据的图表方法课件.pptx
学习目标,1.定量数据的图表描述数据整理单变量描述双变量描述2.定性数据的图表描述数据整理单变量描述双变量描述,第1页/共33页,单变量定量数据的图表描述,第2页/共33页,单变量定量数据的图表描述数据整理,统计分组根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组。例,收集到某班所有同学的英语考试成绩,为了研究需要划分高、中、低三个成绩段,每个成绩段的范围分别是85-100,70-85,0-70,将每个成绩归入到相应的组中。,第3页/共33页,单变量定量数据的图表描述数据整理,频数分布表 对定量数据进行分组时,需要建立频数分布表,以便更有效地显示数据的特征和分布。构成:频数,各组的单位的次数频率,各组次数与总次数之比频数分布,由分组标志序列和各组相对应的分布次数这两个要素构成。频率分布,由分组标志序列和各组相应的频率构成频率分布。,第4页/共33页,频数分布表,原始数据:24,26,24,21,27,27,30,41,32,38,组别,频数,15 且 25,3,25 且 35,5,35 且 45,2,第5页/共33页,编制频数分布表,1.选择组数可参考Sturges的经验公式3.计算各组的宽度宽度4.确定组界(上下限)5.计算组中值某组的组中值6.根据分组整理成频数分布表计算每个组的频数、相对频数(即频率),第6页/共33页,频数分布表实例,原始数据:24,26,24,21,27,27,30,41,32,38,组界,(上界+下界)/2,组距,组别,组中值,频数,15 且 25,20,3,25 且 35,30,5,35 且 45,40,2,频率,30.0,50.0,20.0,(可参考书上实例),第7页/共33页,累积频数分布表,为了统计分析的需要,有时要观察某一数值以上或某一数值以下频数或频率之和,这就需要在频数分布表基本分组的基础上绘出累积频数或累计频率。“向下累积”由表的上方向表的下方的频数或频率相加“向上累积”由表的上方向表的下方的频数或频率相加,第8页/共33页,小于组别下限的百分数,原始数据:24,26,24,21,27,27,30,41,32,38,组别下界,30%+50%,80%+20%,组别,累计,百分比,15 25,0.0,25 35,30.0,35 45,80.0,45 55,100.0,累积频数分布表实例,(可参考书上实例),第9页/共33页,单变量定量数据的图表描述数据图形描述(分组后数据),数据分组整理后的图形描述直方图 用矩形的高度和宽度来表示频数分布 折线图作用与直方图相似 累积频数分布图描述累积频数或频率信息,第10页/共33页,0,1,2,3,4,5,直 方 图,频数 或频率,01525354555,下界,柱条接触,计数,(可参考书上实例),第11页/共33页,0,1,2,3,4,5,折线图,中点,虚拟的外推组,0102030405060,组别,频数,15 25,3,25 35,5,35 45,2,计数,(可参考书上实例),频数 或频率,第12页/共33页,0%,25%,50%,75%,100%,累积折线图,下界,虚拟的外推组,01525354555,组别,累计%,15 25,0%,25 35,30%,35 45,80%,45 100%,累计%,(可参考书上实例),第13页/共33页,单变量定量数据的图表描述数据图形描述(未分组数据),数据未分组整理后的图形描述茎叶图 用于直接描述未分组原始数据的探索性分析描述数据分布形状,如数据是否集中,是否有极端值等 由茎、叶、每个茎对应叶的个数、茎的宽度这四元素组成箱线图用于直接描述未分组原始数据的探索性分析描述数据的分布形状,如数据是否集中,是否有极端值等可以比较多组数据分布特征图中包含五个点组成:样本数据的最小值、下四分位数、中位数、上四分位数、最大值,第14页/共33页,茎叶图,把每一项观察分解为茎值和叶值茎值确定组别叶值确定频数(计数),Xi,第15页/共33页,奇异值,箱线图,最大值,最小值,中位数,大于1.5倍四分位数间距,四分位数间距范围,第16页/共33页,箱线图,(可参考书上实例),中间的黑粗线为中位数方框为四分位间距的范围离方框上/下界的距离超过四分位数间距1.5倍的为离群值,以“O”表示;超过3倍的则为极值,用“*”表示。,第17页/共33页,多变量定量数据的图表描述,第18页/共33页,1.散点图同时研究两个数字变量的取值在图上标出所有数对(Xi,Yi)2.时间序列图 表示一列定量数据如何随时间变化3.组箱线图比较多个总体的分布特征4.雷达图用于要同时分析的变量个数较多的情况,多变量定量数据的图表描述,第19页/共33页,散点图,标出所有数对(Xi,Yi),(可参考书上实例),第20页/共33页,时间序列图,年份,(可参考书上实例),第21页/共33页,组箱线图,第22页/共33页,单变量定性数据的图表描述,第23页/共33页,单变量定性数据的图表描述数据整理,频数分布表(又叫总结表)类似于整理定量数据的频数分布表包含:分类的频数或频率,即指落在某一特定类中的观察值数分类的相对频数,指某个特定类的频数除以观察值总数所得的商累积频数分布表类似于整理定量数据的累积频数分布表,第24页/共33页,频数分布表,(可参考书上实例),第25页/共33页,单变量定性数据的图表描述数据图形描述,条形图类似直方图,条形图的横轴表示的是各个分类,直方图的横轴表示所分的组 饼图通常用来描述落在各个分类中的观察值数分别在总数中所占的比率 累积频数分布图类似于描述定量数据中的累积频率分布图帕雷托图变量的分类数目较多时,用帕雷托图要比条形图和饼图更能直观地显示信息。广泛应用于过程分析和质量分析中,第26页/共33页,0,50,100,150,会计,经济,管理,条 形 图,水平条表示类型变量,条长表示频数或者%,条宽的1/2 到 1 倍,相同的条宽,零点,频数,专业,也可使用百分比,(可参考书上实例),第27页/共33页,经济,10%,管理,25%,会计,65%,饼 图,1.表示出总量的分类2.是表示相对差异的有效办法3.角度大小360(百分数),专业,36010%=36,36,(可参考书上实例),第28页/共33页,0%,33%,67%,100%,会计,管理,经济,帕雷托图,百分数,专业,递减顺序,累积频数分布图,相同的条宽,竖直条形,条的中点,(可参考书上实例),第29页/共33页,多变量定性数据的图表描述,环 形 图,交 叉 图,多 重 条 形 图,多定性数据的图表描述,第30页/共33页,1.环形图显示具有相同分类且问题可比的多个样本或总体中各类别所占的相应比例,对各总体进行比较研究在类别值为定序数据时这种比较才有意义2.交叉表可检测两个定性变量的关系同样可用来描述两个变量都是数字变量,或者一个变量是定类或定序变量,另一个是数字变量之间的关系 3.多重条形图描述两个定类或定序变量间关系,多变量定性数据的图表描述,第31页/共33页,交叉表,住处:CCOOCCOOC O 性别:MFFMMMFMMF(C=校内,O=校外;M=男,F=女),4 12 3,性别,住处,男,女,合计,校内,5,校外,5,合计,6,4,10,第32页/共33页,多重条形图,频数,住处,0 1,2 3,4 5,6,校内 男 女,校外 男 女,第33页/共33页,