Excel数据分析与图表制作ppt课件.pptx
数据分析与图表展现Excel 2010高级应用技巧培训,甘肃万维 程涛2011-7,学习大纲,统计分析基础获得分析需求的方法了解并掌握基本的分析模型了解Excel数据分析工作流程及关键操作技能如何提高数据收集质量数据的规格化处理使用数据透视表进行统计分析学会图表制作方法打好基础突破Excel传统局限,提高图表表现力了解并学会制作专业图表,2,需具备的基本知识,从事过数据采集、整理和分析工作。用Excel至少成功的做出过1种统计图。了解Excel公式的基本书写规则。用过至少2-3个函数,并且能够理解这些函数。基本熟悉Excel 2010版本的界面。,3,数据分析的目标和分析模型,数据分析前的准备工作,4,确定分析需求,要分析什么?希望得到什么结果?分析结果是用来干什么的?,5,分析是为了发现问题和解决问题,而不是为了Excel功能展现!,需求的来源,分析是为管理工作服务的数据说话。分析需求首先来自管理者工作中的关注焦点验证工作成效发现变化业务数据的进一步挖掘和提炼也是数据分析的主要动力。发现变化规律异常捕获挖掘数据间的潜在关系,6,获取需求的方法,数据分析相关人员管理者数据收集和分析人员数据产生和提供人员如何获取需求管理者提出要求数据分析人员与管理者交流数据分析人员尝试各种统计分析模型,发现值得关注的异常现象。,7,选择恰当的分析模型,常用的分析方法统计图表比较、联系、构成、分布动态、静态常用的数据汇总统计方法数据透视表汇总、计数、平均、最大最小分类、切片、挖掘、旋转不常用的专业分析模型加载项线性回归、傅里叶分析、移动平均、直方图分析、规划求解。专业模型侧重预测,结果具有不确定性,并且涉及较多的数理统计知识。对算法理解不透彻,或者应用场景不匹配,其结果容易引起误导。,8,除非特别必要,并且已经与管理者达成一致,强烈建议不要把这些专业分析模型引入日常工作报告中。,数据分析过程及关键操作技能,开始进行数据分析,9,Excel数据分析基本工作流程,10,管理工作,验证、指引,原始数据的关键特征,原始数据是数据分析的基础。原始数据来源于日常工作,是日常工作执行过程中留下来的痕迹工作记录。原始数据必须是随着工作的执行同步采集,很难事后补充。原始数据的记录质量很大程度上决定了数据分析工作的可操作性,以及结果的可用性。客观性完整性一致性二义性,11,数据采集过程中存在的普遍性问题,采集不足或过度采集;文字描述过多而数据不足,无法做统计分析,只能当做工作记录用是文档不是数据表。总想记录尽可能多的信息,已备不时之需无人过问的数据没有价值,只能增加工作量。数据结构经常变动,缺乏持续性;数据结构的设计过于关注管理者的需求,忽视了作业规范。缺乏数据填写标准的定义,或虽然定义了但标准难以把握;满意度定义:很不满意、不满意、比较满意、满意、非常满意,比较满意和满意如何区分?原始记录填写随意,描述方式或格式不一致;甘肃电信、甘肃省电信、中国电信甘肃分公司、省公司,几种叫法实际上指的都是同一个公司,但Excel会把它当成四个不同的公司,张三、张 三 Excel也会当做两个人。3月10日、10/3、3.10、3月份,都是日期吗?Excel可不会这么想。合同金额:78、10360,计量单位是万元还是元?必填项缺乏强制性,存在空白;对于空白,人为的理解可以是:没有、同上、不知道、忘添了,Excel的理解是:什么也不是(Null)。某些数据可以很轻易的后补,缺乏客观性。上周三我工作了几个小时?上周四晚上9点机房温度是多少?,12,如何提高原始记录的质量,做好基础工作定义数据结构。定义分类标准和解释口径。培训、宣贯,使以上成果成为员工工作标准。使用高效高质的采集手段业务系统信息化。手工记录模板化。数据稽核常态化保持恰当的检查频率,并且首先查数据,培养数据说话的习惯领导不关注的数据一定是不会认真填报的。主观数据主抓填报及时性和逻辑合理性,但对准确性不要太较真,尽量不要用于考核,如工作量申报。,13,数据结构定义需要哪些数据,对管理需求进行分解算法的需要依据采用什么分析模型,以及这些模型需要什么输入。潜在的管理需求问题发现、原因分析、验证效果、绩效管理。对工作流程/方法进行分析了解可获得的信息。从数据生命周期的角度评估数据采集需求避免无用数据。从哪来干什么用放多长时间什么时候可以销毁充分考虑数据的可获得性以及采集成本。数据结构一旦定下来,尽量不要有太大变动。,14,一手的原始数据在成本允许的情况下尽可能多的采集;可通过计算获得数据尽量不要在采集阶段采集。尽量避免重复采集。,数据结构定义示例,15,服务工作的客户满意度?,在同一时间段内,客户满意的数量/服务总量。,从服务人员处获取服务记录和客户信息,通过电话回访了解每次服务的满意度,并进行记录。,管理需求,统计方法,作业程序,服务时间客户满意度,回访时间回访人回访结果工单号受理时间服务时间客户名称服务内容执行人服务时长响应速度是否是在休息日提供的服务?服务完成后多长时间做的回访?,回访记录,服务记录,计算结果,一手数据,暂时用不到的数据可以满足潜在需求,尽量保留:哪些客户的满意度最低?哪些业务满意度不高?响应速度是否达到要求?回访是否及时?有没有回访过晚而导致反馈失效?哪些员工的服务满意度总是很高,有什么好的经验?客户通常在什么时间提出申告?,数据标准定义,明确必填项和选填项;每一项数据尽量起一个容易理解的名称,容易引起误解的名称是填写错误的主要根源。关键信息分开填写,不要合并。“专业”的工单号:FW201103001,FW_YJ_0001。需要做分类统计的数据必须定义清晰易掌握的分类标准;名称要保持一致,最好定义一张标准的名称表,例如地名表、客户清单。数量要定义计量单位,并杜绝全角输入。日期要定义统一的书写格式,杜绝用“.”、“,”做日期分隔符,杜绝模糊日期(如3月份,3月底)。特征描述类属性的分类不易过多(3-5个)。不要过于追求数字化,文字描述同样能够达到统计要求。应基于同一标准、同一层级定义分类,,16,分类定义,特征描述类属性的分类不易过多(通常3-5个就够了)过多的分类不易把握边界,填写困难;过多的分类容易稀释数据,导致无法聚焦关键所在。分类边界务必清晰,符合多数人的思维习惯。不要过于追求数字化,文字描述同样能够达到统计要求。例如:满意度评价,打分容易还是定性描述容易?应基于同一标准、同一层级定义分类典型案例:原因分类。同一事物站在不同角度可有多个分类维度,一定要从管理的视角进行分类。可进行多层分类,但不宜过多。层次越深的分类对分析能力要求越高。,17,数据记录表单模板的设计,模板尽量简单,尽量避免多项内容组合到一张工作表中。关键地方和容易引起误解的地方添加必要的注释。注释最好写在填写位置的旁边,并用醒目的颜色。在单独的一页工作表中书写完整详细的填表指南,虽然有必要也很专业,但千万别指望用它来指导使用者,因为没人看。如果用Excel的“注释”功能添加的注释,最好让它始终显示出来,但这样会使整体页面很难看。采用从上到下的原则统一数据标准。公司要求的报表部门级汇总表班组级汇总表个人工作汇总表工作单/工作日志。能用下拉选单的地方尽量不用手填。适度使用公式公式总是容易被破坏。使用公式的地方要显著标注出来,防止被删除。不要用跨工作表的公式。不管采用什么办法,新增行并不能很好的继承上一行的公式。尽量不要包含链接。模板中包含分配标准和名称标准列表,并且不允许私自更改。给日期单元格加校验。模板发布的同时最好同时提供样例再详细的填写指南也比不上样例的作用。,18,数据的规格化处理,为什么要做规格化处理原始数据总会存在缺陷;Excel在做统计分析时对数据格式有严格要求;根据分析模型的要求补充必要的数据。通常需要做哪些规格化处理查找明显填写不正确的数据并进行纠正;与历史数据、关联数据的合并;为方便统计分析添加计算列。,19,统计分析利器数据透视表,20,点击“插入/数据透视表”,统计分析利器数据透视表,21,过去几年各地区的销售额是多少?,如何获得按年、月进行汇总的结果把“合同日期”拖放到行标签区域;选中合同日期列中的任意单元格,右键单击,在快捷菜单中选择“创建组”;选择选择步长为“年”;由于年比较少,可以把行标签拖到列标签,使布局更合理。Excel可以针对日期和数字按照一定的间隔(步长)创建分组,这对日期敏感型的数据分析很有帮助。数字的分组则可以进行分级汇总统计,试一试:按100万为一个等级,统计各地区2006年各等级合同的个数。,统计分析利器数据透视表,22,大单在哪里?按100为一个等级,对合同金额分级,然后统计各等级合同的个数。,对金额创建组,可以将系统自动生成的列名更改为任意自己喜欢的名字,只要不和已有字段重名。,右键点击排序,强调统计结果。,统计分析利器数据透视表,23,谁是2007年的销售明星?统计2007年每个销售的签约量、签约总额、贡献占比,并排序。,右键选择“值显示方式”可以在汇总结果基础上再做一次计算。,统计分析利器数据透视表,综合练习2007年各月的签约额是多少,与去年同期相比,增幅是多少?应用到的技巧:日期的分组筛选行、列布局值显示方式的应用修改列名拓展训练:5月份同比出现负增长,什么原因?挖掘、钻取,24,小 结 统计分析知识点,如何确定数据分析的目标和分析模型数据分析的基本过程如何确保数据采集质量数据规格化要做些什么事情如何用数据透视表完成统计分析工作,25,Excel图表制作技巧,展示分析结果,26,Excel图表的制作技巧,基础篇熟练控制Excel图表元素选择恰当的图表类型表现分析主题技巧篇突破Excel传统布局,让图表更好的表达观点。专业篇了解并掌握经典专业图表的应用场景及制作方法。,27,基础篇,了解Excel图表元素增加、删除数据系列制作组合图表图表布局基本原则图表类型的选择,28,Excel图表基础图表元素,29,Excel图表基础图表元素的属性配置,了解经常用到的属性及配置方法坐标轴:最大值、最小值,间隔单位,排序,标签显示方式;系列:填充色,间距(柱形/条形图),线型,数据标记(折线图/散点图),分析线(趋势线、折线、误差线),图表类型;图例:位置,显示项目;网格线:线形,颜色;数据标签:字体,位置,显示内容。,30,Excel图表基础作图数据,数据表中的数据会出现在图表中的什么位置?系列、分类是可以互换位置的。数字格式数据标签如何处理空值?如何在已有图表上添加或删除系列?方法1:在数据表中调整蓝色框线范围;方法2:图表中选中系列直接按删除键删除;方法3:在“选择数据源”对话框中添加或删除系列;方法4:拷贝粘贴法添加数据系列。,31,Excel图表基础组合图表,在二维图表中,每一个系列可单独更改为不同的图表类型,由此成为组合图表。图表中包含多个系列,其中一个系列与其它系列的计量单位不同时,应将其放在次坐标轴上,并更改为不同的图表类型,形成组合图表。技巧:当要修改的系列与其它系列的值差别特别大,使得图形紧贴坐标轴时(如百分比),该如何选中这个系列?,32,Excel图表基础组合图表(续),使用组合图表的注意事项除非特别必要(例如图表读者已经非常习惯),尽量不要把不同计量单位的数据放在一起,如果要放在一起,注意避免遮盖;制作组合图表的主要意图是为了对一组相关数据进行比较,因此在选择图表类型、配色时要格外注意保持主题突出;当组合图表中的使用了折线图,需注意分类轴(横坐标)应该是反映时间周期的。组合图表的典型应用案例:,33,同期趋势对比,计划与实际对比,Excel图表基础图表布局,主题明确避免次要元素占据主要位置;配色。简洁美观删除多余的元素;避免遮盖;数据标签的处理;坐标轴及网格线的处理。说明完整图例计量单位图表标题、坐标轴标题,34,Excel图表基础配色,Excel图表的默认配色采用的主题颜色,可以选择其他主题或自定义主题。无论采用什么配色方案,都应保持一致性的延续性风格化。颜色也可以传递信息。要注意配色惯例,如红、橙、黄通常具有警告含义,可用于异常数据的突出显示,蓝色通常代表进展,绿色通常代表成长。避免不协调的色彩搭配:红绿搭配通常会引起不舒服的感觉;低反差的配色不易分辨;各系列均采用浓重的颜色不但无法突出重点,而且容易产生头重脚轻的感觉。稳妥的配色方案:没有时序关系的系列采用不同色系搭配;具有时序关系的系列采用同色系不同明度的方式搭配;尽量不使用太浅的颜色。,35,Excel图表基础练习,36,练习要求:先用在建、试运行、停工三列数据创建堆积柱形图;对每个系列分别设置不同的填充颜色;用前面学到的方法,在图中手工增加“平均进度”系列,并将其放到次坐标轴上,更改为折线图;设置图表格式,尽量与范例保持一致:字体坐标轴网格线标题图例,知识点:创建图表;向图表中添加新的数据系列;次坐标轴的应用;组合图表;图表元素的操作。,图表类型的选择,图表尽量简洁明了,突出主题。充分考虑读者的习惯,选则更容易被接受和理解的图表类型,避免过多的解释。常用图表的一般用途:柱形图、条形图:数量对比;折线图、面积图、柱形图:反映趋势;饼图、堆积百分比柱形/条形图:反映结构;散点图、气泡图:反映数据间的联系。不恰当的图表类型可能会传达错误信息。案例:用折线图描绘一组没有时序关系的数据尽量不要用三维图形貌似美观,但没有传递更多的信息,反倒分散了关注点。三维图无法做组合图。组合图可以在一张图中有效反映关联数据,但不可滥用。一张图中不宜反映太多信息,否则无法聚焦,容易使人迷惑。不同系列之间的关联关系如果不可靠,图形反映的将是错误信息。,37,图表类型的选择,38,技巧篇,在堆积柱形图中显示汇总数据标签用互补色突出显示负值分离组合图中不同计量单位的折线图避免负值遮盖分类轴标签添加平均线可定制的数据标签突出标识节假日避免凌乱的曲线图,39,Excel图表技巧显示汇总数据标签,在堆积柱形图中,将汇总系列添加进去,并更改为折线图,添加数据标签,隐藏汇总系统的线条和数据标记,从图例中删除汇总图例。,40,Excel图表技巧用互补色突出显示负值,41,Excel图表技巧分离不同计量单位的折线图,42,利用坐标轴的最大值和最小值,将折线图推到上面,避免覆盖,使整个图形更加清晰。利用自定义数字格式,使坐标轴看起来也分开了,显得更加专业。,Excel图表技巧避免负值遮盖分类轴标签,利用辅助系列的数据标签代替分类轴标签。,调整分类轴标签的位置。,小技巧:图中的数据标志符号“”是怎么画上去的?很简单,在图表外面随便画一个图形,选中,拷贝,然后在图表中选中要标注的数据点,粘贴,就行了。这种方法同样适用于柱形图和条形图。,Excel图表技巧添加平均线,44,方法一:数据表中增加月均值列,并将其添加到图中,图表类型设为折线图。,方法二:添加月均值数据系列(一个值),图表类型设为XY散点图,系列属性X=6.5,Y=平均值。然后给该数据点添加水平误差线,设置误差线属性。这种方法比较复杂,与上一个方法相比,好处是平均线可以延伸到Y轴,看起更专业一些。,Excel图表技巧可定制的数据标签,45,左边这张图的意图是想反应本期实绩,以及与去年同期对比的结果,这是通常见到的图表形式。这个图表存在几个缺陷:1、比较凌乱,折线图与柱形图交错,阅读困难;2、总收入与行业内、行业外收入是总分关系,没有时间周期关系,折线图容易引起误解。转换成条形图,去掉同比增幅折线图,把同比增幅的信息包含到本期实绩的数据标签中,可以使得图表的可读性大大提高。,小技巧:选中一个数据标签,然后在编辑栏里输入“=引用单元格”,就可以定制显示内容了。如果需要更改多个数据标签,可使用第三方工具XY Chart Laber批量添加,免费下载地址:http:/,Excel图表技巧突出标识节假日,46,某些业务具有周期特性,在图表中标识出节假日,有助于观察业务的变化规律。实现方法:在数据表中增加一列,用日期函数和搜索函数判断日期是否是周末或法定节假日,如果是节假日则为1,否则为0,然后添加到图表中,设置成浅色的柱形图。柱形图放到次坐标轴上,间距设为0,次坐标轴的最大值设为1,隐藏次坐标轴的标签。,Excel图表技巧避免凌乱的曲线图,47,左边这张图是比较常见的,但多条曲线交错在一起,不但显得比较凌乱,而且查看的时候需要检索图例,无法做到一目了然。将数据表中的各个系列进行错行处理,然后使用次横坐标轴显示系列名称,不但省略了图例,使图表显得更加明快清晰,而且可以添加一些必要的注释,整个图表的可读性、美观性大为改善。对多系列曲线图进行错行处理是一个非常有用的技巧,建议熟练掌握。,专业篇,48,柏拉图,子弹图,漏斗图,对称条形图,麦肯锡瀑布图,象限图,专业图表制作 柏拉图,19世纪意大利经济学家柏拉图分析社会财富分布状况时,发现80%的财富集中在20%的人手里,后来人们发现很多场合都服从这一规律,于是称之为“柏拉图定律”,又叫“二八法则”。美国质量管理专家朱兰博士运用柏拉图的统计图加以延伸将其用于质量管理。柏拉图(有时又叫直方图)是分析和寻找主要影响因素的一种工具,柱形图表示频数,折线图表示累积频率,横坐标表示影响因素,按影响程度(频数)的大小从左向右排列。通过对排列图的观察分析可抓住主要因素。制图技巧:对数量列按从大到小排序;累积百分比的计算公式:SUM(第一行到当前行的数量)/SUM(所有行数量);组合图技巧,先做成柱形图,然后将累积百分比系列设置到次坐标轴,并将其更改为折线图。,49,难度系数:,专业图表制作 象限图,象限图是利用两个关键性能指标分别在横坐标和纵坐标交叉划分出四个区域,用于分析和发现两个指标的匹配优劣程度。制图技巧:用气泡图绘制,用装机量做X轴,用活跃度做Y轴,用资费做气泡大小;图表画出来后,调整X、Y轴的最大值和最小值,由于系列的数据点位于气泡的中心,气泡的半径会占用一些空间,使坐标轴出现负值,所以要调整最大值和最小值,使矩阵能够囊括所有气泡。为了便于划分象限,坐标轴的最大和最小值的间隔应是2的倍数。这是采用两个指标的中间值划分象限的做法,如果有其他标准,则不能用这种方法;将坐标轴的主要刻度单位设置为最大值和最小值之间间隔的一半。在两个坐标轴上分别增加主要网格线,隐藏坐标轴标签,使图形形成四个象限。添加坐标轴标题。添加数据标签,手动更改每个标签的值,也可以用XY Chart Labels工具批量添加产品名称标签。,50,难度系数:,专业图表制作 子弹图,子弹(Bullet)图是国外数据可视化专家Stephen Few发明的一种图表类型,常用于KPI指标实绩与预算目标的比较。子弹图的初衷是用来取代仪表盘图表,它可以反映KPI特别是多个KPI的完成情况,而不需占用大的空间。制图技巧:先用柱形图绘制,然后将本期实绩系列设置到次坐标轴上,使得本期实绩浮在全年预算前面;删除次坐标轴,本期实绩虽然还在次坐标上,但数值自动适应主坐标轴,使得两个系列的比例保持一致;分别调整全年预算和本期实绩两个系列的分类间距,后面的全年预算分类间隔调小一点,前面的本期实绩分类间隔调大一点,使其看起来套在全年预算的框中;将时序预算更改为折线图,并将线条隐藏;在图表外面用绘图工具画一条短横线,长度略超过全年预算柱子的宽度,选中这条短横线,并复制,选中图表中的时序预算系列,粘贴,用绘制的短横线做数据标志;手动画一个时序预算图例。,51,时序预算,难度系数:,专业图表制作 漏斗图,漏斗图起源于销售漏斗管理模型,销售漏斗(也叫销售管线)是科学反映机会状态以及销售效率的一个重要的销售管理模型。通过对销售管线要素的定义(如:阶段划分、阶段升迁标志,阶段升迁率、平均阶段耗时、阶段任务等),形成销售管线管理模型,通过对销售管线的分析可以动态反映销售机会的升迁状态,预测销售结果。制图技巧:采用占位的方式将条形图挤到中间去;绘制堆积条形图,在数据系列的左边添加占位系列,占位系列的值=(数据系列最大值 当前行的数据系列值)/2;将占位系列的填充色选为无填充,隐藏占位系列;添加系列线;如果需要手工调整每一条形的颜色。,52,难度系数:,专业图表制作 对称条形图,对称条形图主要用于观察两个关联指标的同步变化规律。制图技巧:将其中一个系列转换成负值,调整系列为重叠型;在数据表中,将数值的数字格式设置为自定义格式“#,#0;#,#0;0”,使得负值不显示负号。将主要纵坐标轴的标签显示位置设置为“底部”,防止图形遮盖标签。,53,难度系数:,专业图表制作 麦肯锡瀑布图,瀑布图是由麦肯锡公司发明的一种图表类型,常用来反应从一个数字到另一个数字的变化过程,也可用来反应构成关系。制图技巧:采用占位的方式制作悬空效果,用误差线按顺序连接色块;在数据表中规划四个系列,分别是起始点系列,占位系列,影响因素(增量系列和减量系列);注意观察图形特征,增量和减量的占位系列算法是不一样的;将减量取绝对值;用这四个系列绘制堆积条形图,隐藏占位系列,设置各系列的颜色,瀑布图基本成型;为了增强效果,可添加连接线。为符合瀑布图的连线规则,需要用到XY散点图,并使用误差线作为连接线;XY散点图+误差线是扩展Excel图表元素的常用手段,具体操作比较复杂,请仔细观看培训演示。XY散点图+误差线的关键知识点:理解XY散点图的坐标轴关系,尤其是X轴和分类轴的对应关系;如何将XY散点图添加到图表中;误差线的方向和长度如何设置。,54,难度系数:,总结回顾,统计分析的目的统计分析是为管理服务的:发现问题-分析问题-解决问题。分析目标及分析模型的选择应首先满足管理者的需要。数据采集数据质量很重要;好的数据模板能够提高数据采集质量和效率;在进行统计分析前需要对数据做必要的规格化处理。统计分析工具数据透视表是统计分析人员必须熟练掌握的工具。Excel图表制作熟练驾驭Excel图表元素;Excel图表传统框架是可以突破的;原始数据 制图数据;常见的专业图表既是分析模型也是经典视图。推荐资源图表发烧友的必备读本:Excel图表之道刘万祥著作者博客:http:/,55,愿人人成为图表高手,祝大家学习愉快,56,