《数据分析分享》PPT课件.ppt
数据分析分享 2013年3月,内容提纲,一、数据分析那些事儿二、数据准备三、数据处理四、数据分析五、数据展现六、撰写报告,数据分析是什么数据分析常见步骤常用的指标&术语,一、数据分析那些事儿,数据分析是什么,数据分析为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。,数据分析,描述性,探索性,验证性,初级数据分析对比分析法平均分析法交叉分析法,高级数据分析相关分析因子分析回归分析,菜鸟与老鸟的区别,数据分析常见步骤,一般数据分析用Excel可以完成若高级数据分析,则需要使用数据分析工具,如SPSS、SAS等,数据分析的目标与要求,为什么要开展数据分析数据分析反映什么现状数据分析解决什么问题希冀达到的效果和目的,常用的指标&术语,平均数与中位数 绝对数与相对数 百分比与百分点 频数与频率 比例与比率 倍数与番数 同比与环比,二、数据准备,忌用合并单元格 被合并的单元格给后续的数据处理、分析带来 很多的麻烦导入外部数据数据类型 字符型数据、数值型数据尽可能少动原始数据 数据组织要规范,原始数据就应该是一维表,单元格了解 主要了解单元格周围的小图标 鼠标放在单元格边框上可以拖动单元格,放在右下角可以向上/下或者左/右复制单元格,放右下角按住CTRL可以实现数值累加,放在右下角按住SHIFT可以插入、删除单元格。,数据录入技巧,数据录入批量录入相同数据(ctrl+enter)身份证号码输入(设置单元格属性为“文本”或者前面加)分数输入(直接输1/3EXCEL默认为1月3日,应该写成0空格1/3)单元格里回车(alt+enter)查找*和?(+*,+?),数据录入技巧,查找模糊查找按CTRL+F进入查找,在查找里直接输查找内容为模糊查找。精确查找在查找里点开选项,将单元格匹配的勾打上为精确查找值查找在查找里点开选项,查找范围选择值为值查找。(如果单元格里是公式那必须用值查找),数据录入技巧,EXCEL快捷键操作,工作簿操作,EXCEL快捷键操作,基本操作,EXCEL快捷键操作,单元格操作1,EXCEL快捷键操作,单元格操作2,EXCEL快捷键操作,输入操作,数据清洗 数据清洗就是将多余、重复的数据筛选清除,将缺失的数据补充完整,将错误的数据纠正或删除。数据加工 对原有字段进行抽取、计算或者转换,形成我们需要的新数据列。数据抽样 从调查对象总体中按照随机原则(RAND函数)选取一部分对象作为样本进行调查分析,以此推论总体状况。,三、数据处理,常用功能冻结窗口筛选分列下拉菜单制作格式刷使用,数据处理技巧,重复数据处理 重复数据的定位与删除处理缺失数据 缺失数据的定位与处理检查数据逻辑错误 可以接受的数据缺失标准是10%以下,数据清洗,重复数据的定位用计数函数来识别重复数据用菜单操作筛选重复数据用条件格式标识重复数据用多种方法删除重复数据用菜单操作删除重复项通过排序删除重复项通过筛选删除重复项,重复数据处理,缺失值的处理方法用一个样本的统计量的值(如平均值)代替用一个统计模型计算出来的值代替将有缺失值的记录删除保留有缺失值的个案,在相应的分析中排除处理缺失数据的操作定位输入查找替换,处理缺失数据,利用IF函数检查错误 嵌套函数利用条件格式标记错误在公式中查错 分步查看公式计算值,检查数据逻辑错误,检查数据逻辑错误,数据抽取 字段分列、字段合并、字段匹配数据计算 简单计算、函数计算数据分组数据转换 数据表的行列互换,数据加工,数据分析方法论数据分析方法数据分析工具,四、数据分析,数据分析方法论,数据分析简单方法,综合评价分析法,数据分析综合方法,数据标准化标准值=(原始值-min)/(max-min)权重确定法(客观、主观)目标优化矩阵纵向指标比横向重要时,输入1,否则为0,漏斗分析法,数据分析综合方法,64.2%,70.21%,55.82%,20.15%,矩阵关联分析法1,数据分析综合方法,可分为静态矩阵和发展矩阵,高,低,高,满意度,重要性,矩阵关联分析法2,数据分析综合方法,可分为二维矩阵和三维矩阵,高,低,高,满意度,重要性,气泡大小表示修改难度,数据透视表函数,数据分析工具,EXCEL函数,什么是函数 Excel函数即是预先定义,执行计算、分析等处理数据任务的特殊公式。以常用的求和函数SUM为例,它的语法是“SUM(number1,number2,.)”。其中“SUM”称为函数名称,一个函数只有唯一的一个名称,它决定了函数的功能和用途。函数名称后紧跟左括号,接着是用逗号分隔的称为参数的内容,最后用一个右括号表示函数结束。什么是公式 函数与公式既有区别又互相联系。如果说前者是Excel预先定义好的特殊公式,后者就是由用户自行设计对工作表进行计算和处理的公式。以公式“=SUM(E1:H1)*A1+26”为例,它要以等号“=”开始,其内部可以包括函数、引用、运算符和常量。上式中的“SUM(E1:H1)”是函数,“A1”则是对单元格A1的引用(使用其中存储的数据),“26”则是常量,“*”和“+”则是算术运算符。,EXCEL函数,公式中的运算符 算术运算符,EXCEL函数,公式中的运算符2.文本运算符“&”号,可以将文本连接起来.3.比较运算符,EXCEL函数,公式中的运算符4.引用运算符,例:A4=B4+C4+C4+E4+F4,可写为:A4=SUM(B4:F4),EXCEL函数,公式中的运算顺序 如果在公式中要同时使用多个运算符,则应该了解运算符的优先级.算术运算符的优先级是先乘幂运算,再乘、除运算,最后为加、减运算。相同优先级的运算符按从左到右的次序进行运算。公式中出现不同类型的运算符混用时,运算次序是:引用运算符算术运算符文本运算符。如果需要改变次序,可将先要计算的部分括上圆括号。,EXCEL函数,基础概念逻辑值:true表示真,false是假。基础概念引用 1.认识工作表区域 EXCEL共有16384列,1048576行。2.单元格引用方式(下+F4引用间切换)相对应用 A1、B1 绝对引用$A$5、$C$3 混合引用$A5、C$3 3.单元格引用分类 一维引用 A1:A10,A1:F1 二维引用 A1:C10 三位引用 sheet1:sheet3!A1,EXCEL函数,函数的易失性 易失性函数最最简单的理解就是不论表格中的数据或者是公式中的参数、引用的数据区域是否有更新动作,易失性函数都会进行重算。过多的使用会影响用户的操作响应速度。易失性函数:INDEX函数和SUMIF函数特殊的“易失性”,函数的常见错误,EXCEL函数,常用函数 SUM,MAX,MIN,AVERAGE,COUNT/COUNTA,ROUND/ROUNDUP/ROUNDDOWN,LEN,LEFT,RIGHT,MID,SUBSTITUTE,VLOOKUP,IF,SUMIF,COUNTIF,INDEX,MATCH OR,AND,ROW,COLUMN,PHONETIC,EXCEL函数,SUM用途:返回某一单元格区域中所有数字之和。语法:SUM(number1,number2,.)。参数:Number1,number2,.为1到N个需要求和的数值。,EXCEL函数,MAX用途:返回数据集中的最大数值。语法:MAX(number1,number2,.)参数:Number1,number2,.是需要找出最大数值的1至N个数值。用法举例:如果A1=71、A2=83、A3=76、A4=49、A5=92、A6=88、A7=96,则公式“=MAX(A1:A7)”返回96。,EXCEL函数,AVERAGE用途:返回参数的平均值(算术平均值)。语法:AVERAGE(number1,number2,.)参数:Number1,number2,.为需要计算平均值的 1 到 N个参数。用法举例:A1为10,A2为12,A3为14,A4为12,则AVERAGE(A1:A4)=12,EXCEL函数,COUNT/COUNTA/COUNTIFCOUNT用途:返回包含数字以及包含参数列表中的数字的单元格的个数。语法:COUNT(value1,value2,.)参数:Value1,value2,.为包含或引用各种类型数据的参数(1 到 N个),但 只有数字类型的数据才被计算。函数 COUNT 在计数时,将把数字、日期、或以文本代表的数字计算在内;但是错误值或其他无法转换成数字的文字将被忽略。如果要统计逻辑值、文字或错误值,请使用函数 COUNTA。COUNTA:返回参数列表中非空值的单元格个数 COUNTBLANK:算指定单元格区域中空白单元格的个数。,EXCEL函数,ROUND/ROUNDUP/ROUNDDOWN用途:返回某个数字按指定位数取整后的数字。语法:ROUND(number,num_digits)参数:Number为需要进行四舍五入的数字。Num_digits为指定的位数,按此位数进行四舍五入。ROUNDUP不做四舍五入的向上取整ROUNDDOWN不做四舍五入的向下取整,EXCEL函数,LEN 用途:返回单元格字符数语法:LEN(text)参数:text是要查找其长度的文本。空格将作为字符进行计数。用法举例:A1单元格为”AFE”,LEN(A1)=3,EXCEL函数,LEFT/RIGHT用途:基于所指定的字符数返回文本字符串中的左边第一个或前几个字符 语法:LEFT(text,num_chars)参数:Text是包含要提取字符的文本字符串。Num_chars指定要由 LEFT 所提取的字符数。RIGHT为取右用法举例:left(“ad246g”,3)=ad2、RIGHT(“ad246g”,3)=46g left(D2,LEN(D2)-5),EXCEL函数,MID用途:回文本字符串中从指定位置开始的特定数目的字符 语法:MID(text,start_num,num_chars)参数:Text是包含要提取字符的文本字符串。Start_num是文本中要提取的第一个字符的位置。文本中第一个字符的 start_num 为 1,以此类推。Num_chars指定希望 MID 从文本中返回字符的个数。用法举例:MID(FS124,2,2)=S1,EXCEL函数,SUBSTITUTE用途:在文本字符串中用 new_text 替代 old_text。语法:SUBSTITUTE(text,old_text,new_text,instance_num)参数:Text为需要替换其中字符的文本,或对含有文本的单元格的引用。Old_text为需要替换的旧文本。New_text用于替换 old_text 的文本。Instance_num为一数值,用来指定以 new_text 替换第几次出现的 old_text。如果指定了 instance_num,则只有满足要求的 old_text 被替换;否则将用 new_text 替换 Text 中出现的所有 old_text。,EXCEL函数,VLOOKUP用途:在表格或数值数组的首列查找指定的数值,并由此返回表格或数组当前行中指定列处的数值。语法:VLOOKUP(查找值,数据表,序列号,匹配条件)匹配条件:0表示精确查找,1表示近视查找。,EXCEL函数,IF用途:经过对错判断,返回不同的值。语法:IF(logical_test,value_if_ture,value_if_false)参数:logical_test表示计算结果为TRUE或FALSE的任意值或表达式,满足条件返回value_if_ture,否则value_if_false用法举例:A1为3,IF(A10,1,0)返回结果为1.,EXCEL函数,SUMIF用途:根据指定条件对若干单元格、区域或引用求和。语法:SUMIF(range,criteria,sum_range)参数:Range为用于条件判断的单元格区域,Criteria是由数字、逻辑表达式等组成的判定条件,Sum_range为需要求和的单元格、区域或引用(当省略第三个参数时,则条件区域就是实际求和区域)。COUNTIF用途:统计某一区域中符合条件的单元格数目。语法:COUNTIF(range,criteria)参数:range为需要统计的符合条件的单元格数目的区域;Criteria为参与计算的单元格条件,其形式可以为数字、表达式或文本。其中数字可以直接写入,表达式和文本必须加引号。,图表文字表格也疯狂图表的选择图表制作五步法给图表换装别让图表犯错图表的美化,五、数据展现,突出显示单元格项目选取数据条图标集色阶迷你图,表格也疯狂,图表的选择,图表制作五步法,确定所要表达的主题或目的确定哪种图表最适合你的目的选择数据制作图表检查是否真实有效地展示数据检查是否表达了你的观点,平均线图,给图表换装,双坐标图,给图表换装,瀑布图,给图表换装,旋风图,给图表换装,矩阵图,给图表换装,漏斗图,给图表换装,让图表“五脏俱全”标题、图例、单位、脚注要注意的条条框框图表会说谎,别让图表犯错,让图表“五脏俱全”,2010年XX公司产品销售情况,(单位:百万元),*第三季度品牌A的产品包装发现有毒物质*资料来源:XX调研公司,V.S,注脚:便于读者理解资料来源:增强数据可信度,要注意的条条框框,避免生出无意义的图表不要往图表里塞太多信息只选对的,不选复杂的一句话标题不要使用倾斜的标签折线图的线条一般不超过5条,饼图制作原则,一些简单的原则:尽量不要用3D效果,如果要用尽量薄一些饼图的结构中,最多包含5种数据(超过则改用复合饼图)标注写在图中,不要标记在一边边界线使用白色,突出边缘感不要使用爆炸式“饼图分离”(强调某片扇区可单独分离),图表会说谎,虚张声势的增长或虚假的稳定 纵坐标轴的正确设定3D效果的伪装逆序排列的误导,图表美化的三个原则:简约整洁突出重点,图表的美化,图表美化的技巧:学会“做减法”找出隐形的线图表的数字格式如何突出对比合理使用颜色,图表的美化,数据分析报告的写作原则 规范性、重要性、谨慎性、创新性数据分析报告的作用 展示分析结果、验证分析质量、提供决策依据数据分析报告的种类数据分析报告的结构撰写报告时的注意事项,六、撰写报告,专题分析报告 内容单一、深入分析综合分析报告 全面性、联系性日常数据通报 进度性、规范性、时效性,数据分析报告的种类,写报告常用软件,最经典的结构:总-分-总标题页 直接、确切、简洁目录前言 分析背景、分析目的、分析思路正文结论与建议附录,数据分析报告的结构,结构合理,逻辑清晰实事求是,反映真相用词准确,避免含糊篇幅适宜,简洁有效结合业务,分析合理,撰写报告时的注意事项,交流与分享,吾听吾忘吾见吾记吾做吾悟谢谢!,