《数据分析教程》PPT课件.ppt
2023/7/16,数据分析课程,1,南晟德管理顾问公司,数据分析课程,2023/7/16,数据分析课程,2,课程介绍,了解ISO9000:2000对数据分析的要求了解数据的分类及相关术语 主要掌握数据分析的方法(QC七手法)介绍ISO9000涉及的常用统计方法,2023/7/16,数据分析课程,3,ISO9001:2000对数据分析的要求,8.4数据分析 组织应确定、收集和分析适当数据,以证实质量管理体系的适宜性和有效性,并评价在何处可以进行质量管理体系的持续改进。这应包括来自监视和测量的结果以及其他有关来源的数据。数据分析,应提供以下方面的信息:a)客户满意;(见)b)与产品要求的符合性;(见7.2.1)c)过程和产品的特性及趋势,包括采取预防措施的机会;(涉及 条款8.2.3/8.2.4/8.5.3)d)供方。(涉及条款7.4)其它相关条款:质量目标 内部审核等,2023/7/16,数据分析课程,4,数据的分类,数字数据计量值数据:可连续取值的数据(如长度、电流等描述质量特性的数据)计数值数据:只能间断取值的数据(如件数、缺陷数等数据),由此计算所得的如合格率也属于计数值数据,所以计数值数据又可分为:,2023/7/16,数据分析课程,5,相关术语,记录:阐明所取得的结果或提供所完成活动的证据的文件。客观证据:支持事物存在或其真实性的数据。信息:有意义的数据。数据信息 相当 材料成品 只有数据经过加工处理成可利用的有效信息,数据才体现价值。,2023/7/16,数据分析课程,6,七工具的概述,1.1品质管制演变及七工具的出现古代:(石器-品管先端、古埃及坟墓上浮雕图像 约1450B.C)近代:(1787-完全相同产品、1840单侧规格、1870-双侧规格、不合格概念、检验实务与随机抽样的应用)1900年前:操作者的品质管制 1900:领班的品质管制(品质是检查出来的)1920:检验员的品质管制1940:统计品质管制(品质是制造出来的)1950:品质保证(品质是设计出来的)1960:全面品质保证/TQC(品质是习惯出来的、QCC、QIT)1980:全面品质管制/TQM(品质是经营管理出来的、顾客导向、方针、目标管理、流程管理、PQCDSM)在上述第六阶段的进化过程中,就产生了大量的(非全部)统计手法及品质管制手法,QC七工具也就相继产生(1897年产生柏拉图),2023/7/16,数据分析课程,7,七工具的概述,2023/7/16,数据分析课程,8,七工具的概述七工具使用情形简析,2023/7/16,数据分析课程,9,2 检查表,2.1 定义使用简单明了的表格或图形,相关人员填入规定之检查记录,再加以统计,提供量化分析或对比检查用途的表格或图形2.2示例:某五金零件不良检查表(见下页)内部质量审核检查表,某五金零件不良检查表,2023/7/16,数据分析课程,11,2 检查表,2.3 分类点检用检查表(5S活动检查表、内审检查表)记录用检查表(不良项目检查表)2.4 制作及记载时注意事项5W1H原则(目的、对象、何人、何时、何处、方法)格式(图形或表格)及记录方法(正、)结果之整理:合计、平均、统计分析传递途径:谁需要了解?要报告给谁),2023/7/16,数据分析课程,12,2 检查表,2.5制作方法列出需点检之项目或需要收集的数据决定检查表的格式(注意项目顺序及层别)决定记录的方式决定检查的方法(谁检查、多久检查、检查方法)按上述各项绘制检查表,2023/7/16,数据分析课程,13,2 检查表,26 应用时注意事项数据之收集应注意样本取得之随机性与代表性事实现物的观察要细心、客观,数据要准确尽快将结果呈报您要报告的人,使相关人员也知道检查完成后,可利用柏拉图加以整理,以便掌握问题重点,2023/7/16,数据分析课程,14,3 柏拉图,3.1定义根据所搜集的数据,按不良原因,不良状况,不良项目等不同区分标准加以整理、分类、藉以寻求占最大比率之原因、状况或位置。按其大小顺序排列,再加以累积值的图形,又叫ABC图,亦称重点图或排列图有人又叫“8020”图,2023/7/16,数据分析课程,15,3 柏拉图,3.2制作步骤及方法决定数据的分类项目,如不良项目别、材料别、方式别、人、设备别,项目以不超过4-6项为原则决定数据搜集的期间(一天、一月等)并按分类的项目,在期间内收集数据依分类项目别,做数据整理,并作成统计表(数据按大小顺序排列,并求出不良率及累计影响度,其它项不可大于前三项,不然应再细分)。记入图表中并依数据大小排列画出柱状图(纵轴左侧表示不良率,右侧表示累计影响度,横轴不宜长于纵轴,纵横轴之间距均应一致)。柏拉图应用指引.doc,2023/7/16,数据分析课程,16,3 柏拉图 3.3示例,2023/7/16,数据分析课程,17,3 柏拉图,3.3柏拉图的用途不要企图“一口吃成大胖子”把握重要要因或问题重点的有效工具以收事半功倍效果。了解各项目对问题的影响度占百分比。可明确重点改善项目是什么,大小顺序的内容是什么,占大多数的项目又是什么。订定改善目标的参考。可发掘现场之重要问题点。,2023/7/16,数据分析课程,18,3 柏拉图,3.4案例某印刷厂五月份报废统计如下:(单位:公斤)起线:220材料不良:78大小边:67走位:40尺寸超差:55贴合不良:30贴反:10请制作柏拉图,并列出主要改善的不良点,2023/7/16,数据分析课程,19,3 柏拉图,3.5应用注意事项横轴依大小顺序柏拉,其他项最末位。横轴各柱形距离要相同。纵轴的最高尺度含盖合计数且隔距应一致。累积折线依正确画法。柏拉图需标示累积百分比。勿将两个以上角度混杂一起分类。一般把欲优先解决之项目标示出(累积百分比占7080%之项目)。柏拉图A项若难采取措施,则从B项开始,顺位虽低,但易改善,亦可采取措施。,2023/7/16,数据分析课程,20,4.特性要因图,4.1定义将结果(特性)与原因(要因)之间的关系及原因影响结果的情形表示出来的图形,因其形状象鱼骨,故又称鱼骨图,亦称石川图.,2023/7/16,数据分析课程,21,4.特性要因图,4.2制作步骤及方法决定特性(品质、成本等)并将其写在右边,再自左划上粗横线,在现场划时可用色笔划在一大张白纸上。列出大要因(可依4M1E来分类)并用圈起来,加箭头,以60的倾斜度插到粗横线上。各要因分别再记入中小要因(细分至能采取措施之小要因,没有小骨的鱼骨图是不行的)根据过去之数据资料或投票方式圈4-6项重要要因。,2023/7/16,数据分析课程,22,4.特性要因图,4.3示例,特性,中原因,小原因,大原因,中原因,细小原因,2023/7/16,数据分析课程,23,4.特性要因图,4.4制图之注意事项集合全员之知识与经验(召集现场主管,技术人员、前后制程人员等,以自由,无拘束的方式发言,依脑力激荡法之原则进行应用5W1H及4M1E法,把重点放在解诀问题上。将计量之要因(温度、速度、压力)与计数之要因(机械别、人别)分开;使管理责任明确,依部门别分类,按特性别,绘制各别的特性要因图要因依其重要度不同,加上相应颜色表示,如红色,红色愈多表示愈重要,2023/7/16,数据分析课程,24,4.特性要因图,4.5案例以近期出现的一单客户投诉做分析,2023/7/16,数据分析课程,25,5.散布图,5.1定义 将两种相对应的数据先划好纵横尺度,点绘其测定值而得之图.,2023/7/16,数据分析课程,26,5.散布图,5.2制作方法搜集50-100组两相关数据整理在数据表上.在横轴及纵轴标上尺度(横轴愈向右其什愈大,纵轴愈向上其值愈大)肥数据点到期坐标上(二点重复时,画上二重圆号,三点重复时,画上三重圆号.,2023/7/16,数据分析课程,27,5.散布图,5.3散布图类型具强烈的正相关关系具微弱的正相关关系具无相关具强烈负相关关系具微弱负相关关系具曲线相关关系,2023/7/16,数据分析课程,28,5.散布图5.1案例据以下数据绘制一散布图,并确认其是否相关X=强度 Y=膜厚,2023/7/16,数据分析课程,29,案例:,调查30名员工,食堂伙食对生产量之间的关系。调查10000名深圳特区打工者,分析年龄与收入的关系。,请划出体重与身高之间的散布图,2023/7/16,数据分析课程,31,定义:直方图是将所收集的测定值、特 性值或结果值,分为几个相等的区间作为横轴,并将各区间内所测定值依所出现的次数累积而成的面积,用柱子排起来的图形。,6.直 方 图,2023/7/16,数据分析课程,32,能达成的目标,了解过程输出的变异情况,显示数据波动的形态(分布状况);了解过程能力;决定在何处集中力量进行改进。,2023/7/16,数据分析课程,33,案例:,以下是A公司一个月以来开足工每天生产的产品数量(单位:K):20、22、24、26、28、30、28、24、30、34、36、21、25、27、24、26、31、28、26、27、24、26、28、30、21、25、27、26、28、30。业务员拿一张订单找到您,客户订货60K,2天要求交货,如不交则每天扣款5%,请问接还是不接。,2023/7/16,数据分析课程,34,制作步骤(1),收据数据定组数(N)找出最大值(L)、最小值(S)、并计算全距(R),R=L-S定组距(C)=R/N定组界最小一组的下组界T11=S-测量值的最小位数*0.5最小一组的上组界T12=T11+C第二组的下组界 T21=T12,以此类推,2023/7/16,数据分析课程,35,制作步骤(2),决定每组的中心点=(上组界+下组界)/2制作次数分布表制作直方图填上次数、规格、平均数计算平均数算数平均数(X)计算标准差()计算样本标准差(s)观察,2023/7/16,数据分析课程,36,组数对照表,2023/7/16,数据分析课程,37,案例,138,131,140,145,135,137,例:某厂之成品尺寸规格为130至160mm,今按随机抽样方式抽取60个当样本,其测定值如附表,试制作直方图。,138,131,140,145,135,137,135,137,140,145,131,138,2023/7/16,数据分析课程,38,直方图,120.5,124.5,128.5,132.5,136.5,140.5,144.5,148.5,20,SL=130,Su=160,15,10,5,n=60X=135.8=4.87s=n-1=4.91,2023/7/16,数据分析课程,39,可能出现的图形,正常型说明:中间高,两边低,有集中趋势。结论:左右对称分配(常态分配),显示制程在正常运转下。,2023/7/16,数据分析课程,40,缺齿型(凹凸不平型),说明:高低不一,有缺齿情形。不正常分配,系因测定值或换算方法有偏差,次数分配不妥当所形成。结论:稽查员对测定值有偏好现象,如对5,10之数字偏好;或是假造数据。测量仪器不精密或组数的宽度不是倍数时,亦会有此情况。,2023/7/16,数据分析课程,41,切边型(断列型),说明:有一端被切断。结论:原因为数据经过全检过,或制程本身有经过全检过,会出现的形状。若剔除某规格以上时,则切边在靠近右边形成。,2023/7/16,数据分析课程,42,离岛型,说明:在右端或左端形成小岛。结论:测定有错误,工程调节错误或使用不同原料所引起,不熟练员工的临时替班等。一定有异常原因存在,只要去除,即可合乎制程要求,制出合规格的制品。,2023/7/16,数据分析课程,43,高原型,说明:形状似高原状结论:是由于生产过程中某种因素在缓慢的起作用造成的,如刃具的磨损、操作者逐渐疲劳使质量特性数据的中心值缓慢的移动造成的。,2023/7/16,数据分析课程,44,双峰型,说明:有两个高峰出现结论:有两种分配相混合,便如两部机器或两家不同供应商,会出现此种形状,因测定值受不同的原因影响,应予层别后再作直方图。,2023/7/16,数据分析课程,45,偏态型(偏态分配),说 明:高处偏向一边,另一边低,拖长尾 巴。可分偏右型、偏左型。结论:产品加工能力发生偏差,或者是某些加工习惯造成的。,2023/7/16,数据分析课程,46,直方图之使用注意事项,异常值应去除后再分组。对於从样本测定值推测群体形态,直方图是最简单有效的方法。应取得详细之数据资料(例如:时间、原料、测定者、设备、环境条件等)。进行制程管理及分析改善时,可利用层别方法,将更容易找出的问题的症结点,对於品质的改善,有事半功倍的效果。,2023/7/16,数据分析课程,47,直方图与规格比较,制程呈常态分配,且在规格界限内,显示制程良好,品质均匀合格。,规 格,2023/7/16,数据分析课程,48,平均值偏低,部分产品超规格下限有不良发生,但分配正常(常态)。对策:应调平均值(往右),规 格,2023/7/16,数据分析课程,49,平均值偏高,部分产品超规格上限有不良发生,但分配正常(常态)对策:应调平均值(往左),规 格,2023/7/16,数据分析课程,50,7层别法,定义:从某角度针对调查事项分类(分层),并收集各类资料(数据)进行相互比较为什么需要分层如何分层,2023/7/16,数据分析课程,51,案例,一个班4名同学期末考试分别如下:张友 总分230,乐理70、唱功90、舞蹈70刘华 总分220,舞蹈80、乐理70、唱功60李明 总分195,唱功55、舞蹈75、乐理65郭成 总分220,舞蹈95、乐理65、唱功60如果您是他们班主任,请分析以上成绩,以制订下学期教学计划,2023/7/16,数据分析课程,52,分层的必要性,弥补经验判断的不足从杂乱无章的数据获得信息找到目标,2023/7/16,数据分析课程,53,使用分层的时机,在研制、开发新产品时在收集到有关某一特定主题的观点、意见或想法等信息之后。在面对一大堆看似混乱复杂的现象,数据或事物之时由于归纳头脑风暴法所产生的管理在编制调查表在整理归纳数据之时在提出质量改进措施时,2023/7/16,数据分析课程,54,如何分层,总经理打电话把品质部张经理叫到办公室,将本月客户退货统计丢在其面前说:“退货率5%,超过目标3%,请立即拿出解决的方案出来,如果下个月没有改善,你自己看着办。”各位同学帮张经理一把,接下来应怎么办?,2023/7/16,数据分析课程,55,分层的角度,作业员:不同班组机器:不同机器原料作业条件:温度、压力、湿度产品 不良与错误状况:不良项目、错误项目、发生位置、发生地点。时间日、上、下午、改善前后、正常与加班。,2023/7/16,数据分析课程,56,分层时注意事项,分层角度的选择依目的并配合专业知识考虑。分层分类需符合互斥原则。分层时勿需将两个以上角度混杂分类。尽量将分层观念溶进其他手法 分层后应进行比较(或检定)各作业条件是否有差异。,2023/7/16,数据分析课程,57,8控制图,定义:用于区分质量波动是偶然原因引起的还是系统引起的,判断生产过程是否处于稳定状态,并画有控制界限的一种图。,2023/7/16,数据分析课程,58,控制图类型,计量值控制图计数值控制图,2023/7/16,数据分析课程,59,计量值控制图,X控制图(也叫单值控制)X-R控制图(平均值,极差控制图)X-R控制图(中位值,相关控制图)X-Rs控制图(单值,移动极差控制图),2023/7/16,数据分析课程,60,计数值控制图,P控制图(不合格率控制图)Pn控制图(不合格品数控制图)C控制图(缺陷数控制图)控制图(单位缺陷数控制图),2023/7/16,数据分析课程,61,控制图的作用(1),对判断生产过程是否异常,而使过程达到控制状态及时发现生产过程中的异常现象和缓慢变异,预防不合格品发生;能有效地分析判断生产过程工序质量的稳定性,降低检验、测试费用;可查明设备和工艺手段的实际精度,以便作出正确的技术决定;,2023/7/16,数据分析课程,62,控制图的作用(2),真正地制定工序目标和规格界限提供依据;工序的成本和质量成为可预测;最终可以保证产品质量提高经济效益。,2023/7/16,数据分析课程,63,X-R平均值与全距控制图,收集数据约100个依测定时间或群体进行区分排列对数据进行分组,2-6个数据分为一组组内数据以n表示组数以K表示机入数据表计算每组平均值X计算每组全距R计算总平均值X计算全距平均R,2023/7/16,数据分析课程,64,X计算管制界限CL=XUCL=X+A2RLCL=X-A2RA2可查表,R控制图的控制界限计算方法:CL=RUCL=D4RLCL=D3RD3、D4可查表,2023/7/16,数据分析课程,65,X-R系数表,2023/7/16,数据分析课程,66,X-R控制图,X,UCL,CL,LCL,R,UCL,CL,2023/7/16,数据分析课程,67,P不良率管制图,收集近期内的产品,分组算出不良率P=Pn/n=不良个数/检查数计算平均不良率P=总不良数/总检查数计算管制线中心线CL=P上管制线UCL=P+3P(1-P)/n下管制线LCL=P-3 P(1-P)/n,2023/7/16,数据分析课程,68,控制图的观测,连续25个点在控制界限内,35点不多于1点在界限之外,100点不多于2点在界限之外连续至少7点在一侧连续11点中至少有10在一侧连续14点中至少有12在一侧连续17点中至少有14点在一侧连续20点中至少有15点在一侧连续至少7点连续上升点的排列成周期状连续3点有2点或连续7点至少有3点落在2倍标准差之外,2023/7/16,数据分析课程,69,例:请判断是否异常,