欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    商务智能应用分析型CRM课件.ppt

    • 资源ID:3003919       资源大小:408KB        全文页数:70页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    商务智能应用分析型CRM课件.ppt

    第2章 商务智能应用-分析型CRM,企业在扩大市场、提高效率和保持客户的原始商业驱动力不变的情况下,如何继续保持竞争的优势。有远见的公司都会意识到,只有将自己建成能够对客户作出迅速反应的公司才能获得诸多收获,这些收获包括收入、新客户、客户满意度、客户回头率以及公司效益的增加,从而使竞争力大为提升。,本章内容:,CRM概述CRM与商务智能客户行为分析客户分类案例分析,CRM概述,建立客户关系管理(CRM)系统的目的是赋予企业更完善的与客户交流的能力,即从潜在客户识别、生成有需求的客户,到销售完结以及不断进行的服务和支持,提供全过程的自动化处理和更好的协调与合作,以提高客户满意度和客户忠实度,增加市场机会和销售利润,为企业发展服务。,操作型CRM的设计目的是为了让业务人员在日常的工作中能够共享客户资源,减少信息流动滞留点。通过市场营销、销售和服务等业务流程的管理,将客户的各种信息收集并整合在一起,再将这些运营数据和外来的市场数据经过整合和变换,装载进DW。协作型CRM就是能够让企业客户服务人员同客户一起完成某项活动。协作型应用目前主要由呼叫中心、客户多渠道联络中心、帮助台以及自助服务帮助导航,向客户解释特定内容的网页等。,分析型CRM事实上是以改善业务管理为目的的分析活动,主要是分析现有的历史数据或者操作型CRM中获得的各种数据,进而为企业的经营、决策提供可靠的量化的依据。在一家银行的信用卡客户中,可能有80%的人几乎不用信用卡交易,有10%的客户偶尔用卡交易,剩下10%的客户会频繁用卡交易,而这一部分客户可能为银行信用卡部带来80%的收入,所以这10%自然是最有价值的客户。利用分析型CRM系统对客户进行细分,就可以针对有价值的客户开展特别的促销活动、提供更个性化的服务,这无疑将使企业以最小的投入获得最大的回报。,商务智能与CRM,如果说操作型与协作型CRM是企业的臂膀,那么分析型CRM就是企业的大脑。数据整合提供客户全景视图 利用数据仓库技术,可以将散落在各个业务数据库中的客户信息经过ETL(抽取、转换、加载)过程,清洗、转化、连接、概括、集成为统一的分析数据;同时,数据仓库强大的数据存储及管理能力可以对海量客户数据有效的存储、索引、归类。,信息提交过程 企业信息系统最终的关注点在于信息的传递,实现从数据到信息的深层次转化。(1)OLAP的多维立方体模型为用户提供多维的分析视图,通过钻取、旋转、切片(块)等操作,使得用户可以随心所欲地对客户数据进行多维分析,获取关于客户的细分市场、购买模式、盈利能力等重要信息。(2)通过简单易用的工具使得终端用户可以自由的按照自己的意图来操纵数据,从而为自己的业务问题提供信息支持。(3)利用企业信息门户策略可以根据不同的用户定制信息界面,从而保证信息在适当的时间、通过适当的手段、传递到适当的人手中。,客户知识的深入挖掘(1)根据从客户知识发掘的信息,计算客户生命周期价值,以此作为客户分类的依据。针对不同类别的客户采取不同的措施;(2)预测客户将来一段时期的需求;(3)预测客户流失的可能性,或者采取及时的补救措施,或者做出减少不必要的投资等决策,最大限度地保留客户和降低企业的损失;(4)测评客户忠诚度,识别忠诚客户。客户知识的展现通过商务智能技术所获得的客户知识(特征、忠诚度、盈利能力、行为模式)必须通过操作和协作型CRM系统才能最终实现为客户提供更好服务的目标,从而形成业务行动的闭环,真正发挥CRM的各层次的综合效应。,客户智能系统结构图,构建一个完整的智能CRM系统的几个步骤:1整合客户信息资源 对于那些以前没有应用过任何CRM系统的企业来说,首先需要把孤立的业务系统整合到一个统一的平台之下,解决“信息孤岛”。而对于己有CRM系统的企业,则需要建立一个企业信息门户,使客户和企业能在一个统一的界面下进行数据和信息交换,从而保证客户数据的一致性。2.建立客户数据仓库 规划数据仓库,以企业的业务模型为基础,确定需要建立能够描述主要业务主题的数据模型;设计数据仓库,根据逻辑模型和性能要求进行物理模型的设计,制定数据存储策略以及各种商业规则等;,(3)构造数据分析模型 根据企业需要分析的对象和目标,构造有针对性的分析模型。针对客户对企业的贡献差异,构造客户盈利能力分析模型;针对客户对企业信用程度的不同,构造客户信用分析模型;根据客户对产品功能的需求不同,构造客户分类分析模型;根据客户的获得、流失情况,构造客户获取流失分析模型等等。(4)建立客户知识管理系统 建立一个动态的客户知识库以及制定客户知识的分发规则和保存机制。与客户数据仓库一样,客户知识管理系统也不是一开始就能建立好的,它需要在使用的过程中进行不断地调整和完善,是一个动态完成的系统。,客户行为分析(获取新客户、客户流失与保持分析、客户盈利能力分析),获取新客户获取新客户就是“说服”原本不是你的客户的消费者成为你的客户。这些消费者可能是对你的产品/服务不了解的顾客,也可能是你的产品/服务的潜在消费者,还可能是你竞争对手的客户。针对这些不同的消费者需要采用不同的策略才能有效的获取到新客户。另外,在获取新客户之前,不得不确定哪些消费者是值得努力的,预测不同客户对营销努力的反映情况也是提高获取新客户成功率的一个前提。还有,客户分优劣,有些客户获得时付出的努力要比他们成为公司客户后贡献的利润低,这样的客户还是不获得为好。,因此,企业要想通过CRM有效获得新客户,必须明确不同客户的特性。目标市场在哪里?哪些客户是企业的潜在客户?哪些潜在客户是优质客户?客户获取的难易程度如何?常用的数据挖掘技术和方法有分类与预测、聚类、关联分析和异类分析等。例如用关联的方法,通过发现诸如“在购买A商品后,一段时间里顾客会接着购买商品B,而后购买商品C”这样的知识,来形成“A-B-C”客户行为模式。还可以对现有客户特征进行聚类分析,建立客户特征模型,以最有效地预测目标市场和发现潜在客户。,K-近邻分类方法,基本思想:K近邻分类是基于类比学习的,每个样本代表d维空间的一个点。当给定一个未知样本时,K-近邻分类法将搜索样本空间,找出最接近未知样本的K个训练样本,这K个训练样本是未知样本的K个“近邻”。近邻性一般用欧几里德距离定义:或采用绝对值距离:缺点:计算量大 优点:适合各种数据类型的数据,利用K近邻方法进行潜在客户预测,考察的客户自身属性:企业总资产值、年销售收入、距电器销售公司的地理距离及企业所处地域的经济发达程度。客户的消费属性为过去一年内对电器销售公司的总购买额。1.数据处理:销售公司 把客户的消费属性分为10万元以下、10万至100万、100万500万、500万以上四个区间,分别取值1,2,3,4;把企业所处地域的经济发达程度根据实际情况分为贫困、欠发达、发达、极发达四档,分别取值1,2,3,4;其余客户属性(企业总资产值、年销售收入、距销售公司的地理距离)也通过区间划分完成量化及归一化处理。表1是经过标准化处理的老客户数据,表2是经过标准化处理的潜在客户数据。,表1老客户数据,表2潜在客户数据,2.预测为了预测客户A对公司电器产品的年购买额,我们只须从处理后的老客户数据中找到K个最近邻(这里设定K=2)。例如:A与客户1的距离:D(A,l)=(1.5-1)+(2.4-1.6)+(1.6-1.2)+(0.4-0.4)=1.7,同理计算可得到:D(A,2)=1.9,D(A,3)=3,D(A,4)=2.9,D(A,5)=1.6,D(A,6)=2.5可以看出,A的2个最近邻为老客户1和5,可以预测其对公司电器产品的年购买额将在10万和100万之间,我们还可以从处理之前的老客户数据库中得到客户1和5的实际年购买额,以对A的年购买额进行更精确的预计,假设销售公司规定年总购买额在500万以上的是公司的重点客户,那么我们可以进一步预测潜在客户的类别,从而可以指定精确的营销计划,来获取客户。,将数据挖掘应用于客户的获取活动与传统的市场营销策略比较其优势在哪里?下面我们通过一个例子进行详细的说明。某大银行A进行直邮的市场营销活动以获取信用卡客户,向100万名潜在客户提供信用卡的申请表。使用传统的做法,A银行向这100万名潜在客户寄出信用卡申请表,共有6%的邮件得到申请回应。得到这些潜在客户的回应后,需根据信用风险程度对它们的申请进行筛选,毫无疑问,往往是信用差的潜在客户更可能申请信用卡,所以最终筛选后的结果只有16%的回应者是符合信用要求的,即大约占总潜在客户的1%(6%16%1%)成为最终客户。A银行邮寄一份申请表需花费¥1的费用,每个客户在随后的两年将为银行带来¥125的利润。那么用传统方法营销得到的净回报:¥250,00 0(¥12510,000-¥11,000,000=Y250,0 00),数据挖掘技术的应用 首先,A银行寄出50,000份进行测试,并对反馈的结果进行分析,将这些数据作为训练数据应用数据挖掘算法建立预测模型,包括潜在客户的回应的模型(可以用决策树方法)和信用评分模型(可以用神经网络方法)。然后,结合这两个模型找出哪些潜在客户的信用风险低且很大可能会接受提供的申请表。根据这些方法,A银行在剩下的950,000个潜在客户中选取其中信用好的700,000个进行邮寄。结果是,通过这邮寄的750,00 0份申请表,共收到9,000个潜在客户接受信用卡,即接受的比率为1.2%(9,000750,000=1.2%),比传统方法的1%提高了20个百分点。还有1,000个客户在未寄的250,000个潜在客户中,他们是被模型筛选掉的,很明显,若对他们也进行邮寄的话,需花费¥250,000但他们带来的利益只有¥125,000(¥1251,00 0=¥125,000),表明为获得这些客户的成本是大于他们所能带来的收益的,故将他们放弃。,表3 传统方法和数据挖掘方法获取新客户的比较,从表中可以看到,净利润增加了¥125,000,即使减去数据挖掘的成本¥40,000其最终净利润也还多出¥85,000。另外,本例中建立模型的投资回报率(ROT)也比较高,为212.5%(¥85,0 00¥40,0 00=212.5%。从而显示了将数据挖掘技术应用与新客户获取中的优势所在。,决策树分类方法,决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法。比如,在贷款申请中,要对申请的风险大小做出判断,图1是为了解决这个问题而建立的一棵决策树,从中我们可以看到决策树的基本组成部分:决策节点、分支和叶子。,决策树的每个节点子节点的个数与决策树应用的算法有关。如CART算法得到的决策树每个节点有两个分支,这种树称为二叉树。允许节点含有多于两个子节点的树称为多叉树。每个分支要么是一个新的决策节点,要么是树的结尾,称为叶子。在沿着决策树从上到下遍历的过程中,在每个节点都会遇到一个问题,对每个节点上问题的不同回答导致不同的分支,最后会到达一个叶子节点。这个过程就是利用决策树进行分类的过程,即利用几个变量(每个变量对应一个问题)来判断所属的类别(最后每个叶子会对应一个类别)。常用的算法有分类回归树CART、ID3、和C4.5等,ID3算法运用信息熵理论,选择当前样本属性集中具有最大信息增益值的属性作为测试属性。该属性使得对结果划分中的样本分类所需的信息量最小,并反映划分的最小随机性或“不纯性”。这种信息理论方法使得对一个对象分类所需的期望测试数目达到最小,并确保找到一棵简单树。,设属性A为测试属性,它具有V个不同的值,用,表示属性A取值为,的样本子集属于类 的样本数。,那么按照属性A的每个属性值进行分割的期望信息称作A的熵,由下式给出:,在A上分割获得的信息增益定义为:,依据上述方法,计算每个属性的信息增益,属性的信息增益越大,区分度越大。,通过对一组训练数据的学习,构造出决策树形式的知识表示,在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支,在决策树叶结点得到结论。所以从根到叶结点的一条路径就对应着一条规则,整棵决策树就对应着一组析取表达式规则。基于决策树学习算法的一个最大的优点就是它在学习过程中不需要使用者了解很多背景知识。这样只要训练实例能够用属性结论式的方式表达出来,就能使用该算法来进行学习。,根据表中的数据,类反应有两个不同的值(0,1),因此有两个不同的类(m2)。设类C1=0,类C2=1。则类C1有7个样本,类C2有8个样本。则给定样本分类的期望信息为:I(s1,s2)I(7,8)=-7/152(7/15)-8/152(8/15)=0.997现在计算每个属性的熵,(1)职业:销售:S11=5,S21=4则I(S11,S21)=0.991非销售:S12=2,S22=4则I(S12,S22)=0.918信息增益:E(职业)=(S11+S21)*I(S11,S21)/S+(S12+S22)*I(S12,S22)/S=0.991*9/15+0.918*6/15=0.9618GAIN(职业)0.997-0.9618=0.0352同理:(2)收入:GAIN(收入)=0.4308(3)地区:GAIN(地区)=0.114(4)年龄:GAIN(年龄)=0.226,图2 按照“收入”分割得到的决策树,图3 最终决策树,从图3中我们可以很直观的分析出客户申请信用卡对“收入”、“年龄”、“地区”、“职业”四个属性的反应。可以得出一下规则:1)当收入小于等于2000元,如果年龄为中年的话一般没有兴趣;2)当收入小于等于2000元,来自地区为华北、西北、东北或其它的年轻人,一般没有兴趣;3)当收入小于等于2000元,来自地区为华东且为年轻人一般有兴趣;4)当收入大于2000元,且来自华北、华东、东北或其它地区,一般有兴趣;5)当收入大于2000元,来自西北地区且为年轻人一般有兴趣;6)当收入大于2000元,来自西北地区且为中年人一般没有兴趣。,选择了合适的算法后,我们只需要把切分看成是把一组数据分成几份,份与份之间尽量不同,而同一份内的数据尽量相同。如果经过一次切分后得到的分组,每个分组中的数据都属于同一个类别,显然达到这样效果的切分方法就是我们所追求的。假定我们利用历史数据建立了一个包含几百个属性、输出的类有十几种的决策树,这样的一棵树对人来说可能太复杂了,但每一条从根结点到叶子节点的路径所描述的含义仍然是可以理解的。决策树的这种易理解性对数据挖掘的使用者来说是一个显著的优点。然而决策树的这种明确性可能带来误导。比如,决策树每个节点对应分割的定义都是非常明确毫不含糊的,但在实际生活中这种明确可能带来麻烦(凭什么说年收入2001的人申请信用卡,而2000的人就没有)。另外,树的大小与样本数量无关,计算量较小。,客户保持和流失,客户发展阶段:潜在客户新客户满意的客户留住的客户老客户。经济学广泛应用的“80/20定律”(佩尔图定律),具体到CRM中是说企业80%的利润是由前20%的客户所创造的;又如1989年的哈佛商业评论中提到若客户保持率提高5%,平均每位客户的价值就能增加25%到100%。这些数字都充分说明了提高客户的忠诚度、保持好的客户对于企业本身的利益是至关重要的。比如在美国,移动通信公司每获得一个新用户的成本平均是300美元,而挽留住一个老客户的成本可能仅仅是通一个电话。,因此客户关系管理首先提倡的是保持现有客户,实现现有客户的重复购买是企业追求的首要目标。其次才是开拓新市场,吸引新客户。通过数据挖掘可以发现流失客户的特征,这样就可以在那些具有相似特征的客户还未流失之前进行针对性的弥补。例如一家移动通信公司挖掘出的结果是:年龄在26岁以下、开通了WAP服务、移动电话价值(购买时)在1800-2800元、每月通话费在250-350元之间(包月制则是200元和280元两档)的男性流失的比例最高。掌握了这些信息,就可以针对每个人的贡献,满足他们的一些需求。,客户流失的原因主要有以下4种类型:自然流失 客户流失不是人为因素造成的,比如客户的搬迁和死亡等。自然流失所占的比例很小。企业可以通过建立连锁服务网点和经营分公司,或者提供网上服务等方式,让客户在任何地方、任何时候都能方便快捷地使用企业的产品和服务,减少自然流失的发生。恶意流失 是指一些客户为了满足自己的某些私利而离开企业,比如很多电信运营商的用户在拖欠了大额通信费用后离开这家电信运营商,选择其他电信运营商提供的服务,从而达到不交费用的目的。恶意流失在客户流失中所占的比例也不大。企业可以通过客户信誉管理制度和欺诈监测来防止客户的恶意流失行为。,竞争流失 由于企业竞争对手的影响而造成的流失称为竞争流失。市场上的竞争突出表现在价格战和服务战上。过失流失 客户流失都是由于企业自身工作中的过失引起客户的不满意而造成的,比如企业形象不佳、产品性能不好、服务态度恶劣等。过失流失在客户流失总量中所占的比例最高,但同时也是企业可以通过采取一些有效手段来防止的。客户流失预测分析能帮助企业理解客户将要离开的信号,使企业有充分的时间采取措施挽留有流失倾向的客户。在客户关系分析中,客户流失预测分析模型的可解释性非常重要,企业要能清晰地理解分类模型中的各个因素以及各个因素的作用程度,根据分类模型理解影响客户流失的因素,以便于企业做出相应的改进。,影响客户流失的因素主要从以下几个层面考虑,竞争对手情况:竞争对手最近开发新产品情况、竞争对手最近开发新促销策略;企业和员工形象:产品更新快慢程度、员工的态度和形象、员工的流动率、企业文化和形象;客户购买行为:客户是否接触竞争对手的产品、客户对企业的满意度、客户与企业交往的时间长度、客户最近的购买频率和数量的变化情况;产品和服务质量:服务体制是否完善、客户投诉是否处理、服务质量和服务的及时性、产品的质量和价格;,客户流失模型的建立和应用过程如下:在客户数据仓库中抽取适当的字段组成客户分析数据库,为客户描述和客户流失模型提供数据源;客户流失预测分析属于数据挖掘中的分类,客户是否己经流失为类标号,因此,根据客户是否流失情况,将客户分析数据库分离为当前客户数据库和流失客户数据库;对流失客户数据库进行分析,建立客户流失模型。随机选择流失客户中的2/3为训练数据,建立分类器,得出分类模型。将剩下的1/3数据作为测试数据代入分类模型中,预测准确率。如果准确率过低,则重复以上过程,直到分类模型的准确率满足用户的需求,得出客户流失模型;从客户流失模型中分析影响客户流失的各种原因,找出企业的不足之处,发现流失者的行为特征。运用客户流失模型在当前客户数据库中发现预测有流失倾向的客户群体。,在预测客户的流失建模中较为常用的数据挖掘算法是CART(Classificationand Regression Trees,分类回归树),它是分类方法中决策树的一种算法。尽管其他的一些数据挖掘技术,如神经网络也可以产生很好的预测模型,但是这些模型很难理解。当用这些模型做预测分析时,很难对客户流失的原因有深入的了解,更得不到如何对付客户流失的任何线索。在这种情况下,一般需要使用决策树或聚类技术等分类方法进一步的分类,来得到更深入的了解,所以生成的预测模型就相对复杂的多。,客户流失数据集有其自身较为显著的特点:客户流失数据集中包含较多的连续值属性,如客户的年龄,收入信息,各项消费信息等。客户流失数据集是一个典型的非平衡分布数据集。流失客户与非流失客户之间相差的比例很大。流失客户在数据集中一般只占一个较小的比例。分类算法在处理非平衡数据集的分类问题时,容易受到样本类别分布的影响,对少数类的分类精度不高,其效果并不理想。例如:TeleData为某电信运营商提供的客户信息数据集,其中包括用户的人口统计特征和通信消费特征,通过数据挖掘技术,挖掘出流失客户的分类模型,从而提出策略,指导客户挽留。,客户忠诚度分析,客户忠诚度一般是指客户坚持重复购买或惠顾自己喜欢的同一品牌的产品或服务,不受环境和市场的影响。客户忠诚主要表现在以下几个方面:(1)会经常反复地购买本企业的产品或服务,甚至可以定量分析出他们的购买频数;(2)在购买企业产品或服务时,选择呈多样性,但是优先关心和选择其忠诚的企业品牌的产品或服务以及其产品或服务的发展情况;(3)乐于向他人推荐本企业产品,被推荐者相对于其他客户会更容易地认同推荐的产品或服务;(4)会排斥本企业的竞争对手,只要忠诚的纽带未被打破,他们甚至不屑于略胜一筹的竞争对手。,衡量客户忠诚的唯一尺度就是客户是否重复或持久地购买企业的产品或者服务,顾客忠诚体现为具体的购买行为,具有很强的客观现实色彩,是实实在在的。而客户忠诚的诱因主要是客户满意,顾客满意是一种期望值与感知效果的比较,是一种心理反应,它取决于顾客的“期望”,具有很强的主观色彩。所以,客户忠诚度分析标准是一个较为模糊的概念。首先可用聚类分析进行客户忠诚度分析,根据所得的聚类结果,将每一类赋以具体标记,然后进行分类,构造出忠诚客户的具体特征。或者是通过行业专家进行标记。在现有数据库信息资源的条件限定下,客户忠诚度的分析同客户忠诚度具体的量化定义就有了密切的联系。根据需要,企业可以对客户的一些具体表现设定相应的观测变量,如:货款到达的及时性、购物占购货企业货物销量总量的比例、信息的虚假程度、货物价格的接受程度、持续交易的时间、重复购买的次数、购买方式等。,客户忠诚度分析模型的建立和应用过程如下:(1)根据己有定义选定相关的分析变量;(2)从企业的业务数据库中收集整理原始数据,按客户忠诚度分析所需的字段组建企业客 户的数据仓库系统;(3)检验分类与实际的吻合程度,选取或确定合适的分类数,目前许多企业设定为5类;(4)观察分析每类的特点,给每类赋以类标记;(5)对带有忠诚度类标记的数据建立分类模型;(6)根据忠诚度模型描述忠诚度客户的特征,帮助企业识别忠诚客户,根据客户忠诚度的不同,提出相应的营销与客户管理措施。,客户满意度分析,客户满意度分析模型的建立过程和客户忠诚度分析类似:(1)首先,通过多种方式进行客户满意度调查,影响客户满意度模型的主要因素包括:服务和系统支持、产品/服务技术表现、客户互动的因素、情感因素等。不同行业影响客户满意度的因素各不相同,但是基本都离不开这几个层次。客户的满意程度一般分为5个档次,1到5分别代表“很不满意”、“不很满意”、“基本满意”、“满意”和“很满意。(2)将客户满意度调查结果收集记录到企业的数据库中,构建客户数据仓库,在客户数据仓库中抽取适当的字段组成客户满意度分析数据。这些字段包括客户基本描述数据和满意度调查数据。客户的基本描述数据,包括客户的受教育水平、客户的性格偏好、客户的职业等,因为这些因素会影响客户对外界事务的态度,因此应当给予考虑。,(3)客户满意度分析属于数据挖掘中的分类,对客户满意度数据实施数据挖掘技术,建立分类器,得出分类模型。(4)研究客户满意度的分类模型,在分类模型中越靠近上层的因素越是主要因素。找出使客户满意的关键因素,企业继续在这些方面努力从而进一步提高客户的满意度。找出导致客户不满意的关键因素,帮助企业认清不足,加强管理。,交叉销售,公司与其客户之间的商业关系是一种持续的不断发展的关系。在客户与公司建立起这种双向的商业关系后,可以有很多种方法来优化这种关系:延长这种关系的时间在维持这样的关系期间增加互相的接触在每一次互相接触中获得更多的利润作为公司,其目标是要达到双赢的结果,即客户和商家都可以从中获益。客户获益是由于他们得到了更好更贴切的服务质量,商家则因为增加了销售量而获利。因此,企业就需要向已有的客户进行销售,这就是交叉销售。交叉销售就是指你向现有的客户提供新的产品和服务的营销过程。,在这里,我们看一下如何回答市场人员经常问的一个问题:“我应该向什么人销售什么产品?”。更准确的来看,这可以分成以下三个问题:1哪些产品是经常被一块购买的?2哪些产品是经常被同类型的顾客购买的?3顾客购买某种商品的可能性有多大?以上三个问题可以分别用数据挖掘中的关联、聚类、预测分析加以解决。,关联分析,关联分析就是从给定的数据集中发现频繁出现的项集模式知识(又称关联规则)。典型例子是购物篮分析。关联规则研究有助于发现交易数据库中不同商品(项)之间的联系,找出顾客购买行为模式,如购买了某一商品对购买其他商品的影响。有时并不知道数据库中数据的关联函数,即使知道也不确定,因此关联分析生成的规则带有可信度。通常关联规则具有AB的形式,即:A1A2 AmB1 B2 Bn,其中,Ai,Bj均是属性或项,表示数据库中满足X中条件的记录也一定满足Y中的条件。涉及到两个概念:支持度和可信度,若要确定X,YZ的规则,则支持度s表示一次交易中包含X,Y,Z的可能性。可信度c表示包含X,Y的交易中也包含Z的条件概率。例如:上述表格中左边是交易项目,右边是根据交易的事实来确定的支持度,那么现在来确定在交易事实中是否存在A C的规则。Confidence(A C)=support(A,C)/support(A)=66.6%为了挖掘出具有价值的规则,通常规定最小支持度和最小置信度作为两个参数的阈值.,关联规则挖掘可以分解为两个步骤:首先找出交易项目中满足最小支持度(minSupp)的项集(称其为频繁项集);然后由频繁项集生成关联规则,对于频繁项集A,若BA,且置信度confidence(BA-B)不小于最小置信度minConf,则BA-B构成关联规则。在第一步的基础上完成第二步比较容易,所以目前的研究主要集中第一步上。关联规则的应用:交叉销售:基于消费者的购买模式,主动进行交叉销售;商品摆放:将经常一起购买的东西一起摆放;流失客户分析:可分析是否是由于某些关键商品缺失引起的。,。,,,Apriori算法是挖掘关联规则的经典算法,挖掘的对象是诸如售货记录之类的数据所组成的事务数据库,而挖掘的结果则是类似于“购买面包的同时也可能购买黄油”的关联规则。设I=I1,I2,Im是项的全体构成的集合,项的集合称为项集,包含K个项的项集称为K-项集。D是数据库事务构成的集合,其中每个事务T又是一个项集,且TI。Apriori使用一种称作逐层搜索的迭代方法:(K-1)项集用于搜索K项集。即:首先找出频繁1项集的集合,记做L1;L1用于找出频繁2项集的集合L2,如此下去,直到找到Lk,k不再增加。为了提高频繁集逐层产生的效率,一个称作Apriori性质用于压缩搜索空间。Apriori性质:频繁项集的所有非空子集都必须是频繁的。根据定义项集I不满足最小支持度阈值,则I不是频繁的,若项A添加到I中,则结果项集(IA)不可能比I更频繁。,连接:为了找LK,通过LK-1与自己连接产生候选K项集的集合CK。设:li是LK-1中的项集,lij表示li的第j项。则Lk-1的元素l1、l2是可以连接的,如果满足:l11=l21 l12=l22 l1k-2=l2k-2 l1k-1l2k-1 则连接l1、l2的结果项集是l11 l12 l1k-1l2k-1。剪枝:CK是LK的超集。扫描数据库确定CK中每个候选项集的计数,从而确定LK。然而CK可能很大,可以利用Apriori性质进行剪枝。若一个候选K项集的(k-1)子集不在LK-1中,则该候选也不可能是频繁的,可以从CK中删除。,Apriori算法主要由两步组成:连接与剪枝,C1,L1,C2,L2,C3,由频繁项集产生关联规则:,1)对于每个频繁项集L,产生L的所有非空子集。2)对于L的每个非空子集S,若support(L)/support(S)minconf,则输出规则S(L-S),例如:频繁项集l=I1,I2,I5的非空子集有:I1,I2,I1,I5,I2,I5,I1,I2和I5。关联规则如下:I1I2I5,confidence=2/4=50%I1I5I2,confidence=2/2=100%I2I5I1,confidence=2/2=100%I1 I2 I5,confidence=2/6=33%I2 I1 I5,confidence=2/7=29%I5I1 I2,confidence=2/2=100%若最小置信度阈值为70,则只有3个规则输出。,3.3 客户分类,客户分类的方式多种多样,企业可以根据实际需要和自身特点对客户进行各种主题背景下的分类,例如:如果以客户的盈利能力为横轴,以忠诚度为纵轴,可把客户划分为四类:高盈利能力且忠诚、高盈利能力而不忠诚、低盈利能力而忠诚、低盈利能力而不忠诚;按照客户满意度可分为:非常满意、很满意、基本满意、不满意、很不满意;也可以按照客户的行业或行为进行分类。客户分类结果的有效性取决于分类指标和分类方法的选择,用于评价分类的指标需反映出客户的特征以及企业进行客户分类的目的。分类指标的选择要遵循一定的客观规律,并应根据企业所处的行业特点以及企业本身的实际情况来选择恰当的分类指标。客户分类的方法:分类和聚类,以K为参数,把n个对象分为个簇,聚类目标是簇内具有较高的相似度,而簇间的相似度较低。,聚类的处理流程如下:首先,随机地选择K个对象,每个对象代表一个簇的平均值或中心。对剩余的每个对象,根据其与各个簇中心的距离,将它划分到最近的簇。然后重新计算每个簇的平均值。这个过程不断重复,直到准则函数收敛。通常,采用平方误差准则,其定义如下:,K-均值聚类,算法的关键是解决如下问题:选择合适的簇数;选择合适的距离函数和评判函数。,(1)确定属性根据中国电信的行业现状,可以把客户的属性分为三种:基本属性、服务属性和分析属性。基本属性:指客户的原始特征,也是分辨客户的最基本方式。包括客户的姓名、年龄、身份证号、国籍、户口、地区、地址、学历、工作单位、工龄、收入、婚否、家庭状况等客户专有特征。服务属性 指客户与中国电信之间由服务关系和模式而产生的费用与过程。包括客户每月市内电话费、通话次数、手机通话费、通话频率、长途通话费及由此产生的服务费、安装费等一系列相关服务费用。分析属性 指电信通过分析而产生的分析值。包括客户忠诚度、行为分析指标、流失率、综合价值等分析指标。,(2)数据标准化聚类之前一般的数据都要进行处理,这是聚类算法与其他算法的不同之处,因为聚类算法中需要计算距离。客户聚类中所用的数据都是区间标度变量,变量的度量单位的选择将直接影响聚类分析的结果。例如,将时间单位由“年”改为“月”,可能产生非常不同的聚类结果。一般情况下,所用的度量单位越小,变量可能的值域就越大,这样对聚类结果的影响也越大,为了避免对度量单位选择的依赖,数据应当标准化。常用的标准化的方法是将原来的度量值转换为无单位的值,对于客户聚类分析中的变量我们分为三种,对每种采取不同的标准化方法。,1)增益变量,即该变量的值越大,客户价值越大,包括客户的购买次数、客户在本企业的消费额、客户与企业保持交易的时间长度。对该类变量采用如下的处理方法:,,,2)损益变量,即该变量的值越小,客户价值越大,包括客户最近一次购买到现在的时间长度。对该类变量采用如下的处理方法:,3)不能用增益和损益来衡量,即客户提出建议或意见的次数。对该类变量采用如下的处理方法:,(3)距离度量方法的选择K一平均聚类算法采用基于对象间的距离来计算各个对象间的相异度。,(4)确定KK-均值聚类算法必须事先给定聚类的簇k的数目,在具体应用中,一般根据聚类的目的而设定聚类簇的数目。,例如客户价值分类:RFM 方法是衡量客户价值的一种重要方法,遵循现代管理大师佩拍斯先生的划分观点,将客户划分为三类:最有价值客户、最具增长性客户、负值客户,企业的高层经理级决策者一般从比较宏观的角度来了解客户,所以将客户分为3簇。应用K一平均聚类算法,输入初始参数:包含47060条记录的数据库,k=3,聚类试验时只选择了几个主要变量,其他的变量没有参与计算。选择的变量有:R表示客户最近一次购买到现在的时间长度(天)、F表示最近两年的购买次数、M表示最近两年客户在本企业的消费额、L表示客户对企业提出建议或意见的次数。,聚类结果,另一种常见的客户分类方法是预先建立不同客户群的定义,数据挖掘技术要解决的是在数据中识别与已知客户群相符的客户,所以采用的方法是有监督学习的分类技术:决策树、神经网络、K近邻等分类方法。为达到分类预测的功能,必须首先建立分类模型,这需要有一个已知客户分类的客户训练数据集,所以把这种分类方式称为有监督的学习方法,这种分类方式常用来进行识别和预测,例如发现新客户和潜在客户等。分类的准确度由数据的质量和选择的分类方法确定。,神经网络,神经网络近来越来越受到人们的关注,它为解决大复杂度问题提供了一种相对来说比较有效的方法。神经网络可以很容易的解决具有上百个参数的问题。神经网络常用于两类问题:分类和回归。,除了输入层的节点,神经网络的每个节点都与很多它前面的节点(称为此节点的输入节点)连接在一起,每个连接对应一个权重Wxy,此节点的值就是通过它所有输入节点的值与对应连接权重乘积的和作为一个函数的输入而得到,我们把这个函数称为活动函数或挤压函数。如上图中节点4输出到节点6的值可通过如下计算得到:W14*节点1的值+W24*节点2的值 常使用的神经网络是BP神经网络,神经网络的性能与训练用的样本密切相关。网络训练所需要的样本数取决于输入输出非线性映射关系的复杂程度,映射关系越复杂,样本中含的噪声越大,为保证一定的训练精度,所需要的样本就越多,而且网络规模越大。因此可以参考一个经验规则:训练样本数是网络连接权总数的5-10倍,且训练样本应该具有一定的代表性,样本类别均衡。,fid1=fopen(f:simulate datatcptrainsample2.txt,r);P=fscanf(fid1,%g,40,27031);fid2=fopen(f:simulate datatcptrainlabel2.txt,r);T=fscanf(fid2,%f,5,27031);Q,minp,maxp=premnmx(P);net=newff(minmax(Q),40,8,5,tansig,tansig,purelin,traingdm);net.trainParam.show=100;net.trainParam.lr=0.001;net.trainParam.epochs=4000;net.trainParam.goal=0.01;net,tr=train(net,Q,T);A=sim(net,Q);E=T-A;MSE1=mse(E);fclose(fid1);fclose(fid2);%(生成测试网络)fidt1=fopen(f:simulate datatcptestselectsample.txt,r);fidt2=fopen(f:simulate datatcptestselectlabel.txt,r)R=fscanf(fidt1,%g,40,29840);%(读入验证数据)S,minr,maxr=premnmx(R);T=fscanf(fidt2,%g,5,29840);B=sim(net,S);E=T-B;MSE2=mse(E);%(输出计算结果)fidt2=fopen(f:simulate datatcptestselectresult4.txt,w);fprintf(fidt2,%f,B);,MSE1=0.0428 MSE2MSE2=0.0861,5、世上最美好的事是:我已经长大,父母还未老;我有能力报答,父母仍然健康。6、没什么可怕的,大家都一样,在试探中不断前行。7、时间就像一张网,你撒在哪里,你的收获就在哪里。纽扣第一颗就扣错了,可你扣到最后一颗才发现。有些事一开始就是错的,可只有到最后才不得不承认。8、世上的事,只要肯用心去学,没有一件是太晚的。要始终保持敬畏之心,对阳光,对美,对痛楚。9、别再去抱怨身边人善变,多懂一些道理,明白一些事理,毕竟每个人都是越活越现实。10、山有封顶,还有彼岸,慢慢长途,终有回转,余味苦涩,终有回甘。11、人生就像是一个马尔可夫链,你的未来取决于你当下正在做的事,而无关于过去做完的事。12、女人,要么有美貌,要么有智慧,如果两者你都不占绝对优势,那你就选择善良。13、时间,抓住了就是黄金,虚度了就是流水。理想,努力了才叫梦想,放弃了那只是妄想。努力,虽然未必会收获,但放弃,就一定一无所

    注意事项

    本文(商务智能应用分析型CRM课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开