直复营销埃森哲.ppt
中国联通直复营销世界风推广项目,直复营销数据分析与处理_V1.12004年12月3日,概述,本报告是数据中央处理报告的其中部分,主要描述了如何对网关数据进行分析得到高端客户列表。在本部分首先建立利用网关数据获取高端客户的分析模型,并逐步描述数据的采集和清洗、客户价值分析、并通过锁定较小单位的目标客户群进行测试,最后得到具有较高目标定位的营销客户列表,用于世界风直复营销。基于本模型和应用方法,中国联通可以应用到客户洞察的其它领域。本报告由埃森哲项目组完成,项目组感谢在数据处理方法论、数据采集和处理过程中给予项目组支持的以下部门和人员:中国联通市场部CRM处对项目组给予了大力的支持,负责协调各地的资源 中国联通计费信息部对数据的处理工作给予了不少的支持并提供工作的便利 重庆分公司配合了数据的采集和分析的很多工作,并为本方法的进一步分析和测试做好准备工作。,目录,数据营销方法论网间数据分析方法数据采集与清洗数据分析应用营销列表生成和优化,数据营销流程模型,世界风直复营销应用的数据营销流程,目录,数据营销方法论网间数据分析方法数据采集与清洗数据分析应用营销列表生成,网间数据分析的几个基本假设前提,假设一世界风客户主要是移动通信存量市场的高端客户假设二竞争对手客户网间通话行为能够在一定程度上反应其移动消费行为假设三客户价值与客户的联络价值有一定的相关性,网间数据分析基本假设,分析假设一世界风用户是存量市场的高端客户,世界风产品的目标客户定位:移动通信市场的高端客户。从各地世界风用户的发展情况来看,世界风用户基本都是存量市场的高端客户,这其中包括竞争对手的高端客户,也包括部分网内的高端客户。网间获得的数据均为存量市场的移动通信客户。世界风产品的目标市场容量主要由存量移动通信市场的高端客户数量及其可营销转网机率决定。,网间数据分析基本假设,分析假设二网间通话与移动消费行为的相关性,移动通信客户的通话分布主要包括:移动运营商网内号码间通话移动运营商网间号码间通话移动运营商与其他固网运营商号码之间的通话网间通话行为是移动通信客户的主要消费行为分布之一。随着中国联通客户群的不断增长,中国联通目前的客户数量已经达到相当的规模,移动通信市场的客户渗透率基本达到能够与主要竞争对手相搞衡的水平,网间通话的行为和比例都会随着中国联通客户群和话务量的增长而不断增加。高端客户发生网间通话的概率和话务量都会较高。高端客户的移动消费水平较高,相应的通话时长较长,通话次数也会较多。因此高端客户更有可能发生网间通话行为,从而在网间通话记录中留下更多的信息。,网间数据分析基本假设,分析假设二移动客户通话行为分布,网间数据分析基本假设,分析假设三客户联络价值与客户价值的相关性,移动客户的价值由其移动通信的消费行为和消费水平所决定。移动通信是一个双向的交流过程。主叫与被叫行为在伴随通话时长的同时,也反应了具有不同价值的客户之间的交流。客户间的通话行为不仅仅代表了通信过程的发生,同时还伴随着与客户社会属性相关的某种沟通需求。根据埃森哲的全球经验,具有相近客户价值的客户群之间的通话行为有着更大的相关性。这也即说明:高端客户联络的客户群体中,存在潜在高端客户的机率会更大。低端客户联络的客户群体中,存在潜在低端客户的机率会更大。某一客户群体联络的客户中,存在相似客户群体的机率会更大。,网间数据分析基本假设,世界风直复营销潜在目标客户列表产生过程,数据采集与清洗,数据分析与应用,营销列表生成,55%,30%,15%,目录,数据营销方法论网间数据分析方法数据采集与清洗数据分析应用营销列表生成和优化,数据采集与清洗,网间客户明细数据采集网间竞争对手号码识别网内客户基本信息采集网内客户帐务信息采集相关市场信息采集,数据采集与清洗,网间数据采集所需的信息,1.网间客户明细数据采集,1.网间客户明细数据采集,客户获取营销之前,首先需要解决的问题就是获得可用的潜在营销客户数据源。以世界风产品的目标客户主要定位于存量市场的高端,因此其潜在目标客户为网外的移动高端用户。潜在的网外客户数据存在于以下一些方面:移动关口局交换数据 计费系统中的计费详单明细 客户服务部门或营销部门已经收集到的潜在目标客户信息 外部可获得的数据源(如:数据公司/商业合作等)其他可被利用的数据源不同的数据源的数据质量不同,应用前需要进行相应的评价。在充分考虑尽量应用现有可利用数据的需求后,项目针对网间外网数据(主要针对外网移动通信用户)进行采集和清洗。,1.网间客户明细数据采集,1.网间客户明细数据采集数据源定位,网间外网移动通信用户的数据主要存在于:本地移动关口局交换数据本地计费系统的计费详单明细记录本地点对点短信网关数据IP长途网关数据漫游地漫游交换数据其他属地计费系统的计费详单明细记录在综合考虑数据源的质量和数据的可获得性后,建议采用计费系统的详单明细记录做为主要的潜在数据源进行采集。,1.网间客户明细数据采集,1.网间客户明细数据采集计费系统中的外网数据,本地计费系统中的网间外网数据包括以下一些类型:归属地网间语音通话记录联通用户漫游至异地发生的网间语音通话记录竞争对手用户漫游至异地发生的归属地联通用户的语音通话记录归属地网间点对点文本短信(联通主叫)异地网间点对点文本短信(联通主叫)考虑到世界风用户是移动通信高端用户的特点,语音通信费用和数据业务费用占其移动通信消费的主要部分,短信在其价值构成中所占比例较小,因此以语音通话记录为主进行网间数据的采集和分析。从某一具体的地市进行直复营销的可执行性来讲,主要针对同一归属地的外网客户进行营销,因此外网数据采集的重点是本地外网客户的数据。,1.网间客户明细数据采集,1.网间客户明细数据采集网内客户本地网间通话行为分布,1.网间客户明细数据采集,1.网间客户明细数据采集网内客户漫游网间通话行为分布,1.网间客户明细数据采集,1.网间客户明细数据采集对方号码本地网间通话行为分布,1.网间客户明细数据采集,1.网间客户明细数据采集对方号码漫游网间通话行为分布,1.网间客户明细数据采集,1.网间客户明细数据采集可以采集的网间通话行为信息,从对本地网内客户的计费明细进行分析后发现,本地计费系统明细记录中可以获得以下一些网间通话记录和行为。本地网内用户与本地外网移动通信用户间发生的本地网间通话记录本地网内用户与异地外网移动通信用户间发生的异地网间通话记录由于移动通信客户在归属地出帐的特点,本地外网移动通信用户在漫游地发生的网间通话信息无法从归属地的计费信息中获得,但在漫游地网内的计费系统中会保有相应的记录,但这些信息只有通过对漫游地进行网间数据的抽取并分派给相应的归属地后才能加以利用:本地外网移动通信用户在漫游地与非本地发生的网间漫游通话行为本地外网移动通信用户在本地与异地网内客户之间发生的网间通话行为从本地网内用户的计费明细中可以分离出来异地外网客户与本地网内用户间发生的通话记录,这些记录对于异地进行直复营销会有所帮助。,1.网间客户明细数据采集,1.网间客户明细数据采集网间通话行为分布,从本地网内用户的计费明细中获得的主要是网间本地通话行为,而较难获得本地外网移动通信用户的漫游行为信息。网间通话记录能识别本地外网移动通信客户发生的本地网间通话记录,并且能够从中推算出外网客户部分行为,以下一些行为很难通过本地计费记录获得:从本地网内用户在本地主/被叫本地外网移动通信用户的记录中无法判别本地外网移动通信用户的漫游状态从本地网内用户在漫游状态下被叫接听本地外网移动通信用户的记录中无法判别本地外网移动通信用户的漫游状态仅当本地网内用户在漫游状态下,主叫同时也漫游到同一漫游地的本地外网移动通信用户时,从该客户相应计费明细记录的计价资费中才可能判断出本地外网移动通信用户处于漫游状态,且漫游至同一漫游地。(由于发生这一情况的机率较小,这一信息较难捕获。)仅当本地外网移动通信用户在漫游地被叫接听漫游地网内用户的语音呼叫时,从漫游地网内用户相应计费记录的计价资费中才可能判断本地外网移动通信用户处于漫游状态,且漫游至该漫游地。(这一行为的捕获,不仅需要该漫游地对计费记录进行分析,还取决于发生这样的呼叫行为的机率。也可以通过对关口局数据的分析获得),1.网间客户明细数据采集,1 网间客户数据采集、清洗与分析步骤,网间外网客户数据的采集、清洗与分析的基本步骤如下:对计费明细记录进行扫描,从计费记录中识别并摘录网间通话的明细记录对于摘录的计费记录进行转换,生成分析所需的相关字段(如归属地等)对采集到的原始数据进行扫描,逆向生成以对方号码为核心的网间通话明细记录对于逆向生成的对方客户网间通话明细进行汇总,生成分析所需的相关衍生信息通过对于网内客户的基本分析,对网内客户进行基本价值分群和评分对于网间外网客户,对于发生的每一次网间通话行为,按照计费时长和定义的网内客户价值系数进行加权平均,获得网间外网客户的联络价值系数将网间外网客户按照联络价值系数和网间通话行为进行分析和区隔,在此基础上生成潜在目标营销客户列表将目标营销客户列表交付给营销团队,根据营销的反馈情况对于网间外网数据的应用规则进行调整。,1.网间客户明细数据采集,1.网间客户明细数据采集计费系统记录的网间通话原始信息,计费系统中记录的通信行为信息包括以下一些字段(由于不同的计费系统对于字段名的命名会有所差异,在此仅列出字段描述项):,1.网间客户明细数据采集,1.网间客户明细数据采集计费系统记录的网间通话信息,除了上述从计费系统通话明细中提取的信息外,以下一些信息也可根据网间分析的需要在提取计费明细数据时采集生成:,1.网间客户明细数据采集,1.网间客户明细数据采集呼叫日期分布,话务日期分布分析的主要目的是分析网内客户在一周内的通话行为分布。话务日期分布一般要结合话务时间分布来进行分析。,1.网间客户明细数据采集,1.网间客户明细数据采集呼叫时间分段,如要进行通话时间的分布分析,一般的方法是将一天的24小时分为相应的时间段,按每个不同时间段对通话进行归类。下表给出了一个通话时间分布的时段分类原则,根据不同地区的社会活动特点,呼叫时段的分类应当进行相应的调整,以反应不同地理区域的特征。,1.网间客户明细数据采集,1.网间客户明细数据采集计费系统记录的网间通话信息(实例),1.网间客户明细数据采集,1.网间客户明细数据采集计费系统记录的网间通话信息(归并),归并的目的是将采集到的以网内用户核心的计费信息归并生成以对方号码为核心的网间通话明细记录。,1.网间客户明细数据采集,1.网间客户明细数据采集计费系统记录的网间通话信息(汇总),汇总是指对逆向生成的网间外网客户通话记录进行汇总,获得所需相关的汇总信息,如通话号码数、相应号码的通话次数、网间通话天数等。,1.网间客户明细数据采集,2 网间竞争对手号码识别,正如前面分析的那样,网间可以采集到的对方号码数据一般包括以下一些类型:手机号码固定电话号码特服号码,如1001,1860,95577,13800138000等包括前缀或后缀的电话号码,如17911133HHHH0123,02395577。对于网间外网数据的识别,通过计费记录中的“对方运营商”和“对方归属地代码”可以识别出外网数据的运营商类型和归属地。对于网间竞争对手号码的识别,特别是手机号码的识别也可依靠手机号码归属地来判断。我们建议中国联通采用手机号段来进行网间竞争对手号码的识别。,2.网间竞争对手号码识别,2 基准数据文件示例号段基准,2.网间竞争对手号码识别,2 利用号段基准识别手机号码的类型和归属地,基准数据文件,网间获得的竞争对手号码1390830XXXX1345288XXXX0238213XXXX1390831XXXX1381600XXXX0238231XXXX0106561XXXX1390100XXXX0206253XXXX1365830XXXX,本地竞争对手A号码1345288XXXX1365830XXXX1390830XXXX1390831XXXX,异地竞争对手A号码1390100XXXX1381600XXXX,本地竞争对手B号码023 8213XXXX023 8231XXXX,异地竞争对手A号码0206253XXXX0106561XXXX,2.网间竞争对手号码识别,2 网间客户号码的分离,网间的采集到的号码会存在多种形式,需要根据实际情况采取相应的规则,从中分离出实际的电话号码。这些情况包括以下一些类型:,0135HHHHABCD,0,135HHHHABCD,+,179110135HHHHABCD,17911,135HHHHABCD,+,961380135HHHHABCD,96138,135HHHHABCD,+,010HHHHABCD,010,HHHHABCD,+,2.网间竞争对手号码识别,网内客户数据采集所需的信息,3.网内客户基本信息采集,3 网内客户基本信息采集,网内客户的基本信息包括以下一些内容:客户姓名客户性别客户身份证件类型及号码客户年龄居住地址及邮编婚姻状况教育程度客户职业客户收入其他信息(如客户级别)网内客户的基本信息主要来自于综合营帐系统和客户服务系统。,3.网内客户基本信息采集,3 网内客户基本信息采集时遇到的问题,从对试点省市的调研情况看,实际的情况是相当比例的网内客户记录信息并不完整,主要的情况包括:大多数准预付费用户没有客户资料,尤以GSM网络用户突出。后付费的用户大多数都保有最基本的客户资料,但大多没有进行过校准。身份证件号码在系统的记录大多数是文本,存在部分错误记录,没有进行过格式和组成规则校验。联系地址、职业、收入等信息基本没有进行过采集。大客户的记录相对完整,但很少进行过分析。造成这一情况的主要原因是:在客户入网时就没有主动采集相关的信息(如最重要的客户身份信息)。未采集的客户信息在后续的客户服务提供过程中也没有主动进行过采集或校准。入网登记时仅采集了非常有限的信息,而不同时间点采集信息的标准不统一。(如不注重采集客户地址等信息)信息在采集过程或割接过程中出错,造成系统记录的信息失真,不能正确反映实际情况。,3.网内客户基本信息采集,3 网内客户基本信息采集,我们在试点城市,针对CDMA网络用户采集了以下客户的基本信息:客户号客户身份证件号码年龄入网时间而对于GSM网络用户,由于绝大多数的在网用户资料不完整,因此仅采集了客户号和入网时间。有关信息采集中的常见清洗问题(如:客户的年龄的采集),可以参见数据清洗常见问题。,3.网内客户基本信息采集,3 网内客户资料采集时的清洗,网内客户资料主要来源于综合营帐系统,相关的计费明细和帐务信息来自于计费系统。由于一个省级公司往往有着数以百万计的在网客户,这些系统中提取的数据由于在入网登记信息的完备与准确性不同,往往会存在一些问题。这些问题都需要在分析时进行相应的清洗工作,同时根据分析主题的不同,也经常需要对于提取的数据进行剥离或分类,以达到分析的目标。综合营帐系统中的客户资料经常存在以下一些问题:大量客户入网时没有入网身份信息(在一些省市公司以G网更为严重)客户身份证件信息记录不完整(如证件号码不全或错误,甚至为空)客户身份证件信息可能不真实(存在一个身份证件登记多个手机的情况)以前系统割接造成的字段属性类型不匹配(如可能使用多个代码表示身份证号)客户信息记录不全或错误(如可能登记了客户的性别,但并没有做过验证,也与身份证件号码的判断的情况不符)其他情况在目前中国联通的系统中记录的客户资料,与人口统计信息相关的大多只记录了客户的身份证件号码,而要获得与网内客户分析密切相关的客户年齡和性别信息,往往需要通过对身份证件号码的清洗来判断。(关于身份证件号码的清洗,详细内容请参见数据清洗常见问题),3.网内客户基本信息采集,3 网内客户资料采集时的清洗,对于网内客户分析时,经常采用的对于身份证件的清洗步骤如下:识别有正确身份证件号码的客户通过身份证件号码判断客户的性别和年龄判断出客户年龄在16岁以下的客户,认为客户身份资料不正确对于年龄在55岁以下的客户,由于在整体客户中所占比例较小,目前也不具备营销的潜力,经常会与其他客户分隔开来通过抽样来判断客户身份证件信息的准确率(可以通过回访,也可以通过与已知的外部准确数据进行比对来判断),3.网内客户基本信息采集,4 网内活跃客户样本采集的几点说明,目的以三个月的平均ARPU值来代替客户的消费水平三个连续在网出帐用户更能代表稳定客户的消费情况和行为采集样本的要求最近连续三个整月在网出帐的用户排除最近三个月内新入网的客户排除单零和双零用户排除零帐及零次话客户排除公免用户等特殊用户(包括内部员工号码、测试号码和其他公免号码)注意事项分析时选择按自然月整月在网出帐的客户。如统计7月出帐的用户,是指7月1日以前入网出帐的用户。7月当月入网,当月出帐的用户不计入在内。单零和双零用户需单独处理。有针对性的客户分析需要根据分析需求处理数据,年龄分析时,仅对系统登记有详细客户身份证件资料且符合规范要求的客户进行抽样分析,4.网内客户帐务信息采集,4 网内客户帐务信息采集,客户的帐务信息是反映移动通信客户的消费和行为的记录,主要包括两个层次的信息:月帐单信息记录运营商的应收及客户的移动通信消费水平。帐务明细记录客户的移动通信消费的行为记录和计费明细。缴费信息记录客户的缴费行为记录。客户的帐单信息和帐务明细主要来自于计费系统,而客户的缴费信息来自于综合营帐系统。,4.网内客户帐务信息采集,4 网内客户帐务信息采集,客户的月帐单信息一般包括以下一些项目:客户名称手机号码业务类型基本月租费本地通话费国内长途费国际长途费漫游通话费IP长途费短消息费数据业务费增值服务费其他费用优惠金额月应缴费用合计客户的帐单信息主要来自于计费系统。不同省公司的帐单格式会有所差异。有些客户,如某些预付费客户,仅有实时话费,而没有定期出帐记录。可以通过计费系统统计。,4.网内客户帐务信息采集,4 网内客户帐务明细信息采集,客户的帐务明细记录一般包括以下一些信息(以语音业务为例)对方号码呼叫类型呼叫状态通话发生日期通话开始时间通话时长计费时长通话发生地漫游状态基本通话费漫游通话费客户的帐务明细记录主要来自于计费系统。根据分析的需要,一般需要采集累计三至六个月的计费明细记录和出帐帐务信息。,4.网内客户帐务信息采集,5 相关市场信息采集,需要采集的市场信息包括:当地通信市场的客户情况和市场总量当地移动通信市场的客户情况和移动通信收入当地移动通信市场竞争状况分析竞争对手的客户情况和经营数据竞争对手的市场产品策略及投入市场的产品政策竞争对手的号段竞争对手内部使用的号段资源最近六个月的竞争对手客户发展情况,5.相关市场信息采集,5 所需采集的市场信息列表,5.相关市场信息采集,目录,数据营销方法论网间数据分析方法数据采集与清洗数据分析应用营销列表生成和优化,数据分析与应用,网内客户基本分析 网内活跃客户分析 定义价值评分规则 网间客户通话评分 网间通话数据分析,数据分析与应用,6 网内客户基本分析,网内客户基本分析是对全部网上客户进行的总体分析。主要目的是:了解网内客户的总体分布情况了解网内客户的总体出帐情况了解网内客户在不同网络之间的差异性(CDMA与GSM)网内客户基本分析主要观察以下指标:客户数及占比出帐收入及占比ARPU值分布在网时间分布,6.网内客户基本分析,C公司网内客户相对价值分布(CDMA),6.网内客户基本分析,取值样本:2004年7月至9月CDMA网全部出帐用户738859人。相对贡献价值出帐收入占比客户数量占比CDMA网全部出帐用户平均ARPU值为98.40元。,C公司网内客户在网时间分布(CDMA),6.网内客户基本分析,取值样本:2004年7月至9月CDMA网全部出帐用户738859人。CDMA网全部出帐用户平均ARPU值为98.40元。,C公司网内客户ARPU值分布(GSM),6.网内客户基本分析,取值样本:2004年7月至9月GSM网全部出帐用户1880943人。GSM网全部出帐客户平均ARPU值38.26元。,C公司网内客户在网时间分布(GSM),6.网内客户基本分析,取值样本:2004年7月至9月GSM网全部出帐用户1880943人。GSM网全部出帐客户平均ARPU值38.26元。从下图可以发现:GSM网客户的入网时间分布与平均ARPU值保持相似的趋势。,C公司网内客户总体分布说明,C公司2004年7月至9月全部出帐用户共计2619802人,其中CDMA网络738859人,GSM用户1880943人。但从2004年7至9月出帐收入占比来看,CDMA出帐收入与GSM出帐收入基本相同。全部CDMA用户出帐收入占总出帐收入的49.75%,全部GSM用户出帐收入占总出帐收入的50.25%。从对比2004年7至9月出帐的详细数据来看,月与月之间的客户基数有着较大的差异,特别是G网之间,有着明显的客户大进大出现象。因此需要从中分离中活跃客户进行进一步的分析,以更准确的识别出正常在网在用客户的价值和行为。从出帐用户的在网时间看,虽然CDMA在网出帐用户的在网时间分布有明显的波动,但其平均ARPU值随着客户在网时间的增加,有明显的上升趋势。大量G网用户缺乏有效的客户资料,不足以支持结合人口统计指标进行更为深入的分析。对于C网用户,大多在营帐系统中记录有客户资料,可以结合这些统计资料进行部分人口统计指标方面的分析。,6.网内客户基本分析,为何要对活跃客户进行分析,活跃客户能够反映正常在网在用的客户移动通信消费行为,是进行移动通信客户行为分析时重要的分析内容。对于活跃客户进行分析对于了解移动通信客户以下的行为非常重要:移动通信消费水平某一特定的移动通信业务消费偏好移动通信消费业务结构在进行相关的移动通信业务分析时(如针对漫游消费行为进行分析),一般都需要从活跃客户中提取相应的样本进行分析。活跃客户的分析一般从以下三个层次进行:总体客户分布移动消费业务结构分析移动消费行为分布分析根据本项目的需要,我们对选择的试点城市的在网活跃客户进行了第一层次和第二层次部分内容的分析。其他相关分析需要由联通方面进行,我们可以给予必要的指导。,7.网内活跃客户分析,活跃客户的识别,活跃客户的特征非新入网客户(一般以三个月以内入网的客户视为新入网客户)连续在网在用消费行为比较稳定(无零次话或零帐单情况)对于活跃客户进行识别和分析经常使用的方法是:采集一个连续时间段(多选择三个月)内正常在网在用出帐用户的数据作为活跃用户,进行针对性分析。本项目分析时的活跃客户数据选择要求:CDMA用户(包括预付费和准预付费用户,不含智能网用户)连续三个整月在网在用(在C公司选择2004年7月/8月/9月三个月连续在网出帐的用户)最近三个月没有零帐或零次话发生正常的缴费用户非公免用户非话费异常客户,7.网内活跃客户分析,C公司活跃客户样本说明(CDMA),活跃客户样本数量:467284人。样本选择要求:连续三个月在网出帐用户(2004年7月、8月、9月)最近三个月出帐记录没有零出帐及零次话情况排除公免套餐等特殊套餐用户数据样本筛选过程:2004年7、8、9月出帐客户数738859人排除零出帐用户114184人排除零次话用户137427人排除公免套餐用户15人 排除非身份证件5136人排除78月份入网客户14809人排除超高ARPU值客户4人(5000元以上)活跃客户样本数467284人,7.网内活跃客户分析,C公司活跃客户总体分布(CDMA),几个重要的值,7.网内活跃客户分析,C网活跃客户价值分布情况(CDMA),7,6,5,4,3,2,1,最高端ARPU400,高端240ARPU400,中高端140ARPU240,中端100ARPU140,中低端70ARPU100,低端40ARPU70,最低端ARPU40,2.77%,7.14%,15.56%,16.00%,22.63%,27.34%,8.57%,活跃客户平均ARPU值=120.59元,在C网活跃客户46.73万人中:其中ARPU值300元的客户6.08%其中ARPU值350元的客户4.10%其中ARPU值400元的客户2.77%,中位数:85元,在的全部的136.05万活跃客户中:ARPU 400元的1.20%ARPU350元的客户1.79%ARPU300元的客户2.75%,如果竞争对手300万客户,如高端客户的比例是我们的2倍至3倍,约5-7%,则可推算出可能有多达20万左右潜在目标客户。,7.网内活跃客户分析,C公司活跃客户分布总体分布(CDMA),7.网内活跃客户分析,活跃客户取值样本:2004年7月至9月CDMA网连续在网出帐用户467284人,2004年7-9连续三个月平均ARPU值为120.59元。CDMA活跃客户占全部CDMA出帐客户的比率46728473885963.24%CDMA活跃客户占全部CDMA出帐收入的比率77.51%其中有16092客户数据没有准确的身份证件信息,无法获取准确的年龄数据,这类客户的平均ARPU值为131.45元,高于有年龄信息的客户平均值120.21元。从年龄分析中可以发现,26-45岁之间的客户平均ARPU值处于相对稳定的高位。,C公司活跃客户分布客户数量与收入占比(CDMA),7.网内活跃客户分析,活跃客户取值样本:2004年7月至9月CDMA网连续在网出帐用户467284人。CDMA网活跃客户平均ARPU值为120.59元。,C公司活跃客户分布客户相对价值与人数分布(CDMA),7.网内活跃客户分析,活跃客户取值样本:2004年7月至9月CDMA网连续在网出帐用户467284人。相对贡献价值出帐收入占比客户数量占比CDMA网活跃客户平均ARPU值为120.59元。,C公司活跃客户分布客户在网时间与ARPU值分布(CDMA),7.网内活跃客户分析,活跃客户取值样本:2004年7月至9月CDMA网连续在网出帐用户467284人。CDMA网活跃客户平均ARPU值为120.59元。其中在网18个月以上的客户共计75037人,占活跃客户数量的16.06%,平均ARPU值178.67元。,C公司活跃客户分布客户入网时间分布(CDMA),7.网内活跃客户分析,取值样本:2004年7月至9月CDMA网连续在网出帐用户467284人。这些用户均为2004年6月以前入网的用户。,C公司活跃客户分析总结(CDMA),通过对CDMA活跃客户的分布发现:CDMA活跃客户数占全部CDMA出帐客户数的63.24%。CDMA活跃客户出帐收入全部CDMA出帐收入的77.51%。CDMA活跃客户平均ARPU值为120.59元。客户分布明显向低端倾斜,中位数ARPU值与ARPU值均值相差35元之多。四分位距为140元-60元=80元。平均ARPU值400元以上高端客户的占比为2.77%。在网时间在12个以上的客户ARPU值明显高于其他客户。这表明CDMA在初期发展的客户平均价值要高于后期发展的客户平均价值。,7.网内活跃客户分析,C公司活跃客户总体分布(GSM),最终选取的样本数量:893263人。GSM网活跃客户占全部出帐GSM客户的比率893263188094347.49%GSM网活跃客户出帐收入占比76.80%样本选择要求:连续三个月在网出帐用户(2004年7月、8月、9月)最近三个月出帐记录没有零出帐及零次话情况排除公免套餐等特殊套餐用户数据筛选过程:2004年7、8、9月出帐客户数1880943人排除零出帐用户737947人排除零次话用户177276人排除789月份入网客户72457人活跃客户样本数893263人,7.网内活跃客户分析,C公司活跃客户总体分布(GSM),几个重要的值,7.网内活跃客户分析,C公司活跃客户分布客户数量与收入占比(GSM),7.网内活跃客户分析,活跃客户取值样本:2004年7月至9月GSM网连续在网出帐用户893263人。活跃客户占GSM全部出帐用户的比率893263188094347.49%GSM网活跃客户平均ARPU值为61.89元。,C公司活跃客户分布客户在网时间与客户数分布(GSM),7.网内活跃客户分析,活跃客户取值样本:2004年7月至9月GSM网连续在网出帐用户893263人。GSM网活跃客户平均ARPU值为61.89元。,C公司活跃客户分布客户在网时间的客户数分布(GSM),7.网内活跃客户分析,活跃客户取值样本:2004年7月至9月GSM网连续在网出帐用户893263人。GSM网活跃客户平均ARPU值为61.89元。,8.1 网内客户价值评分规则,网内客户价值评分的目的:对网内客户进行评分的主要目的是通过评分规则来对网间的通话进行加权分析,期望通过这样的分析能够分离并反应出较多的高端客户通话行为网内客户价值评分的基本原则:定义网内价值评分的规则有很多种,本项目在定义网内客户群价值评分进综合 考虑了客户收入贡献占比与客户数量占比相结合的方式基本原则一:客户群的价值应当与客户的收入贡献占比与客户数量占比的比例正相关。基本原则二:基准客户的收入贡献占比与客户数量占比的比例为一比一。基本原则三:为了分离特定的客户群,对客户进行价值分段时,可以向相应的客户群进行偏移。,8.定义价值评分规则,8.2 客户价值分类系数确定时考虑的因素,在确定客户价值分在系数时一般需要考虑以下几个因素:客户ARPU值在网时长分段ARPU值的客户数量分布移动消费频率/次数移动消费量确定ARPU值的划分原则,需要考虑客户群的分布实际的方法:通过客户价值分布来 确定客户群的比例和ARPU值的选择,8.定义价值评分规则,8.3 网内客户分析获得的几个重要数据,考虑到目标客户群是世界风用户,因此对C公司网内客户进行价值评分时主要以C网客户的分析为主,同时也综合考虑了G网的客户分布情况。对网客户进行价值评分时综合考虑的几个关键指标值如下表所示。,8.定义价值评分规则,8.4 网内客户价值评分基准分段,通过分析,对于C公司网内客户评分按照以下规则选择以下相应的8个基准点,相应基准点的价值系数分别为0.5分,1分,2分,3分,4分,5分,6分,7分。,8.定义价值评分规则,8.5 网内客户价值评分基准分段,通过前述8个基准点,将C公司网内客户评分按照以下规则分为九段,相应的价值系数评分从0.5分至7分。,8.定义价值评分规则,8.6 网内客户价值评分,相应区间的客户价值评分,通过其ARPU值进行线性差值进行计算。例如1:某客户的ARPU值为50元,该客户处于分段2内,位于ARPU值分段点40元和60元之间,该客户的ARPU值对应的V系数为0.75。具体的计算方式为0.50+(50-40)/(60-40)(1-0.5)=0.50+0.25=0.75例如2:某客户的ARPU值为150元,该客户处于分段6内,位于ARPU值分段点140元和190元之间,该客户的ARPU值对应的V系数为4.20。具体计算为:4+(150-140)/(190-140)(5-4)=5+0.20=4.20,8.定义价值评分规则,8.7 网内客户价值评分详表一,8.定义价值评分规则,8.8 网内客户价值评分详表二,8.定义价值评分规则,C公司活跃客户分布客户价值系数分段分布(CDMA),活跃客户取值样本:2004年7月至9月CDMA网连续在网出帐用户467284人。相对贡献价值出帐收入占比客户数量占比CDMA网活跃客户平均ARPU值为120.59元。,8.定义价值评分规则,C公司活跃客户分布客户相对价值与人数分布(GSM),7.网内活跃客户分析,活跃客户取值样本:2004年7月至9月GSM网连续在网出帐用户893263人。活跃客户占GSM全部出帐用户的比率893263188094347.49%GSM网活跃客户平均ARPU值为61.89元。,9 网间通话评分规则,对于网间外网数据的按照如下的规则确定其网间客户联络价值:统计出每一网间对方号码与网内用户的详细通话明细(统计周期为2004年7月-9月连续三个月),计算出每一次通话的计费时长;确定网内客户的平均ARPU值,应用网内客户价值系数对照表,获得网内客户的价值系数;对于每一网间对方号码,将每一次通话的计费时长乘以联络客户的价值系数,并按总的计费时长进行加权平均,即可获得网间客户的联络价值系数。具体公式如下:,9.网间客户通话评分,9 网间通话评分的注意事项,应用前述规则对于网间通话行为进行评分时,需要注意以下事项:目前采集的网间数据主要是网间本地通话行为,其评价依据的主要是本地网内客户的相对价值系数,因此主要用来评价网间对方号码的本地移动网间通话行为。网间采集到的一部分数据是网内客户在漫游状态下与本地网间对方号码发生的通话行为,这些通话可以是漫游或长途通话,这些通话与本地网间的通话行为相比,应当有着更为重要的意义,在我们定义的评分规则中,并未区分此类行为。目前在试点地市的分析中并未采集到网间的漫游通话数据,即使采集到这些数据,也主要是发生在对方号码与异地网内用户之间的通话,而异地网内用户与本地网内用户可能有着不同的特征,不能应用同样的评分规则来评分。,9.网间客户通话评分,10 网间客户数据分析的基本项目,网间对方号码采集的数据进行评分后得到的汇总数据包括以下基本项目:主被叫次数主被叫号码数主被叫时长主被叫计费时长主被叫价值系数主叫次数主叫号码数主叫时长主叫计费时长主叫价值系数被叫次数被叫号码数被叫时长被叫计费时长被叫价值系数,10.网间通话数据分析,10 网间客户数据汇总实例(按通话次数统计),对于网间对方号码进行评分后的数据汇总统计如下:,10.网间通话数据分析,10 网间客户数据分析的辅助项目,以下一些项目有时也会在分析中用到,主要用来判断网间数据的特性:平均通话时长平均通话次数号码集中度号码集中度=通话次数最多的30%的号码通话时长占总通话时长的比例时长集中度时长集中度=通话时长最长的30%的号码通话时长占总通话时长的比例呼叫集中度呼叫集中度=通话次数最多的30%的号码通话次数占总通话次数的比例将以上这些项目也都应按照主被叫、主叫、和被叫分别进行统计。,10.网间通话数据分析,10 网间采集的对方号码数据统计,对于网间对方号码按计费时长进行的汇总统计如下图所示。可以看出,超过41%的网间对方号码通话计费时长小于20分钟。而网间通话计费时长在150分钟以上的样本占15%左右。,10.网间通话数据分析,*采集的网间样本总数为4047756,网间对方号码通话统计分析(网间对方号码主叫),客户联络价值系数,奇怪的家伙,网间联通被中计费时长(主叫行为的用量大小),低,低,高,高,潜在目标营销客户(中高端),信息不足,潜在的目标营销客户(中低端),最高的这一部分客户需要注意有可能是特殊的号码、如公话用户,或是极高的竞争对手本地包月用户。,网间主叫通话低的客户并不一定是移动通信的低端客户,但表明其与网内用户的主动联络 很少,网内客户群对其吸引力很小。,这部分客户的网间主动通话行为很少,但客户联络价值很高,需要结合其他指标和营销测试进行更准确的定位,10.网间通话数据分析,这类客户的通话量较大,但是客户联络价值较低,这类客户占样本比例较少,是高端客户的可能性较低。可以结合平均通话时长、平均号码通话次数等进一步分析。,10 网间客户汇总分析时应进行的清洗,缩小分析样本网间共采集出本地竞争对手号码达404万之多,而其中可能符合高端目标营销客户的样本数量大约仅有5%左右。减小分析样本直接方式是设定相应的筛选条件,缩小分析样本。如将三个月累计网间通话次数小于10次,网间联络号码小于5个,通话计费时长小于30分钟的数据排除,不进一步进行分析。通话时长网间客户汇总统计发现,有部分网间号码的话务量非常之大,这些异常值的号码往往有着特定的意义,一般不属于正常营销的目标客户号码,需要单独提取出来进行分析。累计通话时长较小的客户需要结合通话次数来观察,如果通话次数也少,应当排除。平均通话时长正常客户的平均通话时长在1-20分钟之间。对于累计通话时长较长的客户,可以结合平均通话时长来进行分析。,10.网间通话数据分析,10 网间客户汇总分析时应进行的清洗,通话次数网间采集到的一些号码通话次数非常大,超出了正常值,一般说正常的月通次数在100-