基于客户全息信息的垃圾短信挖掘及套利链监控系统(1).ppt
《基于客户全息信息的垃圾短信挖掘及套利链监控系统(1).ppt》由会员分享,可在线阅读,更多相关《基于客户全息信息的垃圾短信挖掘及套利链监控系统(1).ppt(36页珍藏版)》请在三一办公上搜索。
1、中国移动科技创新成果推广材料,完成单位:省公司业务支持中心,成果名称:基于客户全息信息的垃圾短信挖掘 及套利链监控系统,01,成果研究类别:其他,省内评审结果:,成果专业类别:业务支撑,目录,4,技术实现方案,3,关键点、难点和创新点,1,项目背景和意义,2,成果应用情况及效益,项目推广方式建议,项目推广投资和软硬件需求,5,6,垃圾短信治理已势在必行!,如何改善客户感知?垃圾短信严重的干扰了用户的正常通信生活,造成客户服务质量下降,客户关系出现前所未有的危机,如何树立良好的企业形象?08、09年,央视“3.15”晚会连续曝光垃圾短信事件,引起社会强烈反响媒体及社会舆论把运营商推上了 风口浪尖
2、,如何快速、长效治理?集团公司要求全面、有效整治垃圾短信广东公司作为集团试点,全面探索垃圾短信治理的模式经验,客户感知下降,社会舆论压力大,集团公司严格要求,在移动通信市场快速发展的同时,垃圾短信问题日益凸显,危害性愈发严重。垃圾短信已成为影响企业形象的重要负面因素,如何以客户导向,有效治理垃圾短信,提升服务质量,维护稳定的客户关系成为我们亟需解决的问题。,解决之道基于客户全息信息的垃圾短信挖掘及套利链监控系统,渠道养卡识别 助力渠道监管 社会渠道违规批卡、倒卡为垃圾短信发送者获取卡号资源提供了便利,是垃圾短信产生的重要原因之一,因此经分在事前进行渠道养卡的识别,从源头上杜绝垃圾短信。,垃圾短
3、信模型识别 基于经营分析系统中的客户属性、消费数据和消费行为分析等信息,构建垃圾短信号码识别模型,通过挖掘等相关技术,辅助垃圾短信号码识别。与网维拦截系统建立互动 输送垃圾短信疑似号码,提升垃圾短信拦截系统的效率和准确率,降低人工审核的压力和人力资源投入成本。,经分前端监控 利用垃圾短信黑名单,做好前端日常监控,包括垃圾号码关键指标监控、垃圾号码渠道分析与监控、垃圾号码资费监控等,为省公司以及地市的垃圾短信监控提供数据支持。垃圾短信套利链探索 借助经营分析系统的各类渠道明细数据,对垃圾短信号码的入网渠道集中度,欠费情况等进行分析,探索垃圾短信的套利链,为垃圾短信的渠道治理提供依据。,基于客户全
4、息信息的垃圾短信挖掘及套利链监控系统,利用经分系统强大数据仓库信息以及数据挖掘的能力,建立基于客户全息信息的垃圾短信挖掘及套利链监控系统,从事前预测、事中监控、事后分析三个方面助力垃圾短信治理工作。,事前,事后,事中,目录,4,技术实现方案,3,关键点、难点和创新点,2,项目背景和意义,1,成果应用情况及效益,项目推广方式建议,项目推广投资和软硬件需求,5,6,技术实现方案,广东公司原有的垃圾信息管理中心包括网维系统识别、10086999举报平台以及短信人工仲裁三部分。本系统借助省经营分析系统先进的数据挖掘技术以及强大的数据库资源,利用客户的全息视图,加入到垃圾信息治理的长效工作机制中,以辅助
5、网维垃圾短信拦截系统的识别准确度,减少人工仲裁的成本,为垃圾信息治理工作提供精准的数据支持。,基于客户全息信息,建立垃圾短信高效治理体系,垃圾号码整体分析,品牌,渠道养卡识别,垃圾号码识别,入网时长,渠道,ARPU,发送量,发送模型,对方号码连号,探索垃圾短信的发送模式建立预警机制,发掘垃圾短信的运营模式从源头上解决问题,用机类型,短时间内发送量分析,发送连号分析,对方号码回复分析,与对方号码通信分析,入网时长分析,。,垃圾号码识别模型,渠道商,SP商,不法垃圾短信商,欠费分析,孖卡分析,IMEI分析,酬金分析,低资费套餐,.,垃圾号码黑名单文件,关键业务指标系统跟踪监控,阈值设置,客户基本资
6、料,账单资料,清单资料,套餐资料,渠道信息,系统监控,事中,事前,事后,渠道运营模式分析,渠道整治,与网维建立互动机制,渠道处罚,建立渠道养卡模型,从源头杜绝垃圾短信,社会渠道违规批卡、倒卡为垃圾短信发送者获取卡号资源提供了便利,是垃圾短信产生的重要原因之一,因此经分在事前进行渠道养卡的识别,从源头上杜绝垃圾短信。,不法社会渠道商,大量号码卡没被实际卖出,而是被“养”起来,向移动公司制造号码卡被购买和使用的假象,利用养卡获得非法利益:如:套取酬金,获得SP分成金额;获得移动赠送话费或其他实物赠送。还可能为垃圾短信商提供低价格的号码资源,为不法垃圾短信商提供便利!,目标:识别出真正的渠道养卡号码
7、,将这些养卡号码排除在营销优惠之外,减少垃圾短信获利的空间;打击为垃圾短信发送者获取卡号资源的渠道商。,渠道养卡模型建模方法,本方案采用标准的K-means簇聚分类算法将正常用户和养卡号码划分开,其中模型输入变量如左图。算法的数学描述如下:,可取K8,根据具体用户构成的复杂情况进行变动,复杂性高的就选取更在的K值。经过簇聚分类后,每类的用户有几种情况:养卡号码、主流用户、低质用户、特高质用户等。结果如下:,1假设要聚成K个类。随机决定K个类中心Z1(1),Z2(1),.,Zk(1)。2在第k次叠代中,样本集Z用如下方法分类:对所有i=1,2,.,K,ij 若 则3令由2得到的Sj(k)的新的类
8、中心为Zj(k+1)令 最小。j=1,2,.,K 则。对于所有的j=1,2,.,K,若Zj(k+1)=Zj(k),则终止。否则goto 2,输入:类数K;表1上述的养卡数据表。输出:K个集合Si,i=1,2,.,K,是第i类里面的用户集合。过程:,渠道养卡模型模型结果,找出的养卡号码和实例如下:,模型效果:根据某市公司试点情况:识别出养卡代理商数量提升8.7倍,养卡号码数量提升5.3倍,从上表可见,arpu和imei是两个维度,展现用户群的分布:,正常用户的消费较高,并且不同用户的消费有较显著的差异,反之养卡群的用户消费较低。正常用户都很少换手机,而且不会与很多人共用手机,反之养卡群使用相同I
9、MEI频次较高。,获中国国家知识产权局受理专利:养卡识别方法及系统(专利申请号:200910241567.7),建立垃圾号码识别模型,做好事中监控,垃圾号码特征:动感地带占比最高:达56.24%;新用户占比高:在网时长70%在2个月以内;主要来源于社会渠道:其中来自“特约代理点”和“指定他营厅”这两个渠道的号码占比分别为41.9%和39%;,根据垃圾号码黑名单,进行垃圾号码特征探索分析 分析的样本数据取自省客户服务中心在20100524-20100619时间窗口内被客户投诉的短信为垃圾短信,对应的发送号码为垃圾号码。,垃圾号码识别模型特征分析,垃圾号码特征:小部分以号段来批量发送,约占34%。
10、向一个对端号码发送一条短信:将近80%的垃圾号码的人均发送短信条数等于1条。语音活跃度低:76%以上无语音通话,远高于全省网聊卡14.17%的无语音通话。,注:连号是取号码的前9位,如果发送的号码前9位相同,则认为发送对象是连号,垃圾号码识别模型模型构建,建立模型:本方案选取了决策树模型来识别垃圾号码。使用被客户投诉发送垃圾短信的号码为垃圾号码,将垃圾号码与随机号码按1:20的比例进行建模,数据按照(6:4)分成训练集和测试集来构建、评估模型。其中模型输入变量如左图所示。,评估模型:考核模型的查准率和查全率。其公式如下:查全率=模型输出的真实垃圾号码数/垃圾号码样本总数 查准率=模型输出的真实
11、垃圾号码数/规则输出的总号码数模型跑数的运行时间是考核模型应用的重要指标。,垃圾号码识别模型模型结果,决策树的最终结果如下(部分结果):,查全率:垃圾号码数占比查准率=节点判断正确的号码数/该节点总号码数1:判断为垃圾号码0:判断为非垃圾号码,在网时长,查全率=9%,查全率=91%,=50天,50天,查全率=3%,入网时长=27,入网时长27,查全率=4%,查全率=3.3%,查全率=2%,短信发送量100条,短信发送量100条,短信发送量100条,查全率=0.40%查准率=0.987,查全率=1.2%,查全率=0.38%查准率=0.984,1,1,查全率=0.75%查准率=0.990,主叫时长
12、=10分钟,1,查全率=4%,查全率=2.78%查准率=0.990,主叫时长=20分钟,1,短信发送人数94人,查全率=0.46%查准率=0.992,查全率=1%,查全率=0.59%,主叫时长=10分钟,人均短信发送量=1条,1,1小时短信发送量的最大值=50条,1小时短信发送量的最大值50条,查全率=1.8%,1小时发送量大于10的频次2次,查全率=0.8%,主叫时长=10分钟,短信发送人数=94人,查全率=90%,主叫时长=10分钟,人均短信发送量=2条,查全率=1%,人均短信发送量=1条,查全率=3.1%,查全率=0.6%,人均短信发送量=1.2条,查全率=0.5%,人均短信发送量=1.
13、2条,垃圾号码识别模型模型结果,模型评估:,按照决策树叶子的层次,可以总结出识别规则,一天内满足下述任何一个规则都可以判断号码为垃圾号码,模型应用:全省21个地市一天的清单量:约20亿条记录 跑数时间:1小时15分,与网维拦截系统建立交互机制,2010年11月根据省网维垃圾短信拦截系统的黑名单信息,对垃圾短信识别模型进行优化,并将优化后的短信号码文件发送给拦截系统。,2010年10月接入省网维垃圾短信拦截系统7个接口信息,2010年9月根据垃圾短信识别模型,下发疑似垃圾短信号码文件给省网维垃圾短信拦截系统,每日疑似号码量为6000个,省经分系统于2010年9月开始下发疑似垃圾短信号码文件,与省
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 客户 全息 信息 垃圾 短信 挖掘 套利 监控 系统

链接地址:https://www.31ppt.com/p-2284375.html