河南公司垃圾短信治理工作介绍.ppt
《河南公司垃圾短信治理工作介绍.ppt》由会员分享,可在线阅读,更多相关《河南公司垃圾短信治理工作介绍.ppt(25页珍藏版)》请在三一办公上搜索。
1、河南公司依托经营分析系统支撑垃圾短信治理工作介绍,2011年4月,目 录,应用效果,下步工作,一、现状及问题:垃圾短信发送手段多样化给治理工作带来严峻挑战,以低频发送代替高频发送群发器发送影响面积较大,谐音和字符间隔逃避拦截由涉黄涉黑转向广告宣传,内容隐蔽,手段多样,信息安全担忧,客户满意度降低,随着垃圾短信打击力度的不断加强,垃圾短信发送的内容趋向隐蔽化、手段趋向多样化,简单地利用关键字、短信条数限制等手段已经不能满足治理需求,需要进一步加强垃圾短信息治理工作的支撑。,2010年9月11日至17日一周内确认的垃圾短信号码有4517个,其中约30%即1317个是通过举报确认的。,2010年1-
2、5月客服中心经人工审核数据368797条,其中误拦进入人工审核环节量高达96.95%。,10年2月20日至26日一周内进入人工审核的平均号码数为574,其中约有30%当天没能经过人工审核。,问 题,现 状,投诉压力增大,舆论压力增大,目前只有针对垃圾短信发送的拦截机制,需要进一步加强群发器治理、资费和渠道管理等源头治理工作。,漏拦号码量大,误拦信息严重,人工压力大,源头治理不足,同一位置,多个号码,同时发送,垃圾短信,二、解决方案(模型):依托经分系统构建垃圾短信识别模型打造垃圾短信综合治理体系完善垃圾短信治理机制,垃圾短信预测模型,群发器识别模型,在网=2月用户,在网 2月用户,逻辑回归预测
3、模型,决策树预测模型,在确认垃圾短信的基础上,STP1:从基本属性、短信行为、通话行为、费用行为四个维度出发,共设计93个指标,STP2:经过特征建模分析、双变量分析、相关和自相关分析等方法筛选建模指标变量后,剩余65个建模指标,STP3:通过建模算法计算每个用户可能发送垃圾短信的倾向值得分,分值越大风险越高,STP1:从业务知识入手,确认发送短信集中位置,STP2:运用技术手段细分嫌疑用户,STP3:回归业务知识,最终筛选疑似群发器清单,确定疑似群发器所在小区位置,经分系统垃圾短信识别模型,解决方案(应用):联合相关部门建立垃圾短信拦截工作机制,实现分级分层拦截,提升拦截效果,替代原模型高危
4、用户,对全网用户进行分级分层监控,高风险用户:设置高风险用户黑名单门限和高风险用户灰名单门限,普通用户:设置大众化拦截门限,依托经分系统,为网管中心短信监控系统提供各类型用户名单,分级:区分高风险用户和普通用户分层:对于高风险用户设置黑名单拦截门限和灰名单拦截门限,同一位置,多个号码,同时发送,垃圾短信,三、整体框架:以垃圾短信预测模型及群发器识别模型为抓手,完善垃圾短信治理机制,强化经分系统支撑能力,打造垃圾短信综合治理体系完善垃圾短信治理机制,垃圾短信预测模型,群发器识别模型,数据准备,数据抽取,数据挖掘宽表短信集中位置信息表,在网=2月用户,在网 2月用户,逻辑回归预测模型,决策树预测模
5、型,基本属性日短信行为,月短信行为上月通信行为,当天短信行为,在预测并确认垃圾短信号码的基础上,构建群发器识别模型,发送短信量、回复短信量、短信回复率发送短信对端人数、回复短信人数、人数回复率省内、省外号码分布条数、占比省内、省外号码分布人数短信分布集中时段集中时段短信数量集中时段对端人数集中时段人均发送量集中时段9位连号最大值集中时段8位连号最大值集中时段7位连号最大值集中时段9位连号总和、占比集中时段8位连号总和、占比集中时段7连号位总和、占比三天内集中时段个数三天内集中时段分布天数,短信行为(52),垃圾短信用户识别指标体系(93),基本属性(7),年龄性别地区入网时长入网渠道品牌套餐包
6、含短信数,主叫时长被叫通话时长主叫通话时长占比被叫通话时长占比主叫次数被叫次数发送短信数量接收短信人数人均发送短信量交往圈人数有效交往圈人数有效交往圈人数占比,通话行为(24),ARPU通话费用通话费用占比短信费用短信费用占比,消费行为(10),短信行为中指标没有特殊标明的均为前三天和当天两个指标,对于在网时长大于等于两月用户,通话行为、消费行为都为上月指标;对于在网时长小于两月用户,通话行为、消费行为都为日均指标,(垃圾短信预测模型)建模基础:依托经分数据,全面构建垃圾短信用户识别指标体系,构建全面且能够反映特征的识别指标体系,是建立垃圾短信预测模型的基础,依托经分系统用户数据,深入挖掘并梳
7、理垃圾短信发送特征,从四个维度建立包含93个指标的垃圾短信用户识别指标体系。,粗,细,建模准备阶段共采用了4种分析方法来筛选建模变量,从上到下是从粗到细的一个筛选过程。建模指标体系中共93个指标变量,经过4步筛选后,剩余65个指标可用于构建模型。,垃圾短信号码套餐包含短信条数120以上人数比重大,约占45%,垃圾短信号码被确认前3天未发送短信人数比重小,占36%;早8点至晚8点间为发送短信高峰时段的人数比重很大,占47%。,(垃圾短信预测模型)建模准备(例):建模准备阶段共采用了4种分析方法,从粗到细,来筛选建模变量,(垃圾短信预测模型)建模算法:分别采用决策树算法、逻辑回归算法建模,比较模型
8、效果,采用效果更好模型,决策树预测模型,逻辑回归预测模型,决策树是以实例为基础的归纳学习算法,它着眼于从一组无次序、无规则的实例中推理出以决策树表示的分类规则。它采用自顶向下的递归方式,在决策树的内部节点进行属性的比较,并根据不同属性值判断从该节点向下的分支,在决策树的叶节点得到结论。,也称定性变量回归,类似于线性回归,但是目标字段使用字符型字段而不是数值型字段。Logistic回归建立一组方程,把输入属性值与输出字段每一类的概率联系起来。一旦生成模型,便可用于估计新记录属于某类的概率。概率最大的目标类被指定为该记录的预测输出值。,决策树算法、逻辑回归算法,是建立预测模型的两种常用算法。二者各
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 河南 公司 垃圾 短信 治理 工作 介绍
链接地址:https://www.31ppt.com/p-2314705.html