应用平台建设策划书(四川).doc
四川电信景区客流分析应用平台建设项目方案建议书北京中创信测科技股份有限公司版权所有 不得复制2013年12月目 录第 1 章 综述31. 1 建设背景31. 2 总体建设目标3第 2 章 总体方案建议42. 1 应用平台概述42. 2 系统描述52. 3 系统构架5第 3 章 方案说明63. 1 平台功能模块说明63. 1. 1 数据处理63. 1. 2 景区常驻用户分析73. 1. 3 旅游线路归类统计73. 1. 4 景点用户快照分析73. 1. 5 景点流量综合分析73. 1. 6 游客驻留时间分析83. 1. 7 景点监控提醒模块83. 1. 8 数据管理83. 2 业务处理流程说明83. 3 配置方案93. 3. 1 硬件配置方案93. 3. 2 软件配置方案15第 1 章 综述1. 1 建设背景“两化融合”是指信息化和工业化的高层次的深度结合。当前,“两化融合”和行业信息化处在转型和提升的关键时期,依据国家加快现代服务业发展的相关精神,作为重要的服务业,旅游行业服务单位和监管单位对基础调查和统计创新方面的需求关注度正在不断提升。四川省作为全国旅游资源较为丰富的地区之一,拥有许多得天独厚的旅游业发展优势,截至XXXX年底,全省共有5A级景区X个,4A级景区X个,此外还有大量文化旅游,工业旅游景区正在逐步的开发和利用。根据省旅游局对游客规模的预测,全省每天广义游客流量达XX万人次以上,游客数量年增长率约X% ,潜在客户规模十分庞大 。目前四川省在旅游景区流量监控、预警和调度、旅游产业能力规划、需求预测方面面临一些发展瓶颈。十一长假期间,各旅游景区都出现了较严重的流量超限、大量游客滞留等问题,不仅带来诸多安全问题,对旅游品质的影响也较大。因此,迫切需要建设一套景区游客流量监控分析系统,提供游客流量实时监控分析,游客来源地分析,流量告警等功能,为各旅游景区管理部门及商业机构提供游客流量监控与预警功能,更有针对性的应对游客流量的峰谷期,为游客提供更高质量的服务,提升四川省旅游服务的整体品质。电信运营商公司不仅拥有丰富的移动网络信令数据资源和庞大客户群的优势,同时也具备丰富的项目建设经验,完全有能力完成本项目的建设。平台建成后,通过与各旅游景点管理部门及商业机构的合作,有助于创造更多的商业机会,同时能够提高电信运营商公司的服务价值,产生巨大的社会效益和经济效益。1. 2 总体建设目标本期工程将建设一套统一的动态游客信息行业应用平台,平台将周期性地从信令集中采集系统中获取信令数据并进行预处理,利用移动通信基站与景区空间场所对应关系,建立移动信息与实体世界关联,在此基础上,通过智能建模从统计上精确的把握用户与旅游资源的时空关联,进一步进行各种方式的信息整合和发布。本期工程建设的动态游客信息行业应用平台需要实现监控信息在平台门户网站的展示,并可将监控信息数据通过多种形式(如:PDF、EXCLE等)导出。根据四川电信运营商公司前期的需求调研结果,本平台的潜在用户为四川省内相关景区及相关的旅游产业运营与管理部门,表示出需求意向的客户为X个,考虑到部分用户的相关业务需求及意愿存在不确定性,因此,本期动态游客信息行业应用平台建设规模满足20个景区及相关的旅游产业运营与管理部门的监控需求。第 2 章 总体方案建议2. 1 应用平台概述本期工程动态游客信息行业应用平台逻辑组网结构如下:图 动态游客信息行业应用平台逻辑组网示意图运营商公司目前已建有综合信令采集平台,可由信令采集平台内部的信令数据共享管理平台对外提供信令数据。对于动态游客信息行业应用平台所需的原料数据将通过应用平台同综合信令采集平台之间的接口处获得。动态游客信息行业应用平台中的批量数据采集模块通过网管DCN网络与综合信令采集平台中的信令共享子系统对接,从而实现动态游客信息行业应用平台周期性地从信令共享子平台批量采集信令数据的功能,并对原始性数据进行预处理。2. 2 系统描述本系统是建立在四川省移动通信网络信令采集数据基础上,经过对手机信令数据的清洗、过滤、统计、聚类、分析和加工,为四川省境内旅游景点、交通枢纽以及旅游商家/商圈提供精确、科学、详细、实用的游客数据与信息服务。核心统计功能主要包括旅游景点游客流量实时统计、旅游景点游客总量实时统计、景点游客密度统计、游客滞留时间统计,深度分析管理功能包括景点热度分析、景区流量上限告警、景区流量预判和短信疏导等功能。2. 3 系统构架系统采用三层构架分为数据采集层、数据处理层和应用呈现层,每一层采用模块化设计,根据处理入境游客数据量的要求,平滑扩展软硬件模块,满足处理能力的需求。构架说明:1、 采集层负责从信令监测系统获取移动用户在移动网络中拨打、接听电话,收发短信,开关机,位置变动等信息,生成信息完整的用户记录传递给处理层进一步详尽的分析处理。2、 数据处理层负责对景区内发生的用户记录进行筛选,通过游客流量实时分析引擎实时统计进入景区的游客数量,并将统计结果保存到数据仓库中。游客总量累计引擎针对景区内活跃的游客建立内存数据库,在内存中实时存储游客个人信息和位置信息(以CellID为单位),实时统计景区内的游客总量,并将统计结果保存到数据仓库中。景点热度分布统计引擎依托内存数据库,统计各个景点中游客的数量,产生热度分布,并将统计结果保存到数据仓库中。3、 应用层采用B/S方式呈现系统中核心的统计功能和深度分析管理功能,核心的统计功能主要包括景区常驻用户分析、旅游线路归类统计、景点用户快照分析、景点流量综合分析、游客驻留时间分析、景点监控提醒等功能。第 3 章 方案说明3. 1 平台功能模块说明3. 1. 1 数据处理 通过网管DCN网络与综合信令采集平台中的信令共享子系统对接,从而实时地从信令共享子平台接收信令数据(CDR),并根据业务处理的需要进行预处理,裁剪需要的字段信息,丢弃不需要的字段信息。根据游客信息行业应用平台业务处理的需要,信令数据(CDR)类型如下:编号CDR名称CDR说明裁剪后的字段信息1bssap_mm_cdr2G网络A接口位置更新记录业务发生的时间、IMSI、LAC、CI2ranap_mm_cdr3G网络Iu-cs位置更新记录业务发生的时间、IMSI、LAC、sac3gmap_mm_cdrMAP位置更新记录IMSI、MSISDN、HLR GT、VLRGT实时接收裁剪过的各种CDR记录,通过IMSI实时进行关联和整合,整合出游客基本信息(包括IMSI、手机号码、IMEI、HLR_GT)、最新活跃的位置信息(LAC、CI/sac),并根据号段、各省HLR GT信息匹配出人员归属省,根据移动通信基站(lac、ci/sac)与景区空间场所对应关系匹配出游客活跃的地域或景区,最后将整合后的游客信息存储在平台服务器的内存中,并将整合后的游客信息输出供后续模块继续处理,输出记录字段包含IMSI、手机号码、IMEI、最新业务时间、LAC、CI、上一次拜访区域、当前拜访区域。游客信息表结构如下:含义类型ImsiIMSIStringMsisdn手机号码StringIMEIIMEIStringhlr_city归属省unsignedShortstart_time最新业务时间dateTimeLac最新业务发生LACunsignedShortci/sac最新业务发生CI/sacunsignedShortactive_region当前拜访区域、景区string3. 1. 2 景点流量综合分析(先期完成)根据地市、景区、景点进行实时人数监测,统计出各个地市、景区、景点的人数监测。实时查询当前情况,也可以查询当天累积流量情况,支持跨时间段多天查询。外省来川游客统计软件模块:以四川省为统计单位,统计外省游客总量、游客来源地及来源地人数;以各市州为统计单位,统计外省游客量、游客来源地及来源地人数省内游客统计软件模块以四川省为统计单位,统计省内游客总量、游客来源地及来源地人数;以各市州为统计单位,统计省内游客量、游客来源地及来源地人数景区/景点游客统计软件模块以景区/景点为统计单位,统计外省、省内游客总量、游客来源地及来源地人数3. 1. 3 景区常驻用户分析 统计景区内常驻人口数。3. 1. 4 旅游线路归类统计根据对典型旅游线路的关联分析,对主要的旅游线路进行归类汇总,并依据降序排列的方式提供排名结果,包括线路出发景点游客数量、线路目的景点游客数量、路线流量。3. 1. 5 景点用户快照分析抓取特定景点特定时间段出现的游客,分析游客来源、游览路径。3. 1. 6 游客驻留时间分析根据地市、景区、景点进行游客驻留时间实时人数监测,统计出各个地市、景区、景点游客驻留时间。统计出各个地市、景区、景点在某时间段内达到一定驻留时间的游客人数统计。3. 1. 7 景点监控提醒模块实现实时读取景区实时、来源、驻留游客天统计表中各个景区的游客数量,及综合指标搭配,对比各个景区的容量上限设定,达到一定比例后,根据客流预警情况,下达流量警告,并根据制定的工作流程启动应对处理机制。通过平台上的接口功能和信息定制能力,及时编辑警告内容并下发短、彩信网关等进行告警信息的及时发布3. 1. 8 北向接口 为第三方系统提供用户位置信息数据,包括时间、用户号码、LAC CI,可通过用户归属、拜访市州过滤。3. 1. 9 数据管理定期按日、周、月、季、年为维度统计数据库中的的景区实时游客记录表、景区累计游客统计表,并分别保存到景区周、月、季、年累计游客统计表。同时对于2年之前的统计数据进行定期删除。数据维护功能实现对景区,景点、景点文化内容等系统基础数据进行在线编辑和管理。并维护号段、各省HLR GT信息与归属省的对应关系、维护移动通信基站(lac、ci/sac)与景区空间场所对应关系。3. 2 业务处理流程说明Ø 信令数据接收及预处理模块通过网管DCN网络从综合信令集平台中的信令共享子系统对接,实时游客位置更新信令数据,并将需要的字段进行裁剪后转给游客信息存储模块。Ø 游客信息关联处理模块根据号段、各省HLR GT信息扩展出人员归属省、根据移动通信基站(lac、ci/sac)与景区空间场所对应关系扩展出游客活跃的地域或景区,并根据IMSI为主键为每个游客建立内存节点,将每个游客IMSI、游客手机号码、IMEI、归属省、拜访景区等信息保存中内存中。如果内存中已经有游客的节点,则更新节点中的字段值,并输出IMSI、手机号码、IMEI、最新业务时间、LAC、CI、上一次拜访区域、当前拜访区域等信息给景区实时游客过统计模块处理。Ø 景区实时游客统计模块实时接收游客信息模块输出的记录,根据特定的过滤规则过滤出初次进入景区的游客信息。最后将过滤后的游客信息记录,统计分析后保存到景区实时游客天明细表中。保存的记录内容有IMSI、手机号码、进入时间、归属省、拜访景区,每隔离1小时统计一次各个景区内实时新增的游客数,并通过通用入库模块把统计数据保存到数据库的景区实时游客天统计表中。Ø 景区累计游客统计模块根据景区实时游客天明细表存储的游客数据,每隔离15分钟统计一次各个景区内存在的累计游客数(去除景区内常驻人口数)。统计数据包含景区、归属省、手机用户数量,并将统计的数据输出,由通用入库模块保存到景区累计游客天统计表中。Ø 景区监控提醒模块实时读取景区累计游客天统计表中各个景区的累计游客数量,对比各个景区的容量上限设定,达到一定比例后,产生告警信息,并将告警信息输出,通过告警信息发送模块、彩信发送模块进行告警信息的通知。Ø 数据库管理模块,定期按日、周、月、季、年为维度统计数据库中的的景区实时游客记录表、景区累计游客统计表,并分别保存到景区周、月、季、年累计游客统计表。同时对于2年之前的统计数据进行定期删除。Ø 其他统计分析模块根据数据仓库中的景区日、周、月、季、年累计游客统计表,根据自身的业务处理模型进行相关的统计分析。3. 3 配置方案3. 3. 1 硬件配置方案3.3.1.1 服务器配置方案本项目中所需的主要硬件服务器用途说明如下:服务器名称功能接口服务器接入中创信令监测系统传送过来的信令数据,并进行预处理数据处理服务器对预处理之后的用户信令数据进行进一步的处理,进行基础信令分析,和实现景区游客实时流量分析、游客总量分析和游客热点分析等分析功能数据库服务器为数据分析结果建立索引,并实现数据查询及检索WEB服务器实现系统功能部署的WEB操作,以及相应管理功能硬件配置要求如下:服务器配置汇总服务器类别服务器台数(单位:台)Cpu个数(单位:个)内存(单位:G)备注接口/web服务器1232数据处理服务器2464数据库服务器1464合计4存储配置汇总原始信令数据(T)统计数据(G)服务器挂载(G)冗余(G)存储需求1.3672010001000合计4.08T配置说明:接口服务器:接口服务器的主要功能是综合信令采集平台中的信令共享子系统对接,从而实时地从信令共享子平台接收信令数据(CDR),并根据业务处理的需要进行预处理,裁剪需要的字段信息,丢弃不需要的字段信息。本期工程配置1台2C/32GRAM的PC服务器。数据处理服务器:数据处理服务器根据接口服务器接收的数据完成游客信息存储处理、景区实时游客统计、景区累计游客统计以及其他业务逻辑处理。目前设计需求按照省内旅游用户数据省外旅游用户数量1000万用户的设计能力,服务器配置计算如下:平台数据分析服务器配置省内旅游用户数据省外旅游用户数量(万)1000 每个游客信息占用内存数量(字节)500每游客信息存储模块维护用户量(万)100每游客信息存储模块占有内存(100万用户)2实时游客统计模块占用内存资源(100万用户)1累计游客统计模块占用内存资源(100万用户)1其它应用模块处理占用内存资源(100万用户)2系统需要的内存数量GB(考虑40冗余)91 单台业务分析服务器提供的内存容量(GB)64需要服务器的数量(按内存)2 每100万游客信息存储模块占用CPU资源10.0%后台游客统计处理占用CPU资源15.0%其它统计模块处理占用CPU资源20.0%单台服务器处理用户数量(4CPU服务器,考虑40冗余,)1000 需要服务器的数量(按CPU)1 最终需要服务器数量(取按内存、CPU计算服务器数量最大值)2 根据以上计算,本期工程配置2台4C/64G的PC服务器作为系统的应用服务器。数据库服务器:数据库服务器主要存储短期信令数据以及2年内的统计数据,为数据分析结果建立索引,并实现数据查询及检索处理能力需求分析:数据库服务器配置省内旅游用户数据省外旅游用户数量(万)1000 每游客信息存储模块维护用户量(万)100统计模块处理占用数据库内存资源(100万用户)3数据仓库软件启动占用内存资源10系统需要的内存数量GB(考虑40冗余)56 单台业务分析服务器提供的内存容量(GB)64需要服务器的数量(按内存)1 每100万游客信息存储模块占用CPU资源10.0%数据仓库软件启动占用CPU资源15.0%统计模块处理占用CPU资源20.0%单台服务器处理用户数量(4CPU服务器,考虑40冗余,)1000 需要服务器的数量(按CPU)1 最终需要服务器数量(取按内存、CPU计算服务器数量最大值)1 根据以上计算,本期工程配置1台4C/64G的PC服务器作为系统的数据服务器。WEB服务器:WEB服务器主要提供将后台分析结果进行图表化、图形化、地图化展示,并支持WEB页面呈现,用户可依据景点名称及权限查询数据统计结果。本期工程有接口服务器兼做。3.3.1.2 存储配置方案存储需求要求如下:信令原始消息:保存30天统计数据:保存2年上述数据中,都存储在中心站磁盘阵列,另外服务器需要挂载阵列硬盘。l 原始信令数据:每天20000万条数据,每天数据250字节,30天数据量为:200000000*250*30/1024/1024/1024/1024=1.36TBl 统计数据:每30天统计数据大约30G,2年统计数据需要720G存储空间。l 服务器硬盘挂载:用于记录日志、存储缓存数据等。5类服务器共需要1T空间。原始信令数据(T)统计数据(G)服务器挂载(G)冗余(G)存储需求1.3672010001000根据本期数据量情况,满足上述存储要求所需磁盘空间共计4.08TB。3.3.1.3 硬件配置清单编号项目产品编号/型号产品描述数量一、硬件1.1服务器1.1.1服务器HP DL385p Gen82颗AMD皓龙8核 O6212处理器(2.6GHz/8核/16MB/115W);32G内存/2U机架式;4*300GB HDD;512M RAID卡;4*1000M 网口;2个HP 460W 通用高能能效电源11.1.2服务器HP ProLiant DL585 G74颗AMD皓龙8核 O6212处理器(2.6GHz/8核/16MB/115W);64G内存/4U机架式,512M RAID卡;4*300GB HD;DVD光驱;4*1000M口;4个HP 1200W 通用高能能效电源31.1.3HP HBA卡AE311A PCI-EHP StorageWorks PCIe 4Gb 主机总线适配器,单口 4GB光纤通道卡 for HP DL,LINUX操作系统.41.2存储1.2.1磁盘阵列EMC VNX5100VNX51D156015FVNX5100 DPE; 15X3.5 DRV-FLD INST 6X6001V31-DAE-N-153U DAE WITH 15X3.5 INCH DRIVE SLOTS1.2.2V3-VS15-600600GB 15K SAS DISK DRIVE51.2.3VNXFCSFPSADDITIONAL 8 G FC SFP FOR VNX 51/5311.2.4V13-PWR-32 C13 PWRCORDS W/ GB1002 PLUGS 250V 10A11.2.5VNX51-KITDOCUMENTATION KIT FOR VNX510011.2.6VNXSPSAS2ND OPTIONAL SPS FOR VNX 51/5311.2.7ESRS-GW-200EMC SECURE REMOTE SUPPORT GATEWAY CLIENT11.2.8UNIB-V51Unisphere Block & VNX OE VNX510011.2.9PS-PKG-LEBDVNX - BASIC INSTALL-IMPLEMENT BLOCK BoE Complete : YES 11.2.10M-PRESW-001PREMIUM SOFTWARE SUPPORTIncludes months 1-12 $ 37/mo.11.2.11WU-PREHW-001PREMIUM HARDWARE SUPPORT - WARR UPG11.2.12EMC光纤交换机 DS300B(16口)C13-PWR-32 C13 PWRCORDS W/ GB1002 PLUGS 250V 10A 电源线11.2.13DSBRLKT-BDSB SW GEN RCK KIT -B 通用机柜导轨11.2.14DS-300B-8GDS-300B 8/24P BASE SWITCH, 8口交换机,可扩展到24口11.2.15DS300B-8G8PUDS-300B 8G 8PORT UPGRADE KIT11.2.16WU-PREHW-001PREMIUM HARDWARE SUPPORT - WARR UPG11.3网络设备1.3.1CISCO三层千兆交换机WS-C3560G-24TS-SCatalyst 3560 24 10/100/1000T + 4 SFP + IPB Image(含一年服务)11.4安装材料1.4.1机柜中创信测19寸标准机柜13. 3. 2 软件配置方案本项目中软件配置如下:二软件2.1自产应用软件2.1.1景区常驻用户分析中创信测统计景区内常驻人口数12.1.2旅游线路归类统计模块中创信测根据对典型旅游线路的关联分析,对主要的旅游线路进行归类汇总,并依据降序排列的方式提供排名结果,包括线路出发景点游客数量、线路目的景点游客数量、路线流量。12.1.3景点用户快照分析模块中创信测抓取特定景点特定时间段出现的游客,分析游客来源、游览路径。12.1.4景点流量综合分析模块中创信测根据地市、景区、景点进行实时人数监测,统计出各个地市、景区、景点的人数监测。实时查询当前情况,也可以查询当天累积流量情况,支持跨时间段多天查询12.1.5游客驻留时间分析模块中创信测根据地市、景区、景点进行游客驻留时间实时人数监测,统计出各个地市、景区、景点游客驻留时间。统计出各个地市、景区、景点在某时间段内达到一定驻留时间的游客人数统计.12.1.6景点监控提醒模块中创信测实现实时读取景区实时、来源、驻留游客天统计表中各个景区的游客数量,及综合指标搭配,对比各个景区的容量上限设定,达到一定比例后,根据客流预警情况,下达流量警告,并根据制定的工作流程启动应对处理机制。通过平台上的接口功能和信息定制能力,及时编辑警告内容并下发短、彩信网关等进行告警信息的及时发布12.1.7数据接口中创信测提供用户位置信息记录数据,包括时间、用户号码、LAC CI12.2外购软件2.2.1数据库软件12.2.1.1数据库SybaseASE 15 (LINUX)12.2.1.2Sybase ASE(15)标准级服务,一年1软件小计三服务3.1集成费3.1.1设备安装费用中创信测硬件设备合同费用的3%13.1.2系统调测费用中创信测硬件和软件合同费用的2%13.2接入服务费3.2.1单个景区接入服务费中创信测开通景区管理员登陆系统的帐号,开通景区管理员的权限,配置景区覆盖的网络小区范围,对景区管理员进行操作培训。20配置说明: 根据本期平台的功能需要配置了相应的软件,详细清单请见上表。