电信计费系统毕业论文.doc
《电信计费系统毕业论文.doc》由会员分享,可在线阅读,更多相关《电信计费系统毕业论文.doc(48页珍藏版)》请在三一办公上搜索。
1、数据挖掘技术在电信计费系统中的应用摘要随着网络的高速发展,一些大型厂商推出了服务器出租这项业务。为了使得出租商快捷、方便以及高效的统计出用户的登录信息及应缴费情况,本文开发了一个电信计费系统。本系统采用C/S架构,在UNIX环境下以C+为主要的开发语言开发完成。客户端的功能包括定时从非结构型服务器日志文件采集用户数据,匹配登入/登出信息,向服务器发送数据;服务端的功能包括接收客户端发送过来的数据,存储数据和整合数据等。从海量用户数据中匹配登入/登出信息采用了数据挖掘技术,所提取到的有效计费信息存储在Oracle数据库中。关键词:电信计费系统;数据挖掘;数据匹配;数据整合 The Applica
2、tion of Data Mining Technology in the Telecom Toll SystemABSTRACTWith the rapid development of the network , some large companies such as China Telecom launched the server rent business. In order to statistic user login information and charge more fastly, conveniently and efficiently, a Telecom toll
3、 system is developed in this paper. This system is programmed by C+ language with C/S architecture in Unix operater system.The functions in client port include reading user information from unstructural log file ,matching data and sending data to a server;The functions in sever port include receivin
4、g data from client, data storage and integrating data. Data mining technology is used in the huge amount of data matching processing and all the resultful data are all stored in Oracle database. Keywords:the Telecom toll system ; Data mining ;Data matching ;Data integration 目录1 引言11.1课题来源及意义11.2国内外发
5、展状况11.2.1数据挖掘技术的基本知识11.2.2数据挖掘技术的基本应用21.2.3数据挖掘技术的发展21.3 本文的主要工作21.3.1设计思想和实现目标21.3.2论文结构安排32 系统分析32.1可行性研究42.1.1 技术可行性42.1.2经济可行性42.2需求分析42.2.1项目业务需求42.2.2功能模块52.2.3用例描述73概要设计133.1业务流程133.1.1业务流程中几个存储文件的命名规则133.1.2业务规则说明133.2系统模块133.3接口设计153.3.1用户接口153.3.2外部接口153.3.3内部接口163.4数据结构设计163.4.1登入/登出记录数据类
6、173.4.2 匹配的用户登录记录类173.5数据库设计184 详细设计和实现204.1 客户端模块204.1.1 数据读取模块设计204.1.2 数据匹配模块设计234.1.3 数据发送模块设计274.2 服务端模块314.2.1数据接收模块设计334.2.2数据存储模块设计364.2.3数据缓冲池384.3异常设计394.3.1异常类结构图394.3.2客户端异常类说明394.4数据库具体实现405 结论42参考文献43致谢441 引言1.1课题来源及意义随着计算机及互联网技术的高速发展,一些大的厂家例如电信,推出了服务器出租这项业务,选择这项业务的用户可以通过远程登录服务器上进行自己的工
7、作。服务器出租就是指用户不需要自己购买服务器,只需要根据自己的业务要求,向运营商申请一个帐号通过远程登录,便可以轻松享用服务器。由于服务器的价格相当昂贵,所以更多的用户更倾向于选择租用,而不是购买。这样服务器出租便得到了广泛的发展。这时就需要一款运行在服务器上的计时软件,来统计用户的使用情况来做出相应的收费依据。在此背景下,电信计费系统便应运而生了,电信计费系统是专门为服务器租赁商开发研究的,租赁商只需要在各地区出租的服务器上安装本系统,就会有相应的数据从客户端源源不断发送到服务端,这样便可以轻松的了解各地服务器的运营状况,以及盈亏情况,同时也可以作为用户缴纳费用的依据。电信计费系统是专门为电
8、信制作的一款计费程序,可以非常方便、快捷、实时查询出用户需要缴纳的费用。方便运营商在后续阶段进行合理的计划调整。通过对这一课题的学习和研究,可以将电信计费系统的基本原理、实现流程等展现出来,并可作为新的综合电信计费系统来学习和研究,也可以顺带了解实际电信实时计费的工作流程,具有一定的现实意义。1.2国内外发展状况由于用户数量巨大,所有用户信息交错保存在非结构型日志文件中。如何从海量数据中找到某一用户的计费信息,就需要数据挖掘技术的支持。1.2.1数据挖掘技术的基本知识数据挖掘(Data Mining,简称DM),又称为数据库中知识发现(Knowledge Discovery from Data
9、base,简称KDD),它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程1。整个知识挖掘(KDD)过程是由若干挖掘步骤组成,而数据挖掘仅是其中的一个主要步骤。尽管数据挖掘仅仅是整个知识挖掘过程中的一个重要步骤,但由于目前工业界、媒体、数据库研究领域中,“数据挖掘”一词已被广泛使用并被普遍接受,因此也可以广义地使用“数据挖掘”一词来表示整个知识挖掘过程,即数据挖掘就是一个从数据库、数据仓库或其它信息资源库的大量数据中发掘出有趣的知识。1.2.2数据挖掘技术的基本应用实际上数据挖掘技术从一开始就是面向应用的。目前,在很多重要的领域,数据挖掘都可以发挥积极促进的作用。尤其是在
10、如银行、电信、保险、交通、零售(如超级市场)等商业应用领域。数据挖掘能够帮助解决许多典型的商业问题,其中包括:数据库营销、客户群体划分、背景分析、交叉销售等市场分析行为,以及客户流失性分析、客户信用评分、欺诈发现等等。1.2.3数据挖掘技术的发展数据挖掘的目的就是为企业决策提供的正确依据,利用计算机及信息技术辅助完成从分析数据、发现问题、作出决策到采取行动这一系列操作。因此人们将这种机构行为和手段称这为“事务智能”(Business Intelligent,简称BI),BI能极大地改进决策的质量和及时性,从而改进机构的生产率或发挥竞争优势。所以近年来,一些大公司将数据分析和数据挖掘工具及其有关
11、技术组合起来形成所谓BIS(Business Intelligent Softwave)。其中SAS公司的的Enterprise Minter就是将数据源、数据预处理、数据存贮、数据分析与发掘、信息表示与应用等方面技术有机形成一个复杂数据挖掘系统有机整体。1.3 本文的主要工作1.3.1设计思想和实现目标设计思想是:任何用户登录Unix系统,Unix系统都会记录用户的登录信息,所有用户登入/登出的信息都保存在Unix的系统日志文件中。数据采集系统就是通过读取Unix系统日志文件中用户登入/登出信息,并找出成对的登入/登出记录,得到用户登录服务器的登入时刻、登出时刻、登录时间长度等电信用户收费需
12、要使用的数据。实现目标是: 把匹配处理好的数据保存成电信工作人员可以阅读的文本文件,做为电信收费依据。1.3.2论文结构安排本文的结构安排如下:第一章 引言介绍了课题的概况和相关技术的发展情况,以及课题的设计思想和实现目标。第二章 系统分析介绍了项目中涉及到的各种数据信息,各个功能模块的运行流程。第三章 概要设计概要设计文档主要描述了数据挖掘系统的总体设计,从上述文档中明确DMS系统需求的基础,从而划分出DMS系统的几大功能,进行系统开发分工,明确各模块之间的接口,为进行后面的详细设计和实现做好准备。第四章 详细设计及实现本章主要介绍了各个模块的具体实现流程图和具体实现代码第五章 结论回顾并总
13、结了课题的研究过程中所做的工作,也思考了研究过程中遇到的问题并列出了实践中的不足之处,最后根据自己的认识对相关技术的发展前景进行了展望。2 系统分析2.1需求分析电信公司现在具有哪些设备环境,能提供哪些原始数据,需要的最终数据形式是什么,数据是什么。电信公司为客户提供Unix服务器出租的服务,这样就必须有一个程序通过从Unix系统日志文件的海量数据中挖掘出用户登录、登出的时间来计算用户登录时长,并生成数据报表存储在公司另外的一个Oracle数据库中,以便电信公司计算费用。2.2功能模块根据用户需求分析,电信计费系统主要功能模块包括:数据读取,数据匹配,数据发送,数据接收,数据存储,数据整合。模
14、块具体活动流程如图2-1:图2-1系统活动图数据读取:该模块的主要功能是读取UNIX服务器上的的用户登录信息日志文件,备份日志文件,读取上一次未匹配成功的登录记录信息,读取备份的日志文件。数据匹配:该模块的主要功能是将数据读取模块读取到的数据按照图一定的关系匹配成完整的数据,未完成的匹配的数据保存在到文件中。方便下次读取时进行匹配。数据发送:该模块的主要功能是建立客户端socket网络连接,将匹配好的用户登录记录发送到服务,未发送成功的记录保存在文件中为下次发送时重新读取。数据接收:该模块的主要功能是建立服务端的网络连接,从客户端读取匹配好的用户登录信息放入缓冲池中。数据存储:该模块的主要功能
15、是将缓冲池中的数据保存到指定的数据库表中。数据整合:该模块的主要功能是将数据库中保存的用户登录记录按照日、月、年整合成详细的报表。2.3用例描述根据用户需求和功能分析,生成系统用例图。如图2-1所示。图2-2系统用例图电信计费系统各功能模块的用例说明如下:数据读取用例说明: 保存用户登录信息的UNIX系统日志文件在/var/adm目录下,文件名为wtmpx,日志文件以二进制方式进行存储的,如果想在UNIX下查看wtmpx,可以使用last命令:last -a -n number | -number -f filename name | ttywtmpx文件中每条记录都包含有372个字节,所包含
16、的每条记录项格式如下表2-1所示(其中灰色背景区域的数据为本系统需要采集的数据项): 表2-1用户登录记录数据项格式位置范围字节长度含义000-03132 用户登录名 032-0354 初始进程 id 036-06732 设备名 068-0714 进程ID072-0732 登录类型7-登入,8-登出 074-0752过程终止076-0772 退出状态2 这是C数据类型补齐产生的空位080-0834 登录时刻 /单位是秒 084-0874 和微秒 088-0914 会议编号,用于视窗 092-11120 预保留112-1132 significant length of ut_host 114-
17、371257/* 登录IP*/日志文件登录数据项总数可以使用公式:记录项总数=日志文件大小/372。数据采集基本流程如表2-2表2-2数据采集的基本流程用例名称数据采集功能简述DMS管理员运行数据挖掘系统,完成数据采集的功能前置条件数据挖掘系统在服务器上已正确安装基本流1. 管理员启动DMS服务端系统2. 管理员启动DMS客户端系统3. 客户端程序定期将登录数据文件备份,并清空源文件4. 客户端系统读取上次未匹配成功的登入信息5. 客户端读取备份的数据信息,剔除非法登录的用户6. 客户端获得用户的登入/登出记录表7. 客户端将用户登入/登出记录匹配为完整的登录记录客户端程序将不能成功匹配的登入
18、记录写到文件中保存8. 客户端程序将匹配好的登录记录发送到服务端9. 服务端程序接客户端发送的数据10. 服务端程序先将数据写到服务端文件存入缓冲池中11.服务端程序将缓冲池的数据保存到数据库中分支与异常第1步,若服务端程序启动失败,则发送异常报告。第2步,若客户端程序启动失败,则发送异常报告。第3步,若清空文件失败,则发送异常报告。第4步,若上次未匹配的登入记录文件不存在,则跳过到第5步。第5步,若读取备份的用户记录数据文件失败,则发送异常报告。第7步,若指定的保存文件不存在,则创建文件。第7步,若创建目录或写文件失败,则发送异常报告。第8步,若发送数据失败,则定时重传。第10步,若写入文件
19、失败,则发送异常报告。后置条件启动contrab命令,定时读取、发送数据备注无数据读取用例说明如表2-3:表2-3数据读取的基本流程用例名称数据读取功能简述客户端程序读取系统数据文件和上次未匹配的登入记录,形成用户登录记录项。前置条件DMS客户端程序启动基本流1) 读取上次未匹配的登入记录。2) 将存储到记录放入链表中。3) 读取备份的数据文件,清空源文件,将文件内容解析成可用的记录。4. 将解析得到的用户登录记录放入对应的链表中。5. 返回用户登录记录链表。分支与异常第1步,若上次未匹配的登入记录文件不存在,则跳过到第3步。第3步,若用户登录数据文件不存在,则报告异常。后置条件无备注无数据匹
20、配用例说明如图2-4:表2-4 数据匹配的基本流程用例名称数据匹配功能简述DMS客户端程序读取用户的登入/登出记录链表,找到一条匹配的数据,包装成匹配记录,添加到匹配链表中,删除登入/登出记录,并将本次未匹配的登入记录保存到指定文件中。前置条件已经获得用户登入/登出记录链表基本流1. 访问用户登入/登出记录链表,按照登入/登出的对应关系匹配数据,包装成匹配记录。2. 把匹配好的记录添加到匹配链表中3. 将未匹配的登入记录写到指定的文件中。分支与异常后置条件无备注无数据发送用例说明:表2-5 数据发送的基本流程用例名称数据发送功能简述客户端将匹配好的数据通过网络socket发送给服务端。前置条件
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电信 计费 系统 毕业论文

链接地址:https://www.31ppt.com/p-3988723.html