毕业设计(论文)轨迹数据的空间概化.doc
《毕业设计(论文)轨迹数据的空间概化.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)轨迹数据的空间概化.doc(83页珍藏版)》请在三一办公上搜索。
1、中 国 矿 业 大 学本科生毕业论文姓 名: 杨 光 学 号: 08073757 学 院: 计算机科学与技术学院 专 业: 信息安全 论文题目: 轨迹数据的空间概化 专 题: 指导教师: 职 称: 讲师 2011年 6 月 徐州中国矿业大学毕业论文任务书学院 计算机科学与技术学院 专业年级 信安07-3班 学生姓名 杨光 任务下达日期: 2011年1月10日毕业论文日期:2011年2月21日至2011年6月15日毕业论文题目:轨迹数据的空间概化毕业论文专题题目:毕业论文主要内容和要求:设计轨迹数据空间概化的相关方法,减少轨迹数据的隐私信息。采用C+或C#实现轨迹数据空间概化和聚类原型系统,以飓
2、风数据为测试数据集,对所实现的方法进行测试。要求:(1)抽取轨迹数据关键点,根据空间相近性对抽取的关键点进行分组;(2)抽取每组内的中心点作为概化点;(3)将原始轨迹根据概化点生成概化轨迹,并对轨迹进行聚类;(4)实现轨迹数据空间概化和聚类的原型系统;(5)以飓风数据为测试数据集,对所实现的方法进行测试。院长签字: 指导教师签字:中国矿业大学毕业论文指导教师评阅书指导教师评语(基础理论及基本技能的掌握;独立解决实际问题的能力;研究内容的理论依据和技术方法;取得的主要成果及创新点;工作态度及工作量;总体评价及建议成绩;存在问题;是否同意答辩等):成 绩: 指导教师签字: 年 月 日中国矿业大学毕
3、业论文评阅教师评阅书评阅教师评语(选题的意义;基础理论及基本技能的掌握;综合运用所学知识解决实际问题的能力;工作量的大小;取得的主要成果及创新点;写作的规范程度;总体评价及建议成绩;存在问题;是否同意答辩等):成 绩: 评阅教师签字:年 月 日中国矿业大学毕业论文答辩及综合成绩答 辩 情 况提 出 问 题回 答 问 题正 确基本正确有一般性错误有原则性错误没有回答答辩委员会评语及建议成绩:答辩委员会主任签字: 年 月 日学院领导小组综合评定成绩:学院领导小组负责人: 年 月 日摘 要轨迹数据空间概化作为轨迹数据挖掘的一个重要研究内容,其目的是对轨迹数据进行空间抽象,达到降维和隐私保护的目的。本
4、文主要对轨迹数据空间概化方法和基于空间概化的轨迹聚类技术进行研究。首先,阐述了轨迹数据空间概化的背景和意义,总结了轨迹数据挖掘的内容,分析了轨迹数据聚类研究方法并对其进行了分类,并介绍了轨迹数据的空间概化方法。其次,编程实现了传统轨迹数据空间概化方法,并提出基于多约束的轨迹数据空间概化方法。该方法首先根据轨迹点时间、位置、速度等多个特征约束提取出特征点。然后对特征点进行分组,计算原始轨迹所经过的分组信息,连接分组区域中心点生成概化轨迹。在上一步基础上,提出基于空间概化的轨迹聚类方法。该方法对整条概化轨迹进行聚类,并针对不同聚类方法所得聚类结果进行相似性比较。飓风数据实验表明,选择合适概化参数后
5、,在概化轨迹满足聚类等数据处理要求的基础上,数据维度大大降低,所要处理的轨迹点数大大减少,消耗的聚类时间大大减少。同时,实验比较聚类结果的相似性表明,选择合适概化参数后,概化后的轨迹仍然保持了良好的轨迹位置等特征。最后,在理论研究的基础上,本文设计并实现了空间概化轨迹聚类分析系统Trajectory-Generalization,可以轨迹数据集进行概化和聚类分析,能获得更具可视化效果的轨迹数据空间概化和聚类结果。关键词:轨迹空间概化;轨迹特征点;多约束;轨迹聚类;相似性ABSTRACTAs a hot topic of the trajectory data mining, spatial g
6、eneralization of trajectory data is aimed at special abstraction of trajectory data, which is useful for dimensionality reduction and privacy protection.Firstly, this paper represents the background and meaning of trajectory data clustering, and then summarizes the contents of trajectory data mining
7、. After that, we analyze the trajectory clustering research methods and make a classification to these methods. At last, we discuss the method of spatial generalization of trajectory data. Secondly, we design a program to test and verify the traditional method for spatial generalization of trajector
8、y data, and then propose a new method with multiple constraints for that. The method firstly extracts feature trajectory points with multiple feature constraints, for example, time, position, speed, etc. Then the method groups the feature points, and calculates the group information of which the ori
9、gin trajectories pass. At last, we connect grouping regional center point in order to generating generalized trajectories. After the above steps, we propose the spatial generalization trajectory clustering method. The method clusters on the entire generalized trajectories, and make a comparison for
10、various clustering results generated by different clustering methods.Experiments on Hurricane data show that the original data dimension is greatly reduced with the appropriate parameters chosen in the condition that generalized trajectories are satisfied with the requirements of clustering and the
11、clustering time consumption is also greatly reduced. At the same time, the experiments on comparison of clustering results similarity show that after selecting the appropriate parameters, almost of trajectories remains good features of the trajectories such as the position information.Finally, based
12、 on the research theory, this paper designs and achieves the primitive system of Trajectory-Generalization, which can do clustering analysis on trajectory data, and visualization results for trajectory data generalization and clustering.Keywords: spatial generalization; characteristic points; multip
13、le constraints; trajectory clustering; similarity目 录1 绪论11.1研究背景与意义11.2国内外研究现状21.3论文主要的研究内容21.4论文结构31.5本章小结42 轨迹数据挖掘及空间概化方法52.1轨迹数据挖掘概述52.2轨迹数据挖掘研究内容52.3轨迹数据聚类方法62.3.1基于层次方法72.3.2基于划分的方法72.3.3基于密度的方法72.3.4基于模型的方法72.3.5基于网格的方法82.3.6其他方法82.4轨迹数据概化方法82.5本章小结93 基于多约束的轨迹数据空间概化方法103.1 引言103.2传统的轨迹数据空间概化方法
14、103.2.1具有时间意识的轨迹特征点提取103.2.2将空间中的特征点分组123.2.3定位区域中心153.2.4概化轨迹的生成163.3轨迹数据的特性和基本定义173.3.1轨迹的几个特性173.3.2轨迹的基本定义183.4基于多约束的轨迹数据空间概化方法193.4.1具有多约束下的轨迹特征点提取193.4.2轨迹概化的其他步骤223.5实验及分析223.5.1实验数据及运行环境223.5.2提取轨迹特征点233.5.3特征点分组253.5.4概化点和概化轨迹生成273.6本章小结294 基于空间概化的轨迹聚类方法304.1引言304.2聚类算法的讨论314.2.1传统的聚类算法及其局限
15、性314.2.2 DBSCAN算法描述及其实现314.3基于空间概化的轨迹聚类324.4空间概化聚类同原始轨迹聚类相似性对比334.5实验及分析344.5.1实验数据及运行环境344.5.2实验分析354.6本章小结415 轨迹数据的空间概化和聚类原型系统的设计与实现435.1系统架构概述435.1.1数据获取435.1.2数据预处理435.2系统的实现445.2.1系统结构445.2.2关键类结构465.3系统的运行465.3.1运行环境465.3.2输入数据465.3.3功能展示475.4本章小结526 结论53参考文献54翻译部分57英文原文57中文译文67致 谢751 绪论1.1研究背
16、景与意义移动设备例如手机、掌上电脑,嵌入式点子产品等已经广泛应用于人们的生活之中,而且将越来越普及。现代的移动设备越来越多都具有GPS功能,设备服务端可以通过移动端为用户提供主动式、基于位置的服务,极大地方便了人们对于位置定位、路线识别等服务的需求。服务提供商为用户提供这些服务的同时也收集到大量的位置数据,这些数据作为宝贵的信息资源,记录了移动对象在某时刻的位置信息,这些数据传达了移动对象在一定时间段内的运动轨迹,通过对这些数据的分析,可以得出一些共性的有价值的模式,利用这些模式可以分析移动对象的日常生活习惯、活动轨迹,提供更好的主动式信息供给、用户位置查询等服务。ITU-国际电信联盟1指出截
17、至2010年底,全球移动电话注册数量达52.8亿,普及率达86.47%,2009年底,该数据为46.6亿,普及率达为67%,而在峰会第一阶段会议召开之际(2003年)普及率仅为20%,移动蜂窝的快速腾飞出人意料。发展中国家的普及率于2008年超过50%,一些区域(欧洲和独联体国家)已达到100%大关;并将在2015年基本实现100%的覆盖。这有可能带来全世界所有人对电话服务的获取。另一方面,手机服务运营商通过各种定位技术如GSM和UMTS,能更好更精确的提供计算一个用户位置的能力,而各种移动标准技术的综合使用:配备GPS的移动设备可以发送他们的轨迹给服务提供者(欧洲伽利略卫星定位系统、中国的北
18、斗卫星导航系统等都可以提供高精度和高普及程度),Wi-Fi和蓝牙设备可以作为一种用于室内定位的数据源,Wi-Max能成为户外定位的一种替代品,还有很多其他的移动轨迹数据源获取技术2。可见随着卫星,传感器,RFID和无线网络等技术的迅速发展,记录了海量的物体移动轨迹数据。例如,一个零售商拥有3000个零售店,每天每个店销售10000件商品,每件商品在被卖掉之前平均移动10次,这样每天就产生30001000010=3亿的数据,那一个月,一年的数据是非常巨大的;一个城市每天的交通轨迹数据也是海量的。对于这些轨迹数据挖掘是现实世界的实际需要驱动的:(1)城市交通方面:现在的很多出租、邮政和货运车辆都配
19、备了GPS设备,这些设备以一定的频率向某些特定的管控中心定时发送自己的坐标。交通警察、公路运输管理、快递公司等单位或部门通过将这些点按时间顺序连接起来就可得到车辆的运行轨迹,这样可以保证车辆的安全和有效调度,以及对交通流量的分析等等。(2)天气预报方面:气象局对于每次的台风都有记录,台风的风速、中心位置、中心附近的风力、台风的等级都有详细的记录;根据历史的台风轨迹数据,预测未来的台风轨迹,能减少很多的人民财富损失。(3)煤矿安全方面:对于煤矿井下人员定位系统,在煤矿的普及率越来越高,而煤矿人员定位系统长期运行后,也产生海量的轨迹数据,对这些海量的历史轨迹数据进行分析,利用分析获得的规律指导今后
20、的煤矿安全工作,具有重要的实际意义。(4)其他:如通过动物运动轨迹,分析研究动物群居的习性;通过研究大超市里人们的购物移动路线,分析研究购物者们的购物爱好,以便后来更好的布置购物场所;另外对于定位服务、视频监控还有其他很多的现实应用都有轨迹数据挖掘的需求。1.2国内外研究现状轨迹数据挖掘是数据挖掘领域下一个新兴的研究方向,近几年才开始有较大的发展,目前国内外研究的机构和学者还不是很多。国内研究轨迹数据挖掘的专家和研究机构主要有:四川大学唐常杰教授领导的数据库与知识工程研究所,做了轨迹数据异常检测3、4、轨迹预测5、6、序列模式挖掘7等方向的研究;中国人民大学孟小峰教授领导的网络与移动数据管理实
21、验室,做了移动数据库系统8和移动对象索引9等技术的研究;华中科技大学李国徽教授;中国科学院软件研究所丁治明教授;台湾地区中央研究院李强教授、曾新穆教授、彭文志教授和黄三义教授也做了些对轨迹数据挖掘的研究。国外研究机构和专家相对比较多:在Han J.W. 教授领导下,美国伊利诺大学香槟校区的数据挖掘实验室开展了Analysis of Spatiotemporal、Trajectory and Traffic Data的相关研究,并且取得了颇多成果,在轨迹模式挖掘、异常发现、轨迹聚类分析等多方面都有较好的表现;意大利比萨大学的知识发现和传递实验室进行了从事移动数据分析(Mobility Data
22、Analysis)相关方向的研究;还有Australias ICT Research Centre of Excellence,IBM China Research Lab,Microsoft Research Asia,U.S. Army Research Laboratory等等研究机构也做了一些对轨迹数据挖掘的研究工作。聚类分析已经有很长的历史,它在数据挖掘、机器学习等研究领域有着非常重要的地位,然而轨迹数据聚类分析是近几年才热门起来。1999年,Scott Gaffney10等人较早提出了进行轨迹数据聚类研究,他们用回归模型组件组成的混合模型,采用基于EM算法的无监督学习方法进行聚类;
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文 轨迹 数据 空间

链接地址:https://www.31ppt.com/p-2663701.html