基于分层结构的兴趣点推荐算法的设计与实现分析研究电子科学与技术专业.docx
《基于分层结构的兴趣点推荐算法的设计与实现分析研究电子科学与技术专业.docx》由会员分享,可在线阅读,更多相关《基于分层结构的兴趣点推荐算法的设计与实现分析研究电子科学与技术专业.docx(33页珍藏版)》请在三一办公上搜索。
1、5.15.25.35.4.1.2.2 .3.7.7.7 .8.9.9.10.11.11.12.14.14.15.15.15.17.21.21.22 .22.23目录,.Z11H1Jt4jg右,*1.1 研究背景及意义1.2 Pc)I推荐概述及研究现状1.3 本文的主要工作1.4 本文的组织结构第二章相关技术介绍2.1 推荐算法概述2.1.1 基于协同过滤的推荐2.1.2 基于内容的推荐2.2 推荐算法的评测指标2.2.1 准确性指标2.2.2 非准确性指标第三章POI推荐的影响因素3.1 时间的影响及解决方法3.2 地理位置的影响及解决方法.第四章分层结构的POl推荐算法的设计4.1 分层结构
2、的POl推荐的定义4.2 分层结构的POl推荐算法HMF-4.2.1 HMF-G的基本模型4.2.2 HMF-G的具体内容4.2.3 HMF-G的优化算法第五早驮分析实验设置推荐算法的性能比较实验结果5.5结论25第六章总结与展望266.1 本文总结266.2 后续工作展望26参考文献28致.错误!未定乂书签o摘要随着基于地理位置的社交网络(LocationBasedSocialNetworks,LBSN)的迅速发展,兴趣点(PointOfInterest,POD推荐已经成为了一个重要的研究问题。然而Pol推荐会受到时间和地理位置的影响。此外,现实世界中的推荐系统的Pol呈现出一定的分层结构,
3、同样,用户的偏好的也会呈现分层结构。最近的研究表明,结合项目或用户偏好的分层结构可以提高推荐系统的性能。显式的分层结构例如用户偏好通常是不可用的,因此,分层结构并没有很好地应用到推荐系统上。本文首先研究了时间和地理位置对Pc)I推荐的影响。设计和实现了一种分层结构的POI推荐算法HMF-G(HierarchicalMatrixFactorization-GeogmphicaD,来获得用户和POI之间的隐式分层结构。在两个现实世界的数据集,Foursquare和Gowalla上的实验结果证明了所提出的算法的有效性。关键词:推荐算法;兴趣点;分层结构AbstractWiththerapiddeve
4、lopmentoflocation-basedsocialnetworks(LBSN),Point-of-Interest(POI)recommendationhasbecomeanimportantresearchissue.However,POIrecommendationisaffectedbytimeandlocation.Inaddition,therecommendationsysteminreal-worldpresentsahierarchicalstructureofPOLSimilarly,theuserpreferencesalsoshowahierarchicalstr
5、ucture.Recentstudieshaveshownthatcombiningthehierarchicalstructureofprojectsoruserpreferencescanimprovetheperformanceoftherecommendationsystem.Explicithierarchicalstructuressuchasuserpreferencearegenerallynotavailable.Therefore,thehierarchicalstructureisnotwellappliedtotherecommendationsystem.Thisdi
6、ssertationfirststudiestheinfluenceoftimeandgeographicallocationonPOIrecommendation.AndahierarchicalstructureofPOIrecommendationalgorithmHMF-G(HierarchicalMatrixFactorization-Geographical)isdesignedandimplementedtoobtainanimplicithierarchicalstructurebetweenusersandPOIs.Experimentalresultsontworeal-w
7、orlddatasets(FoursquareandGowalla)demonstratetheeffectivenessoftheproposedalgorithm.Keywords:recommendationalgorithm;pointofinterest;hierarchicalstructure城市的迅速发展带来了数量越来越多的兴趣点(POintOfInterest,POD,例如餐馆,商店,酒店,为我们提供了越来越多的体验生活的机会。日常生活中,人们乐意去探索城市和社区,并根据自己的个人兴趣决定“去哪里”。与此同时,如何在大量的POI中做出令人满意的决定也成为了用户的一个棘手的问题
8、,俗称“选择困难症”。POI推荐任务旨在帮助用户过滤用户不感兴趣的POI来缩短其决策时间。基于位置的社交网络(LOCatiOnBaSedSOCiaINetWork,LBSN)已经吸引了数百万用户在他们中意的兴趣点签到,并与朋友分享他们访问这些Pol的体验。例如,截至2014年12月,Foursquare拥有超过60亿的签到信息,每天有5千5百万用户进行数百万的签到。这些历史签到信息包含了关于用户和POl的丰富的信息,为挖掘用户的POI偏好并进行POI推荐提供了新的机会。Pe)I推荐易受时间和地理位置的影响。在不同的时间内,用户有着不同的Pe)I偏好。同时用户的地理位置也对用户访问Pol产生了约
9、束。而且,Pol往往呈现出一种分层结构,例如餐馆类的Pc)I往往还分为中餐,西餐,咖啡厅等,博物馆类的Pol还可以分为历史博物馆,艺术博物馆,科学博物馆等。同理,用户的PC)I偏好往往也呈现出一种分层结构,例如用户往往只喜欢去中餐类的餐馆。本文研究了时间和地理位置对POI推荐的影响,以及如何将时间因素和地理因素纳入到POl推荐中。同时,本文还深入研究了用户和Pol之间的分层结构的关系,并提出一种全新的算法HMF-G来捕获用户POl的分层结构。并进行了实验验证。本文的完成主要工作如下:(I)探讨了时间对PoI推荐的影响,提出将数据集按不同时间段进行切片来处理时间因素的方法。(2)探讨了地理位置对
10、Pc)I推荐的影响,采用一种地理区域筛选的方法将地理因素纳入到Pol推荐中。(3)研究用户POI之间的分层结构,提出一种算法HMF-G来对用户POI的分层结构进行建模。(4)在两个数据集(FOUrSqUare和GolIaWa)上对进行实验,并于其他几种Pc)I推荐算法进行比较,实验结果证明了(3)中所提出的算法的有效性。第一章绪论本文首先介绍了POI推荐的研究背景和意义,之后简单介绍了POI推荐的特点和影响因素,并详细地说明了本文的主要工作。在本章的最后,介绍了一下本论文的组织结构。1.1 研究背景及意义随着具有无线通信和定位功能的移动设备的迅速普及,一些基于位置的社交网络(LocationB
11、asedSocialNetwork,LBSN)的互联网应用,例如FoUrSqUare,Gowalla,Brightkite,Yelp和Facebook已经越来越受到人们的欢迎,并吸引了数百万人的用户。LBSN具有将物理世界和虚拟世界联系起来的功能。兴趣点(英文:PointofInterest,POD即电子地图的某些地标,例如餐馆,商店和电影院等,如图1.1显示了苏州市的部分兴趣点。在LBSN(下页图1.2)中,用户可以建立起彼此的社交链接,通过在某些地方用移动设备签到(checkin)来向其他人分享一些他们所去过的兴趣点的体验心得。智能手机的锐增导致了LBSN的繁荣,Foursquare,Fa
12、cebookPlaces和Yelp等LBSN现在越来越流行。直到2016年6月,Foursquare已经收集了全球包括80亿次签到信息和6500多万次的地形测绘业务。图1.2:基于地理位置的社交网络1.BSN中有大量社区贡献的数据,包括用户彼此之间的社交关系,用户在PC)I上的签到信息,用户的地理位置信息和POI的种类。这些丰富的数据反映了人们在现实中的行为,并且为了用户访问POI的决策过程提供了新的机会。在LBSN中,根据从社区贡献的数据中了解到用户对POI的访问偏好,来向用户提供他/她可能感兴趣但之前未访问过的POLPol推荐非常重要,一方面,它有助于当地居民或游客探索城市中一些有趣的未知
13、地点。另一方面,还为POl的拥有者创造机会和商业利润,通过发现和吸引潜在的游客来增加POI拥有者的收入。事实上,LBSN服务中的关键就是准确和个性化的POl推荐。首先,考虑到大量的PeH,用户很难通过有效的方式来找到他们喜欢的POL个性化的PCH推荐系统可以帮助用户轻松找到相关的POI,而无需花费太多时间进行搜索,特别是用户来到新地区时。此外,对于POI所有者说,向各种用户提供正确的POI也是非常具有挑战性的。个性化的POl推荐系统不仅能够减轻负担,还能通过推荐的POl来吸引更多的用户。1.2 POI推荐概述及研究现状POI推荐是LBSN中最重要的任务之一,它可以帮助用户在LBSN中发现新的有
14、趣的地点。PcH推荐通常会挖掘用户的Pol签到记录,地点信息(如类别)和用户的社交关系,以推荐用户最可能在将来访问的POI列表。POI推荐不仅提高了用户对LBSN供应商的粘性,而且还为广告代理商提供了向潜在消费者发布广告的有效方式。具体来说,用户可以使用FOUrSqUare探索附近的餐馆和市中心的购物商场。同时,商家也可以通过POI推荐让他们的目标用户轻松地找到他们。为了方便用户以及商家所提供的商机,POl推荐已经吸引了大量的关注,最近许多研究人员提出了一堆POl推荐系统。尽管开发POI推荐系统可以极大地使用户和POI推荐者都收益,但它仍然是一个非常的具有挑战性的问题。事实上,用户的签到决策过
15、程非常复杂,可能会受到不同因素的影响。首先,用户访问PoI很大程度上会受到朋友的影响。对于某些特定的POI,一些朋友可能会对用户访问该POl产生正面影响,然而另一些朋友可能会产生负面影响。此外,距离Pol的距离也会影响用户对该POl的偏好程度。一般来说,用户喜欢去附近的Pe)I而不是距离很远的POIo因此,模拟社交朋友关系和地理距离对用户访问Pol的影响非常重要。另外,用户是否在POl签到可能取决于用户的具体目的。例如,当人们想吃午饭时,他们更想选择与食物相关的兴趣点而不是景点。基于记忆的协同过滤(CollaborativeFiltering,CF)技术(例如基于用户的CF和基于物品的CF)经
16、常被用于Pol推荐。LeVandOSki对基于物品的CF进行修改,将用户的旅行距离作为一个惩罚项,对学习的过程进行了优化。M.Ye等人通过采用线性插值的方法将地理和社交关系影响纳入到基于用户的CF模型,显著的提高了推荐算法的准确性,而且社交关系对推荐系统的性能影响不大。基于记忆的CF很容易受到数据稀疏的问题的困扰,因为用户与用户或物品与物品的相似性需要根据用户平时的签到信息进行计算。当签到信息很少时,两个用户或物品之间将共享很少的签到信息,因此根据这些签到信息产生的相似性提供推荐结果是不可靠的。CCheng等人引入一个多中心高斯模型来计算地理位置对推荐结果的影响,因为用户的平时的签到地点通常在
17、几个中心附近,并将它与矩阵分解(MatriXFactorization,MF)结合起来用于兴趣点推荐。然而在这种方法中,MF仅通过适配非零的签到信息来执行,因此它容易遭受数据稀疏的问题。基于模型的CF技术也被应用于Pol推荐,NOUlaS发现对于POl推荐而言,MF比基于用户的CF和基于项目的CF的表现效果更差。在他们的研究中,他们将用于显示反馈数据的常规MF技术应用到PoI推荐中,这种不适合Pol推荐的方法导致效果不佳。B.Liu等人提出了一个地理概率因素的分析框架,即GTBNMF,它结合了基于贝里斯非负矩阵分解的地理影响。但是BNMF是通过满足零和非零签到来执行的,因为零签到可能会缺失值,
18、所以可能导致算法结果的不合理。所有的这些方法都不能反应出POI推荐的隐式反馈属性。与传统的推荐系统(如音乐推荐,电影推荐不同),POI推荐要考虑各种因素,例如用户对POl的内容偏好和受地理约束的空间偏好。J.-D.Zhang等人通过核密度估计的方法对每个用户的个性化二维地理影响进行建模,预测出用户访问新位置的概率。D.Lian等人将地理信息纳入到加权矩阵分解以提高POI推荐的有效性。1.3 本文的主要工作(1)提出一种将数据集按不同的时间段进行切片的方法,处理时间对POI推荐的影响。(2)对用户的活动区域进行建模,对最终推荐的不在区域内的POl进行筛除,该方法考虑了地理因素对PeH推荐的影响。
19、(3)提出了一种推荐算法HMF-G,它能够使我们在这些结构不明确可用的情况下捕获用户和POl的分层结构,并对其进行建模。(4)在两个大型的现实世界的数据集(FOUrSqUare和GOWana)上进行实验,并将结果与其他几种推荐算法进行比较。实验结果充分验证了(3)中所提出方法的有效性。1.4 本文的组织结构本文是一共分为六章,各章的内容如下:第一章:绪论。本章主要介绍了分层结构的兴趣点推荐的意义和研究背景,并简单介绍了POl推荐的特点和影响因素,而且还详细地说明了本文主要工作,最后介绍了本文的组织结构。第二章:相关技术介绍。主要介绍了常用的推荐算法,以及常用的推荐算法的评测指标。第三章:Pol
20、推荐的影响因素。本章详细地讨论了时间和地理位置对POl推荐的影响,并提出了对数据集进行切片和地理区域筛除的方法。第四章:分层结构的POI推荐算法。本章深入地讨论了POI推荐的分层结构,并以非负矩阵分解NMF为基础,提出一种HMF-G算法来对POI推荐的分层结构进行建模。第五章:实验分析。在Gowalla和Foursquare数据集对所提出的HMF-G算法进行了实验,并将实验结果与几种推荐算法相比较,实验结果证明了所提出的算法的有效性。第六章:总结与展望。对全文进行了细致性的总结,并思考了在本文中的一些不足的地方,提出了未来的工作的安排与期望。第二章相关技术介绍本章对推荐算法的相关技术进行介绍,
21、介绍了一些常用的推荐算法,如协同过滤算法和基于内容的推荐算法。并简单介绍了一下推荐算法常用的评测指标。2.1 推荐算法概述推荐系统中,最重要的技术所在就是推荐算法。对不同的推荐系统,需要认真考虑该选择何种推荐算法。到现在为止,已经有很多种类的推荐算法。每一种推荐算法都有它们的缺点和优点,而且,不同的算法也有其对应的限制条件。推荐算法一般都是建立了一个模型,用于推断用户感兴趣的项目。首先获取数据,例如用户偏好和可供推荐的项目的特征,然后推测哪些项目会迎合用户的偏好。2.1.1 基于协同过渡的推荐协同过滤(COlIaboratiVeFiItering,CF)是一种通过收集许多用户(协,同)的偏好或
22、口味信息来对用户的兴趣进行自动检测(过滤)的方法。CF的假设是,如果一个用户甲在某个问题上,和某个人乙有相同的意见,那么与其他随机选择的人的想法比起来,甲的想法可能和乙的更相似。简单来说,就是分析一群有着相似爱好的用户组的行为,来去判断相关用户的项目偏好。当我们想向用户推荐某些东西时,最合理的做法是找到和用户品味爱好相同的人,看看他们都选择了哪些项目,然后用户推荐相同的项目。或者我们可以查看和用户之前购买的产品类似的产品。协同过滤算法主要分为两种,以用户为基础的CF(USer-BaSedCF,UCF)和以项目为基础的CF(Item-BasedCF,ICF)0(1)基于用户的CF(UCF)UCF
23、的主要做法是找到一群爱好相似的用户,即基于用户的(User-based)的CF或基于相邻者的CF(Neighbor-basedCollaborativenFiltering)0用户与用户之间相似度通常用JaCCard公式或余弦相似度来计算。这样的话,两个用户的相似度可以更直观的观察到。设M色)是用户的中意的项目的集合,MW)为用户U中意的项目的集合,则N和U相似度的计算公式为:余弦相似度:Jaccard 公式:M()cM(u) m(w)M(v)_ I (w)n(v) I M(w)uM(v)(式 2.1)(式 2.2)UCF的具体方式为:通过收集有关用户的信息,了解用户的项目偏好。然后通过计算用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 分层 结构 兴趣 推荐 算法 设计 实现 分析研究 电子 科学 技术 专业
链接地址:https://www.31ppt.com/p-7002688.html