内容无关的信息检索模型.ppt
《内容无关的信息检索模型.ppt》由会员分享,可在线阅读,更多相关《内容无关的信息检索模型.ppt(27页珍藏版)》请在三一办公上搜索。
1、内容无关的信息检索模型,杜小勇2008-03-13,基于文本内容的检索模型布尔模型向量空间模型概率模型统计语言模型语义网络模型,与内容无关的其他检索模型基于协同的模型基于链接分析的模型基于关联的模型通常与基于内容的模型一起使用,Collaborative Recommendation,raj denotes the score of item j rated by an active user a.If user a had not rated item j,raj=0.m-total number of users,n-total number of items.,协同推荐模型,For a
2、given user-a and document-j,Predicate paj=?is the number of users who are similar to user a and have rated item j.w(a,i):The weight of the similarity between user a and user i.k is a normalizing factor such that the absolute values of the weights sum to unity.,算法主要的问题,冷启动(cold star)稀疏性(sparse)高维性(hi
3、gh dimension),基于分类的协同过滤推荐,基本思想:(1)对矩阵进行划分划分依据资源的语义分类(2)根据划分后的子矩阵进行协同过滤(3)生成预测结果,基于分类的协同过滤推荐,基本思想:(1)把每一项资源归到一个或几个类别中;(2)用户对资源评价矩阵进行分解,,(3)对 进行裁减,去掉对该类资源没有打分的用户,基于分类的协同过滤算法(续),(4)根据 计算用户在某一类别中的相似度,即得到一个用户的最邻近邻居们。(5)计算用户对特定类别中的资源感兴趣度(6)综合用户在多个类别中的感兴趣程度,得到最终推荐结果。,基于聚类的协同过滤算法,基本思想:(1)对矩阵进行划分划分根据稀疏矩阵聚类、K
4、Means等聚类算法(2)根据划分后的子矩阵进行协同过滤(3)生成预测结果,基于矩阵聚类的协同过滤,基于矩阵聚类的协同过滤,基本思想:(1)把每一项资源归到一个或多个子矩阵中,每个用户被划分到一个或多个子矩阵中;,基于聚类的协同过滤算法(续),(2)根据 计算用户在某一类别中的相似度,即得到一个用户的最邻近邻居们。(3)计算用户对特定类别中的资源感兴趣度(4)综合用户在多个类别中的感兴趣程度,得到最终推荐结果。,与内容无关的其他检索模型基于协同的模型基于链接分析的模型基于关联的模型通常与基于内容的模型一起使用,链接分析模型,对于超文本(例如WWW上的网页),超链结构是个非常丰富和重要的资源,如
5、果能够充分利用的话,可以极大地提高检索结果的质量。Sergey Brin 和Larry Page 在1998 年提出了PageRank 算法J.Kleinberg 于1998年提出了HITS 算法其它一些学者也相继提出了另外的链接分析算法,如SALSA,PHITS,Bayesian等算法。,Page Ranking算法,Brin S,Page L The anatomy of a large-scale hypertextual web search engine.WWW98 基本思想:以下三条启发式规则:如果一个页面被多次引用,那么这个页面很可能是重要的。如果一个页面被重要的页面引用,那么这
6、个页面很可能是重要的。一个页面的重要性被均分并传递到它所引用的页面。,PageRanking,Citation graph(link graph)of the webA web pages“PageRank”:PR(A)=(1-d)+d(PR(T1)/C(T1)+PR(Tn)/C(Tn)Page A has pages T1,Tn which point to it(i.e.are citations)0d1 is a damping factor(d=0.85)C(A)is the number of links going out of A,HITS算法,J.Kleinberg.Autho
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 内容 无关 信息 检索 模型
链接地址:https://www.31ppt.com/p-6243644.html