基于Web的个性化服务.ppt
《基于Web的个性化服务.ppt》由会员分享,可在线阅读,更多相关《基于Web的个性化服务.ppt(34页珍藏版)》请在三一办公上搜索。
1、基于Web的个性化服务,简介个性化服务技术基于Web的个性化服务改进思路,简介,主要问题:浏览过程中总是会出现一些自己毫不关心的话题解决方法:以网站为中心-以用户为中心提供个性化服务,个性化服务(Personalization)1,尽可能使得自己的每个用户在浏览该商业网站时都有他就是该网站的唯一用户的感觉尽可能地迎合每个用户的浏览兴趣并且不断调整自己来适应用户浏览兴趣的变化,Web挖掘的定义1,Web挖掘就是利用数据挖掘技术从Web文档和服务中自动发现和抽取信息Web mining is the use of data mining techniques to automatically di
2、scover and extract information from Web documents and services,Web挖掘(Web Mining)分类2,Web使用挖掘Web内容挖掘Web结构挖掘,个性化服务的表现形式,推荐的超链接列表推荐的商品列表(电子商务)推荐的广告列表经裁剪的文本或图像列表,基于Web的个性化服务,简介个性化服务技术基于Web的个性化服务改进思路,个性化服务技术,协同过滤技术(CF,Collaborative Filtering)数据挖掘技术(DM,Data Mining),协同过滤技术3,KNN技术(K-Nearest Neighboring)基于聚类(
3、Clustering-based)的协同过滤基于项目(Item-based)的协同过滤,协同过滤技术的缺陷,需要用户提供主观的评价信息不能处理大规模的数据量用户的评价信息可能会过时使用不方便,数据挖掘技术,关联规则(Association Rules)发现序列模式(Sequence Pattern)发现聚类(Clustering)技术Web挖掘(Web Mining)技术,Web挖掘技术的优点,不需要用户提供主观的评价信息可以处理大规模的数据量用户访问模式动态获取,不会过时使用方便,基于Web的个性化服务,简介个性化服务技术基于Web的个性化服务改进思路,基于Web的个性化服务,基于Web使用
4、挖掘的个性化服务基于Web使用挖掘和Web内容挖掘的个性化服务,基于Web使用挖掘的个性化4,基本思路:分析Web日志数据,利用数据挖掘方法发现用户的使用模式,从而向用户提供个性化服务,基本过程,离线部分数据预处理总体使用特征获取在线部分推荐引擎,数据预处理5,数据清洗(Data Cleaning)会话识别(Session Identification)浏览页识别(Pageview Identification)事务识别(Transaction Identification)路径完善(Path Completion)用户识别(User Identification),数据预处理的结果,浏览页集
5、合P表示为:P=p1,p2,pn用户事务集合T表示为:T=t1,t2,tm每一个事务t T均表示为为浏览页集合P的n维向量:t=,总体特征获取,使用聚类算法得到不同的事务聚类同一个事务聚类内用户之间的浏览模式尽可能相似,而不同事务聚类中用户之间的浏览模式尽可能不同给定事务聚类c和显著性阈值,事务聚类c的总体使用特征prc的计算方法如下:prc=|p P,weight(p,prc)weight(p,prc)=,推荐引擎,根据当前的用户会话产生实时的推荐集用户当前会话S可以表示为:S=s1,s2,sn总体使用特征C可以表示为:C=w1C,w2C,wnC,推荐引擎,使用余弦相似性函数来计算C和S之间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 Web 个性化 服务
链接地址:https://www.31ppt.com/p-5951778.html