网络信息资源个性化服务及成功案例.ppt
《网络信息资源个性化服务及成功案例.ppt》由会员分享,可在线阅读,更多相关《网络信息资源个性化服务及成功案例.ppt(81页珍藏版)》请在三一办公上搜索。
1、网络信息资源的个性化服务及成功案例,目录,1.1网络信息资源开展个性化服务的必要性,2006.122010.6中国网站规模变化,个性化服务,1.2 网络信息资源个性化服务定义,个性化信息服务 就是基于信息用户的信息使用行为、习惯、偏好和特点,向用户提供满足其各种个性化需求的一种服务.,个性化信息:是反映个性化特征的一切信息,同时还包括个体特定的信息需求组合。,1.2 网络信息资源个性化服务的特点,主动性,用户提出现有的需求提供用户所需要的信息研究用户个性、习惯、知识结构、信息需求预测和搜集用户可能感兴趣的信息提供信息、激活用户的潜在信息需求,1.2 网络信息资源个性化服务的特点,服务方式的针对
2、性服务内容的针对性,针对性,1.2 网络信息资源个性化服务的特点,互动性,互动性,最大程度地了解用户对信息的明确需求与潜在需求、当前需求与长远需求个性化信息服务适应动态变化的个性需求,1.2 网络信息资源个性化服务的特点,针对性,高效性,用户满意是个性化信息服务的出发点和归宿点,面向用户的个性化信息服务提高了信息需求的满足度,速度更快、容量更大。查全率和查准率得到很大的提高,个性化信息服务对网络信息资源进行自动化处理,使用户的需求能够得到高效、准确、及时的反馈。,2 网络信息资源个性化服务方式,分类定制是指信息用户可以按照自己的目的和需求,在某一特定系统功能服务形式中,自己设定信息的资源类型、
3、表现形式、选择特定的系统服务功能等。通过分类定制,用户每次登录网站时,只要键入自己的用户名和密码,服务器根据用户信息数据库将查询结果主动推送给信息用户,并利用动态网页生成用户定制的动态页面。RSS订阅,2 网络信息资源个性化服务方式,智能代理技术很好的解决了用户无法贴切、完全地表达出自己的爱好、兴趣和需求的问题。它是一种能够完成委托任务的智能计算机系统,能模仿人的行为执行一定的任务,不需要或很少需要用户的干预和指导。智能化代理通过跟踪用户在信息空间中的活动,自动捕捉用户的兴趣、爱好,主动搜索可能引起用户兴趣的信息并提供给用户。,2 网络信息资源个性化服务方式,协调过滤服务主要是把用户的偏好与其
4、他用户的偏好进行比较,建立偏好群体的描述,然后假定这个特定用户与这个同偏好群体的需求相同,对其需求内容进行推荐。,2 网络信息资源个性化服务方式,垂直门户是和综合性及水平门户相对应的概念,它通过汇聚网上某一特定专题信息资源,并对其进行挖掘和加工,以满足用户基于专业的深入的信息需求。,系统帮助用户修改检索提问式,如当用户输入一个检索词,系统就会将检索词与内部词表中相关词进行比较,并在界面上显示各种与该词有逻辑关联性的词组,以供用户选择。通过帮助用户选择更接近自己检索目标的检索词来提高信息查询效率。,2 网络信息资源个性化服务方式,信息呼叫中心主要利用电话、传真等方式来服务客户,处理简单的呼叫流程
5、。信息呼叫中心引入客户关系管理,建立客户数据库,对信息进行分析、处理、采集和挖掘,使呼叫中心可以得到每个客户的详细信息,由此为客户提供一对一的个性化服务。,2 网络信息资源个性化服务方式,3 网络信息资源个性化服务实现过程,1.用户描述文件的表达与更新,2.资源描述文件的表达,3.个性化推荐,4.个性化服务体系结构,3.1用户描述文件的表达与更新,收集用户描述文件前应考虑问题:有没有现成的标准?收集什么数据?收集的数据用于什么目的?如何收集数据?根据什么信息源来收集?收集的数据如何组织?用户信息能否自适应地更新?,调查显示80%的用户愿意向Web站点提供自己的姓名、性别、年龄、教育背景和兴趣,
6、但大多数用户不愿意提供私有、敏感的信息,比如个人收入和信用卡号等28%的用户愿意Web站点向其他Web站点共享自己的信息,3.1用户描述文件的表达与更新,可以表示为用户浏览模式或访问模式,可以表示为加权矢量模型、类型层次结构模型、加权语义网模型、书签和目录结构等,3.1用户描述文件的表达与更新,用户注册基本信息,系统隐式收集用户信息,用户描述文件一,系统自适应修改(显示跟踪、隐式跟踪),用户修改,用户描述文件,3.1用户描述文件的表达与更新,系统可以要求用户反馈自己对推荐资源的喜好程度。一般情况下,这种做法很难收到实效,因为很少有用户向系统主动表达自己的喜好。行为跟踪.用户行为可以表现为查询、
7、浏览页面和文章、标记书签、反馈信息、点击鼠标、拖动滚动条、前进、后退等等。文献的研究表明,用户查询、访问页面、标记书签能有效揭示用户的兴趣.日志挖掘,利用Web日志可以获得页面的点击次数、页面停留时间和页面访问顺序等信息。通过分析Web日志可以获得相关页面、相似用户群体和用户访问模式等信息,3.1用户描述文件的表达与更新,将用维变量构建数据立方体(URL、资源类型、大小、时间),首先清除日志中无关的信息,将有效数据存放到数据库中,进行在线分析处理,通过对数据立方体的切块和切片,分析用户在不同域的分布情况,分析用户对资源的使用情况等等.,利用各种数据挖掘方法来预测、分类和发现有意义的关系,3.2
8、资源文件的表达,基于内容的方法是从资源本身抽取信息来表示资源,使用最广泛的方法是用加权关键词矢量.对文档来说,关键的问题是特征选取,特征选取要达到两个目标:一是选取最好的词;二是选取的词最少.要抽取特征词条,需要对文档进行词的切分,在切分的同时,利用停用词列表(stop word)从文档特征集中除去停用词,在完成词切分后,接着除去文档集中出现次数过少和过多的词.经过这些处理后,特征数目一般还很大,还需对特征进行进一步的选取,以降低特征的维数.在完成文档特征的选取后,还得计算每个特征的权值,使用最广泛的是TFIDF方法,对某一特征,TF(term frequency)表示该特征在文档中出现的次数
9、,IDF(inverse document frequency)表示log(所有文档数/包含该特征的文档数).矢量模型的代价是比较大的,有时为了加快处理速度,可以只考虑TF一项,3.2资源文件的表达,基于分类的方法是利用类别来表示资源,对文档资源进行分类有利于将文档推荐给对该类文档感兴趣的用户.文本分类方法有多种,比如:朴素贝叶斯(Nae-Bayes),k最近邻方法(KNN)和支持向量机(SVM)等。资源的类别可以预先定义,也可以利用聚类技术自动产生。许多研究表明:聚类的精度非常依赖于文档的数量,而且由自动聚类产生的类型可能对用户来说是毫无意义的,因此可以先使用手工选定的类型来分类文档,在没有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 信息资源 个性化 服务 成功 案例

链接地址:https://www.31ppt.com/p-6334852.html