电子商务-B-第09讲.ppt
《电子商务-B-第09讲.ppt》由会员分享,可在线阅读,更多相关《电子商务-B-第09讲.ppt(88页珍藏版)》请在三一办公上搜索。
1、电 子 商 务,张文新 副教授,电话:,课 程 安 排,3/34,引言,美国的超市有这样的系统:当你采购了一车商品结账时,售货员小姐扫描完了你的产品后,计算机上会显示出一些信息,然后售货员会友好地问你:我们有一种一次性纸杯正在促销,位于F6货架上,您要购买吗?这句话决不是一般的促销。因为计算机系统早就算好了,如果你的购物车中有餐巾纸、大瓶可乐和沙拉,则86%的可能性你要买一次性纸杯。结果是,你说,啊,谢谢你,我刚才一直没找到纸杯。,第9讲,电子商务商品推荐技术,内容提要,9.1.商品推荐系统概述9.2.商品推荐相关技术9.3.商品推荐系统开发案例,6,9.1.商品推荐系统概述,电子商务推荐系统
2、的作用:将电子商务网站的浏览者转变为购买者(Converting Browsers into Buyers)提高电子商务网站的交叉销售能力(Cross-Sell)提高客户对电子商务网站的忠诚度(Building Loyalty),亚马逊30%的销售额来自于推荐,推荐系统提高顾客忠诚度,在电子商务环境下,客户只需一个鼠标点击就去了竞争者的购物网站,如何获得客户的忠诚度是非常重要的商业战略考虑;推荐系统不断学习客户的购买行为,购买偏好,从而推荐出最满足客户个性化需求的商品,所以客户就会重复光顾能最好满足自身需求的购物网站。,推荐引擎为购物网站,提高交叉销售,提高升级销售,提升销售转化率,提升网站竞
3、争力,提升顾客购物体验,提升顾客忠诚度,推荐引擎,购物网站,推荐引擎的行业应用,用户特征数据商品数据购买数据浏览数据评级数据,关联规则协同过滤基于内容推荐组合推荐,购物网站零售门户网站银行证券保险,数据仓库,数据挖掘,行业应用,11,9.1.商品推荐系统概述,电子商务推荐系统的界面表现形式Browsing:根据客户查询要求返回高质量的推荐Similar Item:推荐系统根据客户购物篮中的商品和客户可能感兴趣的商品推荐类似的商品Email:通过电子邮件的方式通知客户可能感兴趣的商品信息Text Comments:向客户提供其他客户对相应产品的评论信息Average Rating:向客户提供其他
4、客户对相应产品的等级评价 Top-N:根据客户的喜好向客户推荐最可能吸引客户的N件产品 Ordered Search Results:列出所有的搜索结果,并将搜索结果按照客户的兴趣降序排列,多种推荐服务,13/45,14/45,15/45,电子商务推荐导航系统的发展趋势:推荐系统更能体现用户个性化需求,为用户和电子商务营销决策者提供更个性化和智能化的服务。目前研究热点在于:基于关联规则获取用户兴趣知识;基于案例推理实现协同过滤;基于Web挖掘实现语义分析等。,9.1.商品推荐系统概述,个性化的推荐系统,如果我有2百万个网络顾客,我就应该有2百万个网络商店.(“If I have 2 milli
5、on customers on the web,I should have 2 millions stores on the web.”)Jeff Bezos,CEO of A,9.2.商品推荐相关技术,商品推荐相关技术协同过滤技术(CF,Collaborative Filtering)数据挖掘技术(DM,Data Mining),9.2.商品推荐相关技术,协同过滤技术KNN技术(K-Nearest Neighboring)基于聚类(Clustering-based)的协同过滤基于项目(Item-based)的协同过滤,9.2.商品推荐相关技术,协同过滤技术协同过滤技术的缺陷需要用户提供主观的
6、评价信息;不能处理大规模的数据量;用户的评价信息可能会过时;使用不方便。,9.2.商品推荐相关技术,数据挖掘技术关联规则(Association Rules)发现;序列模式(Sequence Pattern)发现;聚类(Clustering)技术;Web挖掘(Web Mining)技术。,22/34,关联分析:数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。关联分析的
7、关键是关联规则挖掘。,9.2.商品推荐相关技术,23/34,基本概念:关联自然界中某种事物发生时其他事物也会发生的这样一种联系称之为关联。关联是两个或多个变量取值之间存在的一类重要的可被发现的某种规律性。关联可分为简单关联、时序关联、因果关联。,9.2.商品推荐相关技术,24/34,基本概念:关联分析关联分析目的是寻找给定数据记录集中数据项之间隐藏的关联关系,描述数据之间的密切度。关联分析的结果常有两种:关联规则和序列模式。关联规则用于寻找在同一个事件中出现的不同项的相关性;序列模式寻找的是事件之间时间上的相关性。,9.2.商品推荐相关技术,25/34,基本概念:关联规则关联规则是描述在一个交
8、易中物品之间同时出现的规律的知识模式,更确切的说,关联规则是通过量化的数字描述物品X的出现对物品Y的出现有多大的影响。关联规则发现的主要对象是交易型数据库,一个交易一般由交易处理时间,一组顾客购买的物品,有时也有顾客标识号(如信用卡号)组成。,9.2.商品推荐相关技术,26/34,基本概念:关联规则关联规则举例:以零售业为例,体育用品商场通过对销售数据进行关联分析通常可以发现这些数据中常常隐含形式如下的规律“购买篮球的顾客中有70%的人同时购买篮球运动服,所有交易中有40%的人同时购买篮球和篮球运动服”等等。这些规律即关联规则。,9.2.商品推荐相关技术,27/34,基本概念:关联规则形式化定
9、义关联规则挖掘的交易数据集记为D(一般为交易数据库),DT1,T2,Tk,,Tn,Tk(k1,2,,n)称为交易,对应每一个交易有唯一的标识,记作TID。元素im(m1,2,,p)称为项。设I=i1,i2,im是D中全体项组成的集合,且TkI。,设X是一个I中项的集合,如果XTk,那么称交易Tk包含项集X。若X,Y为项集,XI,YI,并且XY=,则形如X=Y的表达式称为关联规则。,9.2.商品推荐相关技术,28/34,关联规则度量置信度:X出现的前提下,Y出现的频率,即:P(Y|X)支持度:X、Y同时出现的频率,即:P(XY),9.2.商品推荐相关技术,29/34,关联规则度量置信度:X出现的
10、前提下,Y出现的频率,即:P(Y|X)规则XY在交易数据集D中的置信度是对关联规则准确度的衡量。度量关联规则的强度。即在所有出现了X的活动中出现Y的频率,即规则XY的必然性有多大。记为confidence(XY)。计算方法:包含X和Y的交易数与包含X的交易数之比:confidence(XY)=P(YX)=|T:XYT,TD|/|T:XT,TD|100%,9.2.商品推荐相关技术,30/34,关联规则度量支持度:X、Y同时出现的频率,即:P(XY)规则XY在交易数据集D中的支持度是对关联规则重要性的衡量,反映关联是否是普遍存在的规律,说明这条规则在所有交易中有多大的代表性。即在所有交易中X与Y同
11、时出现的频率记为:support(XY)。计算方法:交易数据集中同时包含X和Y的交易数与所有交易数之比:support(XY)=P(XY)=|T:XYT,TD|/|D|100%(其中|D|是交易数据集D中的所有交易数),9.2.商品推荐相关技术,31/34,商品推荐的方法-关联规则挖掘关联规则挖掘:在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性、或因果结构。描述:给定:(1)交易数据库(2)每笔交易是:一个项目列表(消费者一次购买活动中购买的商品);查找:所有描述一个项目集合与其他项目集合相关性的规则。应用:购物篮分析、交叉销售、产品目录设计、聚
12、集等。,9.2.商品推荐相关技术,32/34,关联规则度量:支持度与置信度,支持度:X、Y同时出现的频率,即:P(XY)置信度:X出现的前提下,Y出现的频率,即:P(Y|X),9.2.商品推荐相关技术,33/34,设最小支持度为50%,最小置信度为 50%,则可得到:A C(50%,66.6%)C A(50%,100%),关联规则度量:支持度与置信度应用举例:,9.2.商品推荐相关技术,支持度:A、C同时出现的频率,即:P(AC)置信度:A出现的前提下,C出现的频率,即:P(C|A),34/34,关联规则挖掘算法之一:Apriori算法,对于 A C:support=support(A、C)=
13、50%confidence=support(A、C)/support(A)=66.6%Apriori的基本思想:频繁项集的任何子集也一定是频繁的,最小值支持度 50%最小置信度 50%,9.2.商品推荐相关技术,35/34,9.2.商品推荐相关技术,关联规则挖掘的关键步骤:挖掘频繁集频繁集:是指满足最小支持度的项目集合;频繁集的子集也一定是频繁的,如,如果AB 是频繁集,则 A B 也一定是频繁集;从1到k(k-频繁集)递归查找频繁集;用得到的频繁集生成关联规则。,问:对于上页的E是否频繁集?,答:否,支持度为25%50%,36/34,Apriori算法连接:用 Lk-1自连接得到Ck修剪:一
14、个k-项集,如果他的一个k-1项集(他的子集)不是频繁的,那他本身也不可能是频繁的。Apriori算法伪代码:Ck:Candidate itemset of size kLk:frequent itemset of size k C1all Candidate itemset of size from DatabaseL1=candidates in C1 with min_supportfor(k=1;Lk!=;k+)do beginCk+1=candidates generated from Lk;for each transaction t in database do incremen
15、t the count of all candidates in Ck+1 that are contained in t Lk+1=candidates in Ck+1 with min_support endreturn k Lk;,逆反定理:如果 A B 不是频繁集,则AB也一定不是频繁集。,9.2.商品推荐相关技术,37/34,Apriori算法算例现有A、B、C、D、E五种商品的交易记录表,试找出三种商品关联销售情况(k=3),最小支持度=50%。,9.2.商品推荐相关技术,38/34,算例解答,K=1,支持度50,9.2.商品推荐相关技术,39/34,算例解答,9.2.商品推荐相关
16、技术,9.2.商品推荐相关技术,数据挖掘技术Web挖掘技术的优点不需要用户提供主观的评价信息;可以处理大规模的数据量;用户访问模式动态获取,不会过时;使用方便。,9.2.商品推荐相关技术,基于Web挖掘的商品推荐基于Web使用挖掘的商品推荐基于Web使用挖掘和Web内容挖掘的商品推荐,9.2.商品推荐相关技术,基于Web挖掘的商品推荐基于Web使用挖掘的商品推荐基本思路:分析Web日志数据,利用数据挖掘方法发现用户的使用模式,从而向用户提供个性化服务基本过程:离线部分:数据预处理+总体使用特征获取在线部分:推荐引擎,9.2.商品推荐相关技术,基于Web挖掘的商品推荐基于Web使用挖掘的商品推荐
17、基本过程:离线部分:数据预处理数据清洗(Data Cleaning)会话识别(Session Identification)浏览页识别(Pageview Identification)事务识别(Transaction Identification),9.2.商品推荐相关技术,数据预处理的结果浏览页集合P表示为:P=p1,p2,pn用户事务集合T表示为:T=t1,t2,tm每一个事务t T均表示为为浏览页集合P的n维向量:t=,9.2.商品推荐相关技术,基于Web挖掘的商品推荐基于Web使用挖掘的商品推荐基本过程:离线部分:总体使用特征获取路径完善(Path Completion)用户识别(Us
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电子商务 09

链接地址:https://www.31ppt.com/p-4987607.html