数据挖掘技术在电子商务中的运用.docx
本科毕业论文论文题目: 数据挖掘技术在电子商务中的应用 学生姓名: 薛云霞 学号: 200602410089 专业: 信息管理与信息系统 指导教师: 曲建华 学 院: 管理与经济学院 1 2010 年5月6 日毕业论文(设计)内容介绍论文(设计)题 目数据挖掘技术在电子商务中的应用选题时间2009年12月完成时间2010年5月论文(设计)字数12,400关 键 词数据挖掘技术;电子商务;客户关系管理论文(设计)题目的来源、理论和实践意义:题目来源:导师指导下自选题目理论和实践意义:随着网络的普及和电子商务网站的发展,电子商务已经作为一种信息时代国际通行的商务模式,其深入发展引发了自工业革命经济领域一场最广泛、最深刻的变革。电子商务网站的推广和普及已经成为中国企业提高核心竞争力的必然要求。由于Web提供的信息是繁琐的,并且有很多无用的信息,所以这就需要人们必须使用一种技术来提取有用的信息为商家的决策提供服务。数据挖掘技术是从大量的数据中提取蕴涵的、未知的、有潜在使用价值的信息和知识从而为市场决策提供服务。所以随着Internet 技术和数据库技术的飞速发展,以网络为载体、利用数字化电子方式开展的商务活动逐渐成为Web数据挖掘的一个重要应用方向。因此,本文简单介绍了电子商务和数据挖掘技术的基本概念,分析了电子商务发展的基本现状,并主要介绍了数据挖掘技术在电子商务中应用和存在的问题,对我们企业在电子商务中应用数据挖掘技术具有重要的理论和实践意义。论文(设计)的主要内容及创新点:主要内容:随着Internet和电子商务网站的飞速发展,Web已经成为人们获取信息的一个重要途径。如何从这些海量的数据中找到有用的数据,如何发现用户的兴趣,为客户提供个性化的服务成为目前电子商务网站发展的关键。数据挖掘技术正是在这种背景下和电子商务结合在一起。本文简单介绍了电子商务和数据挖掘技术的基本概念,并主要介绍了数据挖掘技术在电子商务中应用和存在的问题,并提出了一些对策。创新点:本文主要介绍了数据挖掘技术在电子商务中的应用,并调查研究了数据挖掘技术在电子商务中应用的现状,发现了一些问题,并提出了一些解决方法。附:论文(设计)本人签名: 2010 年 5 月 10 日 目 录中文摘要1英文摘要1第1章 引言2第2章 目前电子商务的现状22.1电子商务的概述22.2中国电子商务的发展状况3第3章 数据挖掘技术53.1数据挖掘的定义53.2数据挖掘的功能53.3数据挖掘的方法6第4章 数据挖掘技术在电子商务中的应用74.1数据挖掘技术在电子商务中应用的可行性分析74.2电子商务中的数据挖掘过程84.3数据挖掘技术在电子商务中的应用94.4电子商务中数据挖掘应用的现状和解决方法134.5数据挖掘技术在电子商务中应用的前景14第5章 结语14参考文献15数据挖掘技术在电子商务中的应用 薛云霞摘要:随着Internet和电子商务的发展,网上购物已经成为我们生活中不可或缺的一部分。Web积累了海量的数据,如何把这些海量的数据转化为有用的数据,如何了解顾客的兴趣和爱好,为顾客提供个性化的服务成为目前电子商务发展的关键问题。数据挖掘技术应用于电子商务中正是在这种背景下产生的。数据挖掘技术是从大量的数据中提取蕴涵的、未知的、有潜在使用价值的信息和知识,它为市场分析和决策提供了依据。本文简单介绍了电子商务的基本概念及其电子商务的应用现状,然后介绍了数据挖掘技术的基本概念;接着主要对数据挖掘技术在电子商务中的应用进行了研究,指出了实际应用中存在的一些问题,并提出了解决方法。关键词:数据挖掘技术,电子商务,客户关系管理中图分类号:TP393The Application of Data Mining in the Electronic Commerce Xue yunxiaAbstract:With the development of Internet and E-commerce ,shopping-online has become a necessary part of our everyday life.With the development of Internet,Web provides abundant data resources.The key problem to the development of E-commerce is how to make use of E-commerce information and how to find out the interest of customers ,providing pernonalized service for customers .The application of data mining in the E-commerce comes into being in the backgrounds. Data mining is a technique ,which can extract implicit ,undiscovered, potential,useful information and knowledge and which can help the market to analyse and make decisions. This paper simply discusses some basic cocepet about E-commerce and data mining ,and the application actuality of E-commerce. This paper is mainly focused on application of data mining in Elecotronic Commerce,and finds out some problems and simply puts forward some solutions to these problems.Key words:Data mining technique,E-commerce,Customer Relationship Management 第1章 引言电子商务的发展已经成为一种必然趋势。为客户提供个性化的服务是目前电子商务研究领域的重点和难点。随着Internet的飞速发展和普及,公司建立自己的电子商务网站已经成为一种必然趋势。新的商业环境给企业带来很多商业机会,同时也带来了很多的挑战。电子商务网站从“以站点为中心”向“以用户为中心”成为一种必然。如何对信息进行有效地组织和利用,如何给客户以个性化的界面,开展有针对性的电子商务服务成为电子商务迫切要解决的问题。数据挖掘技术就是在这种网络时代和商业背景下产生的。数据挖掘技术就是将经典的统计学方法、现代的智能化算法同数据库技术结合起来,从海量的数据中发现新的规律和新的知识的一种技术1。本文就是运用数据挖掘技术中的关键技术关联分析、聚类分析等来解决电子商务的关键问题。本文遵循着基础与铺垫、可行性论证、突出重点这样循序渐进的过程展开论述,旨在介绍数据挖掘技术在电子商务中的应用。第2章 目前电子商务的现状由于传统商务活动大部分依靠面对面及书面文档传递为主,使传统商务具有信息不完善、耗费时间长、花费高、库存和产品的积压、生产周期长、客户服务有限等局限性。并且随着网络的发展,电子商务表现了它的优越性,得到了迅速发展2。但在发展的同时,也面临着很多问题。2.1电子商务的概述2.1.1电子商务的定义电子商务,英文是Electronic Commerce,简称EC。所谓电子商务,就是在网上开展商务活动。电子商务通常是指是在全球各地广泛的商业贸易活动中,在因特网开放的网络环境下,基于浏览器/服务器应用方式,买卖双方不见面地进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电子支付以及各种商务活动、交易活动、金融活动和相关的综合服务活动的一种新型的商业运营模式3。2.1.2电子商务的分类电子商务按照主体可以分为三类:B2C、B2B、C2C4。 1、B2C:企业与个人交易的平台。应该说是企业做为卖家,个人做为买家的平台,就是企业做好商品推广的网站。比如当当书店。2、B2B:企业与企业交易的平台。比如阿里巴巴。3、C2C:个人与个人交易的平台。比如淘宝,易趣。2.1.3电子商务的优势电子商务带来的不仅是一种技术变革,它还带来了一种通过技术的辅助、引导、支持来实现的商业活动本身发生的根本性的革命。它不仅改变交易的方式,还更新了人们的消费观念和生活方式,改变了人与人之间的关系。具体有以下几个优点:1、交易可以跨越时空。交易双方可以在世界的任何一个地方,交易可以在任何时间进行,打破了传统电子商务活动时间和空间的约束。2、交易的方便性。消费者真正能够足不出户,就可货比三家,同时能够以一种轻松自由的自我服务的方式来完成交易。通过互联网,商家之间可以直接交流,谈判,签合同,消费者也可以把自己的反馈建议反映到企业或商家的网站,而企业或者商家则要根据消费者的反馈及时调查产品种类及服务品质,做到良性互动。3、交易的成本大大降低。电子商务使供应链缩短,各方面管理成本的大幅度降低。4、电子商务所具有的开放性和全球性的特点,为企业创造了更多的贸易机会。 2.2中国电子商务的发展状况2.2.1中国电子商务发展的情况随着中国总体经济的强势增长和Internet的发展,中国的电子商务市场发展很迅速。中国电子商务市场中,B2B电子商务是最重要的一部分。根据艾瑞咨询统计数据显示,09年中国企业通过电子商务交易规模占整体交易规模(线上和线下交易规模)的比例达到11.3%,稳中有升5。根据艾瑞咨询调查显示,在全球经济危机下,使用电子商务的线上中小企业的存活率要高出传统线下企业5倍,所以金融危机让更多的中小企业认识到电子商务的优势,电子商务平台能够给中小企业提供更有效的推广方式,降低推广成本5。因此,B2B电子商务交易规模所占比例得到提高,提高的部分主要来自于两方面,一方面,利用电子商务平台获取信息的中小企业的数量在上升;另一方面,部分原有利用电子商务平台的中小企业,其线上交易量在增长。2007年-2013年中国B2B电子商务交易规模,如图(1):2007年-2013年中国B2B电子商务交易规模 图(1)当前中国电子商务发展具有网络基础设施发展迅速,应用环境逐步完善;电子商务教育和培训发展较快;越来越多的企业认知电子商务,并开始起步应用较好,开始发挥作用。2.2.2中国电子商务应用中面临的挑战1、Web站点对客户来说,基本上还是一个“哑终端”。 虽然 Web 站点的软硬件设施已得到了广泛的重视,保证了 Web 站点拥有良好的运行性能,但是客户却对Web站点的信息很不熟悉,对商家来讲仅是一条 24 小时不停运转的电子交易输入通道。2、随着电子商务网站规模日渐扩大,其庞大数据量和复杂的站点结构,往往使客户手足无措,无法顺利找到自己需要的商品或信息。商家和卖家在商品属性上无法达成共识,使买家无法找到自己想要的商品。尽管商家提供了很多的方式供买家查询商品的属性,但是商品的属性往往是由商家定义的,买家和商家对商品属性的认识是不相同的,因此买家往往会找不到自己所需要的商品6。总体来说,中国的电子商务发展很迅速,发展势头良好。但是由于起步晚,基础差,所以和发达国家的差距还很大。但是企业建立电子商务网站已经成为一种必然趋势,如何从冗余的、不准确的数据中发现有用的信息和知识,了解顾客的爱好和价值取向,为用户提供个性化的服务已经成为各个企业面临的关键问题。第3章 数据挖掘技术3.1数据挖掘的定义数据挖掘,英文是Data Mining,简称DM。所谓数据挖掘是从大量数据中提取有效的、未知的、易于理解的、有依据的信息,并据此做出商务决策的过程7。数据挖掘从本质上说是一种新的商业信息处理技术。数据挖掘技术把人们对数据的应用,从低层次的联机查询操作,提高到决策支持、分析预测等更高级应用上8。3.2数据挖掘的功能1、预测分析。预测分析是分析现有的数据集并以此发现数据的重要特征,并据此对未来数据进行判定或预测。预测分析可以分为值预测和分类预测两种方法。值预测是利用一些已知变量的值来预测其他变量的值(如回归分析);或者利用某个变量的过去值来预测其未来值(如时间序列分析)。分类预测的目的在于发现每一类的属性特征。例如,如果将信用卡用户的信用等级作为类标签,银行管理人员希望分类模型能够挖掘出每种信用等级的用户特征,一个可能的结论是:年龄在30-40岁之间、收入在8000元以上、住在××街区的用户信用等级为优1。依据这些分类特征,管理人员可以对申办信用卡的用户做出信用等级的初始判断,以辅助决策。决策树和人工神经网络是构建分类模型的常用技术。2、关联分析。关联分析用于发现数据项之间的关联规则,定义:若X、Y为项目集,且XY=,则:蕴涵式X=>Y成为关联规则9;关联规则就是从给定的数据集中搜索数据项之间所存在的有价值的关联。比如,一家卖电子商品的商店,发现买计算机的顾客80%也会买系统软件。这就说明计算机和系统软件之间有着某种关联。3、聚类分析。聚类分析的目的就是把相似的对象归为类,研究的主要内容是度量相似性以及构造聚类的具体方法。聚类模型使用无指导学习来发现数据集中的同构成分,产生数目不定的、含有相似数据的数据子集。例如,企业可以根据客户交易历史,进行客户聚类,发现高价值用户,并据此加强客户关系管理。4、分类分析。分类分析用于找出一个类别的概念描述,这个概念描述代表了这类数据的整体信息,即该类的内涵描述,一般用规则或决策树模式表示。5、偏离检测。偏离检测通过应用统计方法和可视化技术来发现数据集中的孤立点,从而发现与期望或规范相背离的异常事件。3.3数据挖掘的方法数据挖掘有很多方法,包括关联规则方法、聚类分析方法、人工神经网络方法、遗传算法、粗糙集方法、决策树方法、统计方法、可视化技术等。下面就上述八种方法解释如下:1、关联规则方法:关联规则,是在数据挖掘中最先使用的最基本的技术。关联规则是从大量的数据中提取或“挖掘”出有用的知识,它能对过去的数据进行查询和遍历,找出过去数据之间的潜在联系,从而促进信息的显化10。2、聚类分析方法:聚类分析是一种经典的统计学方法,它同数据库技术结合形成了现代数据挖掘的常用技术之一。聚类分析就是从给定的数据集中搜索数据对象之间所存在的有价值的联系,一个聚类中的所有对象常常被当作一个对象来进行处理或分析11。在商业上,聚类分析可以帮助市场人员发现顾客群中所存在的不同特征的组群,并可以利用购买模式来描述这些具有不同特征的顾客组群。3、人工神经网络方法:人工神经网络和遗传算法,都是仿生研究方法,或仿生算法。它们通过模拟生物学的某些功能,创造一些优化算法,寻找世界的规律。人工神经网络在结构上仿照生物学的神经网络,构造一个简化的只有输入层、输出层和隐含的中间层的含有非线性特征的网络。优点是对噪声数据有较好的适应能力,并且对未知数据也具有较好的预测分类能力。但是人工神经网络分类方法获取的模式隐含在网络结构中,而不是显式的表达为规则,不容易被人们理解和解释。而且还需要多次扫描训练数据,网格的训练时间较长。4、遗传算法方法:简称GA,主要借用了生物进化中“适者生存”规律。其模拟生物的进化和遗传,借助选择、交叉和变异操作,使得要解决的问题从初始解逐步接近最优解,解决了许多全局优化问题。5、粗糙集算法:可以用于分类问题,以帮助发现不准确或噪声数据中所存在的结构关系,是现在数据挖掘中最有力的工具。但它只能处理离散量,连续量必须首先进行离散化后方可使用。利用粗糙集可以近似或粗略的定义集合(类别)。对于一个集合的粗糙集定义是通过两个集合,一个上近似集合和下近似集合来描述。上近似集合包含那些肯定不属于它的数据样本,下近似集合包含那些肯定无疑是属于它的数据样本。6、决策树方法:决策树方法是利用信息论中的信息增益寻找数据库中具有最大信息量的属性字段,从而建立决策树的一个结点,再根据该属性字段的不同取值建立树的分支,最后在每个分支子集中再重复建立树的下层结点和分支的过程。具有速度较快、较易转化成简单且容易理解的分类规则、较易转换成数据库查询语句等优点。7、统计学:旨在从抽样分析中提取未知的数学模型,在数据挖掘中常常会涉及一定的统计过程,如数据抽样和建模、判断假设以及误差控制等。8、可视化技术:采用直观的图形方式将信息模式、数据的关联及趋势呈现给用户,以便用户交互的分析数据关系。第4章 数据挖掘技术在电子商务中的应用4.1数据挖掘技术在电子商务中应用的可行性分析4.1.1数据挖掘技术在电子商务中应用的必要性随着Internet和企业信息化的发展,企业建立自己的电子商务网站已经成为一种发展趋势。而Web产生了海量的数据,这些数据中含有很多冗余的、不准确的数据。如何对这些的数据进行有效的组织利用,从而发现客户的兴趣和价值取向,加强网站架构,为客户提供个性化的服务,是电子商务网站必须要解决的问题。而数据挖掘技术是从大量的数据中找出蕴藏的、有价值的数据,运用数据挖掘中的关联分析、聚类分析等可以发现潜在用户、预测用户的行为,为企业做市场分析和决策提供依据。4.1.2数据挖掘技术在电子商务中应用的可行性数据挖掘从技术上看,它直接服务于数据分析工作的;在本质上说是一种新的商业信息处理技术。它通过对数据进行微观、中观乃至宏观的统计、分析预测、综合和推理,发现数据间的关联性、未来趋势以及一般性的概括知识等,这些知识性的信息可以用来指导高级商务活动;从商业角度看,数据挖掘就是按照企业的既定业务目标,对大量的企业数据进行深层次分析以揭示隐藏的、未知的规律并将其模型化,从而支持商业决策活动。企业利用搜索引擎技术,通过 ETL (数据抽取转换装载)工具进行数据整合,借助数据挖掘技术,对电子商务交易数据进行深入的分析,从而为正确的电子商务应用决策提供强有力的支持和可靠的保证。数据挖掘技术不仅帮助卖家更深入的了解买家的需求、购买力以及购物行为特征,挖掘潜在的买家,而且有助于买家更好的了解商品,为买家提供便利的交易方式和广泛的选择。对于买家和卖家都具有一定的实用价值和现实意义。4.2电子商务中的数据挖掘过程数据挖掘分为四个阶段:元数据收集、数据预处理、模式发现和模式分析12。1、元数据收集:在Web使用挖掘中,数据最直接的来源是Web服务器。客户访问服务器就会在服务器上产生相应的服务器数据,这些数据可以分为日志文件和查询数据。日志文件记录用户的访问信息,查询数据是用户在查询自己需要的信息时在服务器端产生的记录。2、数据的预处理:服务器上的数据一般都是模糊的、冗余的、不完全的,要想得到简洁、准确的数据必须经过数据的预处理过程。预处理主要对用户访问日志进行数据清洗、用户的唯一性识别、用户的会话识别、完善访问路径和事务识别等处理。(1)数据清洗:目的是从服务器日志文件中消除不相干的项,缩小被挖掘数据对象的范围。(2)用户的唯一性识别:可以通过分析用户方的日志文件和采用catch busting技术,并借助其他一些信息来实现,例如IP地址。另外可以参考网络站点的拓扑结构信息。(3)用户的会话识别:目的是将每个用户的访问信息划分为若干个独立的会话进程,最简单方法是采用超时估计,即当页面之间的请求时间间隔超过了规定的时间范围,就可以认为用户已经开始进行一次新的会话。(4)完善访问路径:如果一个页面请求信息与该用户上次请求的页面没有直接的链接关系,可以查看参考日志文件来决定这个页面来自哪个页面的链接。(5)事务识别:目的是依据数据挖掘任务的需求将事务进行分割或合并处理,使其适合于数据挖掘需求的分析。3、模式发现:模式发现阶段就是利用挖掘算法挖掘出有效地、新颖的、潜在的、有用的及最终可以理解的信息和知识。其中应用于Web使用挖掘的技术有路径分析、关联规则的发现、序列模式的发现、分类聚类技术。(1)路径分析:通过对网站结构图和用户的访问信息分析可以得出路径图,通过路径图可以判定一个Web站点中最频繁访问的路径,例如通过路径分析可以得出:70%的客户在浏览4个或更少的页面后离开了。(2)关联规则的发现:找到客户访问网站上各种文件之间的相互关联13。例如:50%的用户访问Web页面A公司的B产品时,也访问了A公司的D产品。(3)序列模式的发现:目的是在时间戳有序的事务集中,找到那些“一些项跟随另一个项”内部事务模式。如:在A公司B产品上进行在线订购的顾客中哟70%的在一个月内也在A公司的C产品上下过订单。(4)分类和聚类技术:分类技术可以从个人信息或共同的访问模式中得出访问某一服务器文件的用户特征。分类技术可以通过决策树方法、贝叶斯分类法来实现。聚类分析可以从Web访问信息数据中聚类出相似特性的客户,可实现自动给一个特定的顾客聚类发送销售邮件,为一个顾客聚类动态的改变一个特殊的站点。4、模式分析:模式分析主要是为了从模式发现算法找到的模式集合中筛选出有趣的模式。模式分析的形式可以像SQL那样知识查询机制,也可以把Web使用数据装入数据仓库,以便执行联机分析处理操作。4.3数据挖掘技术在电子商务中的应用数据挖掘技术在电子商务中的应用越来越普遍,也越来越受到电子商务管理者的重视。目前Web数据挖掘技术在电子商务中的应用主要体现在以下四个领域。4.3.1数据挖掘在网站设计、管理中的应用数据挖掘技术在网站设计、管理中的应用主要体现在以下五个方面:1、网站设计中的数据挖掘在网站建设中,使用数据挖掘技术,通过对网站内容的挖掘,可有效地组织网站信息。例如采用自动归类技术实现网站信息的层次性组织; 分析用户的Web 访问行为,可为用户提供智能化个性化服务14。比如,可根据客户的访问兴趣、访问频度、访问时间,动态地调整页面结构, 迎合每个客户的浏览兴趣。另外,网站还可以根据实际用户的浏览情况,挖掘用户的兴趣点,定期为用户推送相关信息,以及调整网站中网页的链接结构和内容,为用户提供个人的定制服务。2、改进站点设计对Web站点的链接结构的优化可从三方面来考虑:(1)对WebLog的挖掘,发现用户访问页面的相关性,从而对密切联系的网页之间增加链接,方便用户使用。(2)利用路径分析技术判定在一个Web站点中最频繁的访问路径,可以考虑把重要的商品信息放在这些页面中,改进页面和网站结构的设计,增强对客户的吸引力,提高销售量。(3)通过对WebLog的挖掘,发现用户的期望位置。如果在期望位置的访问频率高于对实际位置的访问频率,可考虑在期望位置和实际位置之间建立导航链接,从而实现对Web站点结构的优化。3、序列模式发现发现序列模式便于电子商务的组织者预测客户的行为,为客户提供个性化的服务。使用序列模式分析挖掘Web日志,可以发现客户的访问序列模式,预测出客户未来的访问模式,有的方矢地进行在线推荐或安排广告等营销活动。采用关联规则技术,找出具有一定支持度和置信度的相关联的物品,并且针对客户的动态变化来调整网站的结构,可以使客户直接访问关联商品的链接信息。3、在电子邮件管理中的应用在电子商务中,现实的和潜在的客户往往采用电子邮件咨询电子商务企业商品的性能、价格、安装使用、维护等各种问题。此时,电子商务企业就需要对所接收到的各种电子邮件进行准确、快速的分类。基于数据挖掘的电子邮件过滤、筛选和分类技术则可以从大量的邮件清除垃圾邮件,将有用的客户邮件正确地分发到相应的部门进行及时处理。4、在搜索引擎中的应用网络用户经常使用搜索引擎在网站中搜索自己所希望的商品,有的用户希望利用搜索引擎在整个网络上搜索自己所关心的商品,并希望对这些商品的价格、质量、性能、售后服务进行比较。此时就需要利用搜索引擎进行Web数据挖掘。例如,通过对网页的聚类、分类,实现网络信息的分类浏览与检索,以找到同样类型的商品;通过用户所使用的提问式历史记录的分析,可以有效地进行提问扩展,提高用户的检索效果;运用网络内容挖掘技术改进关键词加权算法,可以提高网络信息的标引准确度,改善检索效果。4.3.2数据挖掘技术在客户关系管理中的应用客户关系管理(Customer Relationship Management,CRM),简单的说,就是对客户关系进行管理的一种思想和技术,换句话说,客户关系管理是一种“以客户为中心”的经营理念,它借助于信息技术在企业的市场、销售、技术支持、客户服务等各个环节的应用,以改善和增进企业与客户的关系,实现以更优质、更快捷、更富个性化的服务保持和吸引更多客户的目标,并通过全面优化面向客户的业务流程使保留老客户和获取新客户的成本达到最低化,最终使企业的市场适应能力和竞争实力有一个质的提高15。数据挖掘可以应用在客户群体分类分析、客户效益分类分析和预测、客户背景分析、客户满意度分析、交叉销售、客户信用分析、客户流失分析、客户的获得与保持等方面16。主要应用在以下六个方面:1、客户的群体分类分析通过对电子商务系统收集的交易数据进行聚类分析,对具有相似浏览行为或客户指标的客户进行分组,找出分组客户的共同特征,从而确定不同类型客户的行为模式。这样可以帮助电子商务的组织者更好地了解自己的客户,向客户提供更适合客户的服务。例如:有一些客户都花了一些时间浏览“森马服饰”页面,经过分析这些客户被聚为一类。商家可以针对该群体的需求,为他们尽可能的发送广告,或者及时的调整页面及页面内容,满足客户的需求。2、客户的效益分类分析和预测客户的利润回报分析是客户效益分类分析和预测的关键。客户利润回报预测是最令人向往的预测类型,也是客户关系管理应用能否替企业实现长期ROI的一个重要环节。通过聚类技术和分类技术可以发现那些客户是中重要的,那些客户是不重要的,对给企业带来利润的客户我们要对他好点,比如赠送礼物,多打折扣等。3、客户满意度分析客户满意度是对某项产品或服务的消费经验的总体评价,是客户通过对一个产品或服务的可感知的效果与其期望值相比较后,所形成的愉悦或失望的感觉状态,是衡量企业经营质量水平的一种方式。它是客户经过长期沉淀而形成的情感诉求,也是客户在历次交易活动中状态的积累。分析客户对企业产品和服务的满意度,可以帮助企业了解客户的想法、需求和期望,发现企业在产品、服务和管理上的不足,为企业改善经营策略、提高客户忠诚度指明方向。通过自定义的定量的度量标准和公式,并根据时间和其他参数,利用数据挖掘技术和企业的数据库中关于客户购买、维修、反馈意见、建议、投诉等信息,可对客户的满意度进行分析,找出客户不满意的原因并制定相应的策略,提高客户忠诚度,增加企业的利润17。4、交叉销售交叉销售是建立在Win-Win原则上的,对客户来讲,要得到更多更好满足并需求的服务并从中受益,对企业来讲,也会因销售额的增长而获益。数据挖掘可以帮助企业分析出最优的、合理的销售匹配。5、客户的获得与保留通过Web数据挖掘可以对潜在客户信息进行聚类和分类的分析,再用模式分析预测那些可能成为新客户,以帮助市场销售人员找到正确的营销对象。Web数据挖掘还可以解释客户的行为习惯,发现在不同情况下有相似行为的新客户,帮助商家识别潜在的客户群,采用积极的营销策略,不断挖掘新客户,提高市场占有率。通过Web数据挖掘,可发现不同的客户群在网站上购买不同的商品,那些客户可能正在流失,那些客户是网站的忠诚客户,那些是赢利客户。针对不同的客户,进行个性化的营销,使他们都成为电子商务企业的忠诚的老客户。6、客户信用分析数据挖掘技术可以为企业提供客户信用分析,如可以为保险索赔、移动电话呼叫、信用卡购买等易于发生欺诈的行业建立模型。4.3.3数据挖掘技术在网络营销中的应用网络营销是指利用Internet技术,最大限度地满足客户需求,以达到开拓市场、增盈利目标的经营过程。它从传统营销的以产品销售为中心的“4P”(Product,Price,Place,Promotion)转向以满足客户需求为中心的“4C”(Customer,Cost,Convenienee,Communication)。数据挖掘在提高营销的有效性、交叉营销等方面有着广泛的应用。1、进行有针对性的营销,提高营销的有效性数据挖掘技术可以通过分析客户点击流等信息,挖掘出客户的行为动机,分析出用户所处的阶段,以帮助电子商务管理者针对用户所处的阶段提供不同的营销策略,向用户进行有针对性的信息反馈和广告发送;数据挖掘技术还可以对市场、客户数据进行恰当的分类挖掘,从而分析出各个层次的细分市场,为电子商务企业定位于自己的目标市场提供可靠的依据。2、交叉营销交叉营销就是指通过与客户交流,向现有的客户提供新的产品和服务的营销过程。企业与其客户之间的商业关系是一种持续的不断发展的关系,通过不断地相互接触和交流,客户得到了更好更贴切的服务质量,企业则因为增加了销售量而获利。基于客户已经购买的商品,推荐客户购买一些相关的商品,建立忠诚度。客户往往愿意到那些最能满足自己需求的网站购物。4.3.4数据挖掘技术在网络广告中的应用企业可以利用数据挖掘技术分析网络广告的有效性、正确的的关联匹配关系和精准发送信息情况等。目的在于提高网络广告的投放率和网络广告的投资回报率(ROI)。1、网络广告的有效性分析网络广告与电视广告、报纸广告等传统媒体广告具有很大的不同,电子商务企业需要根据网络广告的特点,采用数据挖掘技术对网络广告的布局、投放进行挖掘分析,以获得更好的广告效果。利用数据挖掘技术可以对各种广告进行分类,了解其点击率、分析广告在点击以后的商品销售情况,以判断广告的实际有效性。2、网络广告的关联匹配网络广告的的关联匹配是“数据挖掘”和网络广告的结合体。关联匹配广告的实现不仅需要了解网络访问者的习惯,而且还需要使用关联规则对网络广告设计进行分析,以确定哪些广告的链接效果更好,可以使访问者能够更容易受到网络广告的影响去购买企业的商品。3、网络广告的精准发送精准广告发送需要依托网络搜索技术和所积累的庞大的网络访问者行为数据仓库,对网络浏览者的上网行为进行个性化的数据挖掘分析,按电子商务企业的广告需求锁定目标受众,进行一对一传播,向细分人群分类发送他们各自感兴趣的个性化商品信息,实现网络广告的精准投放。为此,电子商务企业需要利用数据挖掘系统对网络访问者的IP地址进行分析跟踪,并利用特征关键词对用户进行分类挖掘,同时与广告产品的特征进行关联、匹配和排序分析,实现有针对性的网络访问者群体的精准投放。4.4电子商务中数据挖掘应用的现状和解决方法数据挖掘技术应用于电子商务中取得了一定成果,通过对服务器数据运用聚类分类分析、关联规则的分析等技术可以为商家做出个性化的营销策略提供依据,提高系统的效率,节省客户的时间,为客户提供个性化的服务。但是由于我国的网络设施还不健全,在电子商务中应用数据挖掘技术要花费大量的人力物力,所以在我国数据挖掘技术应用于电子商务中的力度和广度并不是很理想。即便是应用了数据挖掘技术,效果也不是很理想。下面是数据挖掘技术实施中存在的问题和一些解决方法。1、由于数据挖掘是有数据驱动的,而且不易管理,因此数挖掘很容易遇到数据质量的问题。由于数据库都是动态的、有错误而且不完整,冗余和稀疏并存,当然也就是巨大的。因此在使用恰当的数据挖掘功能和技术的同时,必须小心地分析异常情况,不能将异常情况所造成的结果作为普遍的模式加以应用。2、数据可视化工具的缺乏。数据可视化是一种帮助数据挖掘人员了解数据、获取知识的有力工具。但是在数据挖掘中遇到的数据大多是一些复杂的海量数据,要将其可视化,必须要有复杂的数据可视化工具支持。数据可视化是一种新兴的技术,它可以提高分析员分析数据、获取知识的能力,尤其是在数据维数较低的时候,其效果更加明显。3、许多数据挖掘技术由于极大数据库的存储量过大而出现很多应用问题。例如,过大的查询数据量会对一些特定技术造成困难15。为此可以使用数据抽取技术从击打数库中抽取数据,生成一个数据挖掘数据库,数据挖掘技术就可以在此数据挖掘数据库中应用,而不是在数据仓库中应用。4、成本高,要求管理层必须要有很高的战略眼光。为满足许多数据发现系统的计算要求,需要在硬件、操作系统软件上采用并行技术。这些性能要求将大大增加数据挖掘的成本。针对这一情况,企业领导必须提高认识,为电子商务中应用数据挖掘技术提供可靠的物力和财力支撑。5、商业分析员的技能和素质较差。商业分析员需要丰富的业务知识,并具有极强的调查能力,同时还有创造力。创造性允许商业分析员实验各种数据挖掘技术,一边发现大量潜在的模式和关系。然后分析并了解它,最后生成预测模型并按永和容易理解的方式发布。所以,企业必须对商业分析员进行综合培训,提高分析问题的能力。4.5数据挖掘技术在电子商务中应用的前景随着计算机硬件和软件的并行发展,数据挖掘技术在电子商务中的应用会越来越广泛。在激烈的市场竞争环境下,能否运用好数据挖掘技术,是电子商务网站能否成功的关键所在。数据挖掘技术在电子商务中的关键性以被越来越多的企业所认同。毫无疑问,数据挖掘技术在电子商务时代会得到更大的发展。第5章 结语随着网络的发展和信息化时代的到来,Web产生了海量的数据,如何有效的组织和利用这些数据,建设个性化网站,为用户提供个性化的服务是电子商务网站建设的重点。数据挖掘技术在电子商务中表现了它极大的优越性。本文只是粗浅的介绍了它在电子商务中的应用。随着人们认识的增加和数据挖掘技术的完善,数据挖掘技术在电子商务中的应用会更加的广泛。 参考文献1 刘鲁. 信息系统:原理、方法与应用M.北京:高等教育出版社,2006.2 邵兵家. 电子商务概论M. 北京:高等教育出版社,2006. 3 .4 .5 .6 夏小云. C2C 电子商务数据挖掘的研究及应用C. 江西理工大学 2007.7 牛红慧,金显华. Web数据挖掘技术在电子商务中的应用J .濮阳职业技术学院学报, 2006(3).8 毛国君,段立娟,王实,石云. 数据挖掘原理与算法M. 北京:清华大学出版,2005(1).9 刘菲,李玲. 数据挖掘技术在客户关系管理中的应用研究J. 产业与科技论坛,2009(8).10 朱明数据挖掘2002:129-13011 王核成,许水龙