数据挖掘技术在电子商务中的运用.docx
《数据挖掘技术在电子商务中的运用.docx》由会员分享,可在线阅读,更多相关《数据挖掘技术在电子商务中的运用.docx(33页珍藏版)》请在三一办公上搜索。
1、本科毕业论文论文题目: 数据挖掘技术在电子商务中的应用 学生姓名: 薛云霞 学号: 200602410089 专业: 信息管理与信息系统 指导教师: 曲建华 学 院: 管理与经济学院 1 2010 年5月6 日毕业论文(设计)内容介绍论文(设计)题 目数据挖掘技术在电子商务中的应用选题时间2009年12月完成时间2010年5月论文(设计)字数12,400关 键 词数据挖掘技术;电子商务;客户关系管理论文(设计)题目的来源、理论和实践意义:题目来源:导师指导下自选题目理论和实践意义:随着网络的普及和电子商务网站的发展,电子商务已经作为一种信息时代国际通行的商务模式,其深入发展引发了自工业革命经济
2、领域一场最广泛、最深刻的变革。电子商务网站的推广和普及已经成为中国企业提高核心竞争力的必然要求。由于Web提供的信息是繁琐的,并且有很多无用的信息,所以这就需要人们必须使用一种技术来提取有用的信息为商家的决策提供服务。数据挖掘技术是从大量的数据中提取蕴涵的、未知的、有潜在使用价值的信息和知识从而为市场决策提供服务。所以随着Internet 技术和数据库技术的飞速发展,以网络为载体、利用数字化电子方式开展的商务活动逐渐成为Web数据挖掘的一个重要应用方向。因此,本文简单介绍了电子商务和数据挖掘技术的基本概念,分析了电子商务发展的基本现状,并主要介绍了数据挖掘技术在电子商务中应用和存在的问题,对我
3、们企业在电子商务中应用数据挖掘技术具有重要的理论和实践意义。论文(设计)的主要内容及创新点:主要内容:随着Internet和电子商务网站的飞速发展,Web已经成为人们获取信息的一个重要途径。如何从这些海量的数据中找到有用的数据,如何发现用户的兴趣,为客户提供个性化的服务成为目前电子商务网站发展的关键。数据挖掘技术正是在这种背景下和电子商务结合在一起。本文简单介绍了电子商务和数据挖掘技术的基本概念,并主要介绍了数据挖掘技术在电子商务中应用和存在的问题,并提出了一些对策。创新点:本文主要介绍了数据挖掘技术在电子商务中的应用,并调查研究了数据挖掘技术在电子商务中应用的现状,发现了一些问题,并提出了一
4、些解决方法。附:论文(设计)本人签名: 2010 年 5 月 10 日 目 录中文摘要1英文摘要1第1章 引言2第2章 目前电子商务的现状22.1电子商务的概述22.2中国电子商务的发展状况3第3章 数据挖掘技术53.1数据挖掘的定义53.2数据挖掘的功能53.3数据挖掘的方法6第4章 数据挖掘技术在电子商务中的应用74.1数据挖掘技术在电子商务中应用的可行性分析74.2电子商务中的数据挖掘过程84.3数据挖掘技术在电子商务中的应用94.4电子商务中数据挖掘应用的现状和解决方法134.5数据挖掘技术在电子商务中应用的前景14第5章 结语14参考文献15数据挖掘技术在电子商务中的应用 薛云霞摘要
5、:随着Internet和电子商务的发展,网上购物已经成为我们生活中不可或缺的一部分。Web积累了海量的数据,如何把这些海量的数据转化为有用的数据,如何了解顾客的兴趣和爱好,为顾客提供个性化的服务成为目前电子商务发展的关键问题。数据挖掘技术应用于电子商务中正是在这种背景下产生的。数据挖掘技术是从大量的数据中提取蕴涵的、未知的、有潜在使用价值的信息和知识,它为市场分析和决策提供了依据。本文简单介绍了电子商务的基本概念及其电子商务的应用现状,然后介绍了数据挖掘技术的基本概念;接着主要对数据挖掘技术在电子商务中的应用进行了研究,指出了实际应用中存在的一些问题,并提出了解决方法。关键词:数据挖掘技术,电
6、子商务,客户关系管理中图分类号:TP393The Application of Data Mining in the Electronic Commerce Xue yunxiaAbstract:With the development of Internet and E-commerce ,shopping-online has become a necessary part of our everyday life.With the development of Internet,Web provides abundant data resources.The key problem to
7、 the development of E-commerce is how to make use of E-commerce information and how to find out the interest of customers ,providing pernonalized service for customers .The application of data mining in the E-commerce comes into being in the backgrounds. Data mining is a technique ,which can extract
8、 implicit ,undiscovered, potential,useful information and knowledge and which can help the market to analyse and make decisions. This paper simply discusses some basic cocepet about E-commerce and data mining ,and the application actuality of E-commerce. This paper is mainly focused on application o
9、f data mining in Elecotronic Commerce,and finds out some problems and simply puts forward some solutions to these problems.Key words:Data mining technique,E-commerce,Customer Relationship Management 第1章 引言电子商务的发展已经成为一种必然趋势。为客户提供个性化的服务是目前电子商务研究领域的重点和难点。随着Internet的飞速发展和普及,公司建立自己的电子商务网站已经成为一种必然趋势。新的商业环
10、境给企业带来很多商业机会,同时也带来了很多的挑战。电子商务网站从“以站点为中心”向“以用户为中心”成为一种必然。如何对信息进行有效地组织和利用,如何给客户以个性化的界面,开展有针对性的电子商务服务成为电子商务迫切要解决的问题。数据挖掘技术就是在这种网络时代和商业背景下产生的。数据挖掘技术就是将经典的统计学方法、现代的智能化算法同数据库技术结合起来,从海量的数据中发现新的规律和新的知识的一种技术1。本文就是运用数据挖掘技术中的关键技术关联分析、聚类分析等来解决电子商务的关键问题。本文遵循着基础与铺垫、可行性论证、突出重点这样循序渐进的过程展开论述,旨在介绍数据挖掘技术在电子商务中的应用。第2章
11、目前电子商务的现状由于传统商务活动大部分依靠面对面及书面文档传递为主,使传统商务具有信息不完善、耗费时间长、花费高、库存和产品的积压、生产周期长、客户服务有限等局限性。并且随着网络的发展,电子商务表现了它的优越性,得到了迅速发展2。但在发展的同时,也面临着很多问题。2.1电子商务的概述2.1.1电子商务的定义电子商务,英文是Electronic Commerce,简称EC。所谓电子商务,就是在网上开展商务活动。电子商务通常是指是在全球各地广泛的商业贸易活动中,在因特网开放的网络环境下,基于浏览器/服务器应用方式,买卖双方不见面地进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电
12、子支付以及各种商务活动、交易活动、金融活动和相关的综合服务活动的一种新型的商业运营模式3。2.1.2电子商务的分类电子商务按照主体可以分为三类:B2C、B2B、C2C4。 1、B2C:企业与个人交易的平台。应该说是企业做为卖家,个人做为买家的平台,就是企业做好商品推广的网站。比如当当书店。2、B2B:企业与企业交易的平台。比如阿里巴巴。3、C2C:个人与个人交易的平台。比如淘宝,易趣。2.1.3电子商务的优势电子商务带来的不仅是一种技术变革,它还带来了一种通过技术的辅助、引导、支持来实现的商业活动本身发生的根本性的革命。它不仅改变交易的方式,还更新了人们的消费观念和生活方式,改变了人与人之间的
13、关系。具体有以下几个优点:1、交易可以跨越时空。交易双方可以在世界的任何一个地方,交易可以在任何时间进行,打破了传统电子商务活动时间和空间的约束。2、交易的方便性。消费者真正能够足不出户,就可货比三家,同时能够以一种轻松自由的自我服务的方式来完成交易。通过互联网,商家之间可以直接交流,谈判,签合同,消费者也可以把自己的反馈建议反映到企业或商家的网站,而企业或者商家则要根据消费者的反馈及时调查产品种类及服务品质,做到良性互动。3、交易的成本大大降低。电子商务使供应链缩短,各方面管理成本的大幅度降低。4、电子商务所具有的开放性和全球性的特点,为企业创造了更多的贸易机会。 2.2中国电子商务的发展状
14、况2.2.1中国电子商务发展的情况随着中国总体经济的强势增长和Internet的发展,中国的电子商务市场发展很迅速。中国电子商务市场中,B2B电子商务是最重要的一部分。根据艾瑞咨询统计数据显示,09年中国企业通过电子商务交易规模占整体交易规模(线上和线下交易规模)的比例达到11.3%,稳中有升5。根据艾瑞咨询调查显示,在全球经济危机下,使用电子商务的线上中小企业的存活率要高出传统线下企业5倍,所以金融危机让更多的中小企业认识到电子商务的优势,电子商务平台能够给中小企业提供更有效的推广方式,降低推广成本5。因此,B2B电子商务交易规模所占比例得到提高,提高的部分主要来自于两方面,一方面,利用电子
15、商务平台获取信息的中小企业的数量在上升;另一方面,部分原有利用电子商务平台的中小企业,其线上交易量在增长。2007年-2013年中国B2B电子商务交易规模,如图(1):2007年-2013年中国B2B电子商务交易规模 图(1)当前中国电子商务发展具有网络基础设施发展迅速,应用环境逐步完善;电子商务教育和培训发展较快;越来越多的企业认知电子商务,并开始起步应用较好,开始发挥作用。2.2.2中国电子商务应用中面临的挑战1、Web站点对客户来说,基本上还是一个“哑终端”。 虽然 Web 站点的软硬件设施已得到了广泛的重视,保证了 Web 站点拥有良好的运行性能,但是客户却对Web站点的信息很不熟悉,
16、对商家来讲仅是一条 24 小时不停运转的电子交易输入通道。2、随着电子商务网站规模日渐扩大,其庞大数据量和复杂的站点结构,往往使客户手足无措,无法顺利找到自己需要的商品或信息。商家和卖家在商品属性上无法达成共识,使买家无法找到自己想要的商品。尽管商家提供了很多的方式供买家查询商品的属性,但是商品的属性往往是由商家定义的,买家和商家对商品属性的认识是不相同的,因此买家往往会找不到自己所需要的商品6。总体来说,中国的电子商务发展很迅速,发展势头良好。但是由于起步晚,基础差,所以和发达国家的差距还很大。但是企业建立电子商务网站已经成为一种必然趋势,如何从冗余的、不准确的数据中发现有用的信息和知识,了
17、解顾客的爱好和价值取向,为用户提供个性化的服务已经成为各个企业面临的关键问题。第3章 数据挖掘技术3.1数据挖掘的定义数据挖掘,英文是Data Mining,简称DM。所谓数据挖掘是从大量数据中提取有效的、未知的、易于理解的、有依据的信息,并据此做出商务决策的过程7。数据挖掘从本质上说是一种新的商业信息处理技术。数据挖掘技术把人们对数据的应用,从低层次的联机查询操作,提高到决策支持、分析预测等更高级应用上8。3.2数据挖掘的功能1、预测分析。预测分析是分析现有的数据集并以此发现数据的重要特征,并据此对未来数据进行判定或预测。预测分析可以分为值预测和分类预测两种方法。值预测是利用一些已知变量的值
18、来预测其他变量的值(如回归分析);或者利用某个变量的过去值来预测其未来值(如时间序列分析)。分类预测的目的在于发现每一类的属性特征。例如,如果将信用卡用户的信用等级作为类标签,银行管理人员希望分类模型能够挖掘出每种信用等级的用户特征,一个可能的结论是:年龄在30-40岁之间、收入在8000元以上、住在街区的用户信用等级为优1。依据这些分类特征,管理人员可以对申办信用卡的用户做出信用等级的初始判断,以辅助决策。决策树和人工神经网络是构建分类模型的常用技术。2、关联分析。关联分析用于发现数据项之间的关联规则,定义:若X、Y为项目集,且XY=,则:蕴涵式X=Y成为关联规则9;关联规则就是从给定的数据
19、集中搜索数据项之间所存在的有价值的关联。比如,一家卖电子商品的商店,发现买计算机的顾客80%也会买系统软件。这就说明计算机和系统软件之间有着某种关联。3、聚类分析。聚类分析的目的就是把相似的对象归为类,研究的主要内容是度量相似性以及构造聚类的具体方法。聚类模型使用无指导学习来发现数据集中的同构成分,产生数目不定的、含有相似数据的数据子集。例如,企业可以根据客户交易历史,进行客户聚类,发现高价值用户,并据此加强客户关系管理。4、分类分析。分类分析用于找出一个类别的概念描述,这个概念描述代表了这类数据的整体信息,即该类的内涵描述,一般用规则或决策树模式表示。5、偏离检测。偏离检测通过应用统计方法和
20、可视化技术来发现数据集中的孤立点,从而发现与期望或规范相背离的异常事件。3.3数据挖掘的方法数据挖掘有很多方法,包括关联规则方法、聚类分析方法、人工神经网络方法、遗传算法、粗糙集方法、决策树方法、统计方法、可视化技术等。下面就上述八种方法解释如下:1、关联规则方法:关联规则,是在数据挖掘中最先使用的最基本的技术。关联规则是从大量的数据中提取或“挖掘”出有用的知识,它能对过去的数据进行查询和遍历,找出过去数据之间的潜在联系,从而促进信息的显化10。2、聚类分析方法:聚类分析是一种经典的统计学方法,它同数据库技术结合形成了现代数据挖掘的常用技术之一。聚类分析就是从给定的数据集中搜索数据对象之间所存
21、在的有价值的联系,一个聚类中的所有对象常常被当作一个对象来进行处理或分析11。在商业上,聚类分析可以帮助市场人员发现顾客群中所存在的不同特征的组群,并可以利用购买模式来描述这些具有不同特征的顾客组群。3、人工神经网络方法:人工神经网络和遗传算法,都是仿生研究方法,或仿生算法。它们通过模拟生物学的某些功能,创造一些优化算法,寻找世界的规律。人工神经网络在结构上仿照生物学的神经网络,构造一个简化的只有输入层、输出层和隐含的中间层的含有非线性特征的网络。优点是对噪声数据有较好的适应能力,并且对未知数据也具有较好的预测分类能力。但是人工神经网络分类方法获取的模式隐含在网络结构中,而不是显式的表达为规则
22、,不容易被人们理解和解释。而且还需要多次扫描训练数据,网格的训练时间较长。4、遗传算法方法:简称GA,主要借用了生物进化中“适者生存”规律。其模拟生物的进化和遗传,借助选择、交叉和变异操作,使得要解决的问题从初始解逐步接近最优解,解决了许多全局优化问题。5、粗糙集算法:可以用于分类问题,以帮助发现不准确或噪声数据中所存在的结构关系,是现在数据挖掘中最有力的工具。但它只能处理离散量,连续量必须首先进行离散化后方可使用。利用粗糙集可以近似或粗略的定义集合(类别)。对于一个集合的粗糙集定义是通过两个集合,一个上近似集合和下近似集合来描述。上近似集合包含那些肯定不属于它的数据样本,下近似集合包含那些肯
23、定无疑是属于它的数据样本。6、决策树方法:决策树方法是利用信息论中的信息增益寻找数据库中具有最大信息量的属性字段,从而建立决策树的一个结点,再根据该属性字段的不同取值建立树的分支,最后在每个分支子集中再重复建立树的下层结点和分支的过程。具有速度较快、较易转化成简单且容易理解的分类规则、较易转换成数据库查询语句等优点。7、统计学:旨在从抽样分析中提取未知的数学模型,在数据挖掘中常常会涉及一定的统计过程,如数据抽样和建模、判断假设以及误差控制等。8、可视化技术:采用直观的图形方式将信息模式、数据的关联及趋势呈现给用户,以便用户交互的分析数据关系。第4章 数据挖掘技术在电子商务中的应用4.1数据挖掘
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 技术 电子商务 中的 运用
链接地址:https://www.31ppt.com/p-1668980.html