计算机技术硕士论文数据挖掘技术在农产品市场中的应用研究.doc
《计算机技术硕士论文数据挖掘技术在农产品市场中的应用研究.doc》由会员分享,可在线阅读,更多相关《计算机技术硕士论文数据挖掘技术在农产品市场中的应用研究.doc(77页珍藏版)》请在三一办公上搜索。
1、数据挖掘技术在农产品市场中的应用研究Application Research of Data Mining Technologies in Agricultural Market Information Analysis(申请清华大学工程硕士专业学位论文)培 养 单 位:计算机科学与技术系工程领域:计算机技术申 请 人:指导教师:教 授联合指导教师:教授级高工 工二六年十二月关于学位论文使用授权的说明本人完全了解清华大学有关保留、使用学位论文的规定,即:清华大学拥有在著作权法规定范围内学位论文的使用权,其中包括:(1)已获学位的研究生必须按学校规定提交学位论文,学校可以采用影印、缩印或其他复制
2、手段保存研究生上交的学位论文;(2)为教学和科研目的,学校可以将公开的学位论文作为资料在图书馆、资料室等场所供校内师生阅读,或在校园网上供校内师生浏览部分内容。本人保证遵守上述规定。(保密的论文在解密后遵守此规定)作者签名: 导师签名: 日 期: 日 期: 摘 要我国是一个农业大国,三农问题一直是党中央和国务院各项工作的重中之重。随着市场经济的不断深化,三农问题与农产品市场关系越来越紧密。种什么,卖哪里,都必须分析市场。数据挖掘可以从大量的数据中抽取出未知的、有价值的知识。从大量的农业市场信息数据中,使用数据挖掘技术来找出最有价值的知识和规律,进而为农业市场提供指导分析,为各级领导决策、广大农
3、民和建设社会主义新农村提供服务,意义重大。本文从介绍农产品市场基本知识及我国农业信息化的基本现状出发,介绍分析了数据挖掘的基本理论和应用现状,关联规则及Apriori算法。利用WEKA数据挖掘平台,本文应用关联规则挖掘方法分析了农产品期货市场与现货市场之间的关联关系,分析了现货市场中同类农产品,以及非同类农产品之间的关联关系。并且在分析过程中发现传统的关联算法在市场分析方面的许多不足,会产生很多与实际情况不符的规则,并无法在整体上对数据间的关联作分析。针对农产品市场数据的特点和传统关联算法的不足,本文提出了关联关系的数据挖掘算法MPAB算法。该算法由数据离散化、正反关联度计算、关联度阈值计算和
4、结果输出四个步骤组成。算法能对数值型数据进行离散化操作,发现两个数据集之间的正反关联关系及关联的程度。使用MPAB算法分析各种农产品市场数据,并对挖掘的结果进行分析。发现MPAB算法挖掘效果很好,与事实相符,不产生多余规则,可以不需知识评估。将MPAB算法用于研究外汇市场数据,分析不同的货币对价格变化之间的关联关系,效果也十分令人满意。基于上述工作,本文提出了一个基于MPAB算法的关联挖掘软件的简单设计,该软件可用于各种市场及各种宏观经济数据关联分析。关键词:农业 市场 数据挖掘 关联分析 MPAB算法AbstractChina is a large agricultural country.
5、 Problems related to “San Nong”, i.e., “farmers, rural and agriculture”, have been paid much attention by the working emphasis of Central the Committee of Chinas Communism Party and National Council. With the rapid development deepening of market economies, the relationship between the problems of “
6、San Nong” and the market of agricultural produces is becoming more and more closer. For example, it is necessary to conduct market analysis before determining what crops are to be planted and where to sell the produces. This poses the requirement of large scale existing agricultural data. Data minin
7、g can extract unknown and valuable knowledge from large amount of data. It has significant value to discovering valuable knowledge and rules from agricultural market data using data mining technologies. The discovered knowledge can direct the agricultural market analysis, help to make decisions for
8、leaders at various levels, and provide services for farmers and constructing socialism new rural areas.This paper analyzesed the basic theory and application situation of data mining from introducing the fundamental conceptsbasic knowledge of agricultural product market and the basic current stateit
9、uation of agricultural informatization in China, and then studysied the association rules and Apriori algorithm. The associated relationship between the future market and physical market of agri-produces Assoiarion rules was analyzed is by employed toing find associated rules minings on WEKA data mi
10、ning platform in this paper. The associated relationships amoung the same kind agro-products and the not same kind of agro-products physical market are allalso analyzed. We discovered that many drawbacks of traditional associated algorithms in mining this kind of data, which may result in the incons
11、istent rules with the actual situation, and make it impossible to conduct analysis on association among data as a whole.An associated relationship data mining algorithm named MPAB was proposed based on the characteristics of agro-products market data in this paper. It is aimed at overcoming the draw
12、backs discovered in traditional associated algorithms. The algorithm consists of data discretization, computation of positive and negative association degree, computation of threshold association degree, and result outputting. The algorithm can discretize numerical data, discover the positive and ne
13、gative relationship between two data sets, and degree of association. Agri-products market data was analyzed by using MPAB, and the mining results were also analyzed. We found that the effect of MPAB was pretty good, complying with the fact with redundant rules, without knowledge assessment. The eff
14、ect was also satisfactory when the MPAB was used to study foreign exchange market data, analyzing associated degree among the changes in the prices of foreign currency. Based on the above effects, a simple design of MPAB associated mining software was proposed in this paper. The software can be used
15、 to conduct associated analysis of various market and macro-economic data. Keywords: agriculture market data mining association rule MPAB arithmetic 目 录第1章引言11.1选题背景及来源11.1.1选题背景11.1.2选题来源21.2课题的国内外现状分析21.3课题研究的目的和意义31.4研究方法41.5主要研究内容和论文结构安排4第2章农产品市场概述及使用数据挖掘技术的可行性研究62.1农产品市场的基本知识62.1.1农产品期货市场62.1.2
16、农产品现货市场62.1.3农产品期货市场与现货市场的比较72.1.4农产品期货市场对农业的作用72.2我国农产品市场及信息体系建设飞快发展82.2.1农业信息体系建设现状82.2.2农产品市场建设向现代化发展82.3农产品市场应用数据挖掘技术的可行性102.3.1数据源丰富102.3.2数据挖掘技术应用趋于成熟102.4数据挖掘在农产品市场分析应用中的相关技术112.5本章小结12第3章使用传统的关联规则挖掘算法分析农产品市场133.1关联规则的基本概念133.2Apriori算法综述133.2.1经典的频集算法133.2.2算法的基本思想143.2.3Apriori核心算法分析143.3WE
17、KA简介153.4挖掘目标与任务163.5期货市场与现货市场之间的关联性研究163.5.1源数据介绍163.5.2数据预处理173.5.3使用Apriori进行分析193.5.3.1使用Apriori的默认设置193.5.3.2使用Apriori的调整设置193.5.4使用其它关联规则算法进行分析213.5.4.1使用PredictiveApriori进行挖掘213.5.4.2使用Tertuis进行挖掘223.5.5结论233.6同类农产品价格之间的关联性研究233.6.1源数据233.6.2数据预处理243.6.3使用Apriori进行分析263.6.4使用其它关联规则算法进行分析273.6
18、.4.1使用PredictiveApriori进行挖掘273.6.4.2使用Tertuis进行挖掘293.6.5结论303.7非同类农产品价格之间的关联性研究313.7.1源数据313.7.2数据预处理323.7.3使用Apriori进行分析333.7.4使用其它关联规则算法进行分析343.7.4.1使用PredictiveApriori进行挖掘343.7.4.2使用Tertuis进行挖掘353.7.5结论363.8结论363.9本章小结37第4章MPAB关联算法及其在农产品市场中的应用研究384.1MPAB算法的研究384.1.1MPAB算法的提出384.1.2MPAB算法的具体说明384.
19、1.2.1数据离散化分箱操作394.1.2.2计算正关联度和反关联度404.1.2.3关联度阈值的计算414.1.2.4结果的输出414.1.2.5有关离散分箱数n的设定问题434.2使用MPAB算法分析期货市场与现货市场的关系434.3使用MPAB算法分析同类农产品价格之间的关联关系444.3.1数据分箱444.3.2大白菜与西红柿之间的关系464.3.3大白菜与洋白菜之间的关系464.3.4西红柿与洋白菜之间的关系464.3.5综合分析结果464.3.6大白菜、西红柿和洋白菜的年周期性分析474.4使用MPAB算法分析非同类农产品价格之间的关联关系494.4.1数据分箱494.4.2大白菜
20、与猪肉之间的关系504.4.3大白菜与鸡蛋之间的关系514.4.4大白菜与鲤鱼之间的关系514.4.5猪肉与鸡蛋之间的关系514.4.6猪肉与鲤鱼之间的关系514.4.7鸡蛋与鲤鱼之间的关系514.4.8综合分析结果514.5使用MPAB算法分析外汇市场524.6相对分箱法544.7MPAB算法与Apriori算法比较564.8MPAB算法与图示法的比较564.9结论584.10本章小结58第5章基于MPAB算法的数据集间关联分析软件的设计605.1系统适用范围605.2系统功能605.3系统组成605.3.1用户参数输入模块605.3.2数据预处理模块615.3.3计算模块615.3.4结果
21、输出模块615.4模块间关系615.5运行环境62第6章结论与展望636.1论文工作总结636.2进一步的研究工作64参考文献65致 谢67个人简历、在学期间发表的学术论文与研究成果68第1章 引言1.1 选题背景及来源1.1.1 选题背景我国是一个农业大国,农业人口众多,土地辽阔,作物种类复杂。农业不同于其它行业,农业数据量庞大而且复杂,农业生产影响的因素非常多,有自然因素,也有人文因素。如何有效地从这些浩瀚的农业数据中深入寻找各种有价值的规律和知识来,并用于服务三农,对于推动农业发展,提高农民生活水平,建设社会主义新农村等是十分必要的。中国农村落后,农民文化水平较低,1家1户的非规模性农业
22、生产经济效益不大,但市场经济下的广大现代农民对市场信息服务却有着巨大的需求,农民在农业生产方面不知道该种什么,农产品和农资市场状况怎么样等,这些政府部门都必须为农民作出回答。否则,农民从买种到种植到销售就存在很大的盲目性和随意性,农业生产的风险便大大增加,也影响到农村的社会稳定。目前农村普及的信息载体只有电视、广播、电话、黑板报、明白纸和口头传达,从信息服务的角度来看,这些信息载体是无法接收海量市场数据。退一步说,即使农民有电脑,他们也无法从事复杂的市场信息分析工作。因此,如何从大量的农业市场信息数据库中,找出最有价值的信息和规律,为农业市场提供指导分析,进而为各级领导决策和广大农民提供有价值
23、的服务,是信息技术工作人员和农业科技人员必须解决的一个课题。数据挖掘又称知识发现,是一个从大量的数据中抽取出未知的、有价值规律或知识的过程,它包括数据清洗、数据集成、数据转换、数据挖掘、模式评估和知识表示等部分组成5。数据挖掘涉及数据库技术、数据仓库技术、人工智能、机器学习、人工神经网络、统计学、模式识别等多个学科中的知识,它的挖掘对象可以是文件、数据库、数据仓库、Web数据库等。1就功能而言,数据挖掘主要是对所挖掘对象中的数据进行概念描述、关联规则的获取、分类与预测、聚类分析、孤立点的发现、模式评估等2。所以使用数据挖掘技术来分析农业数据,可以有效地解决农业市场指导和农村信息服务等问题。1.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机技术 硕士论文 数据 挖掘 技术 农产品市场 中的 应用 研究
链接地址:https://www.31ppt.com/p-2396390.html