主成分分析法在粮食产量中的应用.doc
《主成分分析法在粮食产量中的应用.doc》由会员分享,可在线阅读,更多相关《主成分分析法在粮食产量中的应用.doc(14页珍藏版)》请在三一办公上搜索。
1、主成分分析法在粮食产量中的应用摘 要主成分分析的基本思想是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原指标,并根据实际需要从中取几个较少的综合指标尽可能多的反映原来指标的信息。主成分分析法适合处理一些多变量,数据大的问题,具有广泛的应用。本文利用主成分分析法的方法对粮食产量问题予以分析。由于粮食产量受多个因素的影响,所以利用主成分分析法中降维的思想,通过多元回归分析,得到回归预测的模型。由于预测的模型存在共线的可能,所以进一步对所预测的模型进行检验,从而得到最优的模型。【关键词】 主成分分析 因子分析 粮食问题Principal Component Analysis and
2、Its ApplicationsAbstractThe basic idea of principal component analysis is to try to reassemble the original indicators into a new set of several mutually independent comprehensive index to replace the original index, and according to the actual need to be taken several less comprehensive index as mu
3、ch as possible to reflect the original indicators information. Principal component analysis method is suitable to deal with some multivariate data big problem, with a wide range of applications.In this paper, the principal component analysis methods are analyzed for food production problems. Because
4、 food production affect multiple factors, so the use of principal component analysis in dimensionality reduction ideas, through multiple regression analysis, regression prediction model. May be due to the presence of the line model prediction, the prediction model further tested to obtain the optima
5、l model. 【 key words】principal component analysis factor analysis food issues目 录一、引言1二、主成分分析法的基本概念1(一)主成分分析法的简介1(二)主成分分析法的特点1(三)主成分分析法的基本原理1三、主成分分析法的应用2(一)问题的提出2(二)样本数据的选择2(三)问题分析3(四)定义变量3(五)用SPSS进行主成分分析的步骤3(六)模型的建立与求解4四、结束语9参考文献:9致谢11主成分分析及其应用 一、引言主成分分析也称主分量分析,是利用降维的思想,把多指标转化为少数几个综合指标。在实际问题的研究中,为了全
6、面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。本文主要针对我国的粮食问题,采用主成分分析的方法,利用SPSS软件对影响我国粮食产量的因素做出分析,从而得到最优的预测模型。二、主成分分析法的基本概念(一)主成分分析法的简介主成分分析法主要是将影响问题的多种因素简化,把有相关性的因素删除,通过剩下的主要因素来分析问题。例如,企业活动中的活动项目数与项目经费、经费支出等之间会存在较高的相关性;学生综合测评中的基础
7、课成绩和选修课成绩、获奖学金次数等之间也会存在较高的相关性。因而我们通过运用主成分分析法来解决多变量的问题。主成分分析法Principal component analysis(PCA)是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,个变量就有个主成分。(二)主成分分析法的特点主成分分析法是在不丢失重要信息的基础下,把众多的变量缩减为几个主要因素,缩减后的变量通常有以下特点:1.
8、缩减后的主要成分的个数小于原来变量的个数。2.缩减后的主要成分必须含有大部分的原始信息。3.缩减后的主要成分应该不再具有相关性。4.主成分具有命名解释性。(三)主成分分析法的基本原理主成分分析实际上是一种降维方法。主要思想是将原本具有相关性的多个变量(例如个变量),通过降维,选出新的数量较少的不相关变量,组成新的综合性指标来代替原来指标。设为原变量中的第一个具有线性相关的主成分指标,即,由数学知识可知,每一个主成分所提取的信息量可用其方差来度量,其方差越大,表示包含的信息越多。常常希望第一主成分所含的信息量最大,因此在所有的线性组合中选取的应该是的所有线性组合中方差最大的,故称为第一主成分。如
9、果第一主成分不足以代表原来个指标的信息,再考虑选取第二个主成分指标,为有效地反映原信息,已有的信息就不需要再出现在中,即与要保持独立、不相关,用数学语言表达就是其协方差,所以是与不相关的的所有线性组合中方差最大的,故称为第二主成分,依此类推构造出的为原变量指标第一、第二、第个主成分。根据以上分析得知:(1)与互不相关,即。(2) 是的一切线性组合(系数满足上述要求)中方差最大的,即是与都不相关的的所有线性组合中方差最大者。为构造的新变量指标,即原变量指标的第1、第2、第个主成分。 三、主成分分析法的应用(一)问题的提出粮食是国家的根本,失去粮食或者缺少粮食不仅会对我们个人的生活产生影响,对国家
10、乃至世界都会有很大的冲击。在我国,人口数量庞大,对粮食的需求量也相应增大,因此要使粮食品种的产和销、供与求满足动态的平衡,确保生产足够数量的粮食。而粮食的产量是随着投入生产要素的变化而变化的,反映出投入与产出之间存在着一种数量关系,这种关系可以用一种数学表达式表现出来,这种表达式常称作生产函数。而本文将利用主成分分析法,研究粮食产量与影响因素之间的关系,以此寻找粮食稳定增产的有效途径(二)样本数据的选择全文以2009年版的中国统计年鉴2009为资料来源,用到了1995年到2008年14年的数据作为样本点。利用SPSS软件,建立以粮食的播种面积、成灾面积、有效灌溉面积、农业机械总动力和农业化肥施
11、用量为变量的多元线性回归模型,对影响粮食产量的因素进行实证分析。表1年份粮食产量(万吨)/Y播种面积(千公顷)/X1成灾面积(千公顷)/X2农用机械总动力(万千瓦)/X3有效灌溉面积(千公顷)/X4化肥施用量(万吨)/X51995 46662 110060 45824 36118 49281 3594 1996 50454 112548 46991 38547 50381 3828 1997 49417 112912 53427 42016 51239 3981 1998 51230 113787 50145 45208 52296 4084 1999 50839 113161 49980 4
12、8996 53158 4124 2000 46218 108463 54688 52574 53820 4146 2001 45264 106080 52215 55172 54249 4254 2002 45706 103891 46946 57930 54355 4339 2003 43070 99410 54506 60387 54014 4412 2004 46947 101606 37106 64028 54478 4637 2005 48402 104278 38818 68398 55029 4766 2006 49804 104958 41091 72522 55750 492
13、8 2007 50160 105638 48992 76590 56518 5108 2008 52871 106793 39990 82190 58472 5239 数据来源:2009年版的中国统计年鉴2009(三)问题分析每年的粮食产量受很多因素的影响,例如劳动生产力,环境气候变化,技术提高等,为了包含这些基本因素,本文选择了以农业化肥施用量、粮食播种面积、成灾面积、有效灌溉面积、农业机械总动力等为解释变量,以粮食产量为被解释变量。(四)定义变量:表示粮食产量(万吨);: 表示粮食播种面积(千万顷);: 表示成灾面积(公顷);: 表示农业机械总动力(万千瓦);: 表示有效灌溉面积(千公顷)
14、;: 表示化肥施用量(万吨);(五)用SPSS进行主成分分析的步骤1.利用SPSS对模型进行初步拟合(1)将原始数据输入SPSS数据编辑窗口并命名。(2)在SPSS窗口点击分析,选择回归分析中的线性菜单项,调出线性回归的主界面。(3)将变量移入相应变量框。(4)方法选择:Enter。点击统计按钮,选择我们想要观察的选项,例如:回归系数的估计、模型拟合、共线性诊断等。(5)点击确定。通过以上步骤即可得到最终模型的拟合优度检验表、方差分析表、系数分析表、共线性诊断表等。2.利用SPSS进行因子分析(1)在SPSS窗口中点击分析,选择数据缩减中的因子分析菜单项,调出因子分析主界面。(2)将变量移入变
15、量框。(3)点击描述,在相关矩阵中点击系数和显著性水平,然后点击继续。其他均为系统默认选项。(4)点击确定。通过如上步骤即可得到特征根和方差贡献率和因子载荷阵表。3.利用SPSS对模型进行逐步回归(1)在SPSS窗口点击分析,选择回归分析中的线性菜单项,调出线性回归的主界面。(2)将变量移入变量框。(3)方法选择:Stepwise。点击统计按钮,选择同之前一样的选项。(4)点击确定。通过以上步骤即可得到拟合的模型中只包含有用变量的相关分析表。(六)模型的建立与求解1. 多元回归模型的初步建立与初步检验1.1多元回归模型的初步建立(1)对粮食产量与粮食播种面积、成灾面积、农业机械总动力、有效灌溉
16、面积、化肥施用量建立一个回归模型:(注:是待定系数)(2)利用SPSS软件,通过最小二乘估计得到系数的估计值,如表2。表2 系数分析表CoefficientsModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta(Constant)播种面积成灾面积农用机械总动力有效灌溉面积化肥施用量-36622.5090.618-0.119-0.149-0.1329.08616184.8350.0770.0390.1730.3793.6521.017-0.255-0.775-0.1161.600-2.2637.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 粮食产量 中的 应用
链接地址:https://www.31ppt.com/p-3861057.html