欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOC文档下载  

    主成分分析法在粮食产量中的应用.doc

    • 资源ID:3861057       资源大小:307.50KB        全文页数:14页
    • 资源格式: DOC        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    主成分分析法在粮食产量中的应用.doc

    主成分分析法在粮食产量中的应用摘 要主成分分析的基本思想是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原指标,并根据实际需要从中取几个较少的综合指标尽可能多的反映原来指标的信息。主成分分析法适合处理一些多变量,数据大的问题,具有广泛的应用。本文利用主成分分析法的方法对粮食产量问题予以分析。由于粮食产量受多个因素的影响,所以利用主成分分析法中降维的思想,通过多元回归分析,得到回归预测的模型。由于预测的模型存在共线的可能,所以进一步对所预测的模型进行检验,从而得到最优的模型。【关键词】 主成分分析 因子分析 粮食问题Principal Component Analysis and Its ApplicationsAbstractThe basic idea of principal component analysis is to try to reassemble the original indicators into a new set of several mutually independent comprehensive index to replace the original index, and according to the actual need to be taken several less comprehensive index as much as possible to reflect the original indicators information. Principal component analysis method is suitable to deal with some multivariate data big problem, with a wide range of applications.In this paper, the principal component analysis methods are analyzed for food production problems. Because food production affect multiple factors, so the use of principal component analysis in dimensionality reduction ideas, through multiple regression analysis, regression prediction model. May be due to the presence of the line model prediction, the prediction model further tested to obtain the optimal model. 【 key words】principal component analysis factor analysis food issues目 录一、引言1二、主成分分析法的基本概念1(一)主成分分析法的简介1(二)主成分分析法的特点1(三)主成分分析法的基本原理1三、主成分分析法的应用2(一)问题的提出2(二)样本数据的选择2(三)问题分析3(四)定义变量3(五)用SPSS进行主成分分析的步骤3(六)模型的建立与求解4四、结束语9参考文献:9致谢11主成分分析及其应用 一、引言主成分分析也称主分量分析,是利用降维的思想,把多指标转化为少数几个综合指标。在实际问题的研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。本文主要针对我国的粮食问题,采用主成分分析的方法,利用SPSS软件对影响我国粮食产量的因素做出分析,从而得到最优的预测模型。二、主成分分析法的基本概念(一)主成分分析法的简介主成分分析法主要是将影响问题的多种因素简化,把有相关性的因素删除,通过剩下的主要因素来分析问题。例如,企业活动中的活动项目数与项目经费、经费支出等之间会存在较高的相关性;学生综合测评中的基础课成绩和选修课成绩、获奖学金次数等之间也会存在较高的相关性。因而我们通过运用主成分分析法来解决多变量的问题。主成分分析法Principal component analysis(PCA)是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,个变量就有个主成分。(二)主成分分析法的特点主成分分析法是在不丢失重要信息的基础下,把众多的变量缩减为几个主要因素,缩减后的变量通常有以下特点:1.缩减后的主要成分的个数小于原来变量的个数。2.缩减后的主要成分必须含有大部分的原始信息。3.缩减后的主要成分应该不再具有相关性。4.主成分具有命名解释性。(三)主成分分析法的基本原理主成分分析实际上是一种降维方法。主要思想是将原本具有相关性的多个变量(例如个变量),通过降维,选出新的数量较少的不相关变量,组成新的综合性指标来代替原来指标。设为原变量中的第一个具有线性相关的主成分指标,即,由数学知识可知,每一个主成分所提取的信息量可用其方差来度量,其方差越大,表示包含的信息越多。常常希望第一主成分所含的信息量最大,因此在所有的线性组合中选取的应该是的所有线性组合中方差最大的,故称为第一主成分。如果第一主成分不足以代表原来个指标的信息,再考虑选取第二个主成分指标,为有效地反映原信息,已有的信息就不需要再出现在中,即与要保持独立、不相关,用数学语言表达就是其协方差,所以是与不相关的的所有线性组合中方差最大的,故称为第二主成分,依此类推构造出的为原变量指标第一、第二、第个主成分。 根据以上分析得知: (1) 与互不相关,即。(2) 是的一切线性组合(系数满足上述要求)中方差最大的,即是与都不相关的的所有线性组合中方差最大者。 为构造的新变量指标,即原变量指标的第1、第2、第个主成分。  三、主成分分析法的应用(一)问题的提出粮食是国家的根本,失去粮食或者缺少粮食不仅会对我们个人的生活产生影响,对国家乃至世界都会有很大的冲击。在我国,人口数量庞大,对粮食的需求量也相应增大,因此要使粮食品种的产和销、供与求满足动态的平衡,确保生产足够数量的粮食。而粮食的产量是随着投入生产要素的变化而变化的,反映出投入与产出之间存在着一种数量关系,这种关系可以用一种数学表达式表现出来,这种表达式常称作生产函数。而本文将利用主成分分析法,研究粮食产量与影响因素之间的关系,以此寻找粮食稳定增产的有效途径(二)样本数据的选择全文以2009年版的中国统计年鉴2009为资料来源,用到了1995年到2008年14年的数据作为样本点。利用SPSS软件,建立以粮食的播种面积、成灾面积、有效灌溉面积、农业机械总动力和农业化肥施用量为变量的多元线性回归模型,对影响粮食产量的因素进行实证分析。表1年份粮食产量(万吨)/Y播种面积(千公顷)/X1成灾面积(千公顷)/X2农用机械总动力(万千瓦)/X3有效灌溉面积(千公顷)/X4化肥施用量(万吨)/X51995 46662 110060 45824 36118 49281 3594 1996 50454 112548 46991 38547 50381 3828 1997 49417 112912 53427 42016 51239 3981 1998 51230 113787 50145 45208 52296 4084 1999 50839 113161 49980 48996 53158 4124 2000 46218 108463 54688 52574 53820 4146 2001 45264 106080 52215 55172 54249 4254 2002 45706 103891 46946 57930 54355 4339 2003 43070 99410 54506 60387 54014 4412 2004 46947 101606 37106 64028 54478 4637 2005 48402 104278 38818 68398 55029 4766 2006 49804 104958 41091 72522 55750 4928 2007 50160 105638 48992 76590 56518 5108 2008 52871 106793 39990 82190 58472 5239 数据来源:2009年版的中国统计年鉴2009(三)问题分析每年的粮食产量受很多因素的影响,例如劳动生产力,环境气候变化,技术提高等,为了包含这些基本因素,本文选择了以农业化肥施用量、粮食播种面积、成灾面积、有效灌溉面积、农业机械总动力等为解释变量,以粮食产量为被解释变量。(四)定义变量:表示粮食产量(万吨);: 表示粮食播种面积(千万顷);: 表示成灾面积(公顷);: 表示农业机械总动力(万千瓦);: 表示有效灌溉面积(千公顷);: 表示化肥施用量(万吨);(五)用SPSS进行主成分分析的步骤1.利用SPSS对模型进行初步拟合(1)将原始数据输入SPSS数据编辑窗口并命名。(2)在SPSS窗口点击分析,选择回归分析中的线性菜单项,调出线性回归的主界面。(3)将变量移入相应变量框。(4)方法选择:Enter。点击统计按钮,选择我们想要观察的选项,例如:回归系数的估计、模型拟合、共线性诊断等。(5)点击确定。通过以上步骤即可得到最终模型的拟合优度检验表、方差分析表、系数分析表、共线性诊断表等。2.利用SPSS进行因子分析(1)在SPSS窗口中点击分析,选择数据缩减中的因子分析菜单项,调出因子分析主界面。(2)将变量移入变量框。(3)点击描述,在相关矩阵中点击系数和显著性水平,然后点击继续。其他均为系统默认选项。(4)点击确定。通过如上步骤即可得到特征根和方差贡献率和因子载荷阵表。3.利用SPSS对模型进行逐步回归(1)在SPSS窗口点击分析,选择回归分析中的线性菜单项,调出线性回归的主界面。(2)将变量移入变量框。(3)方法选择:Stepwise。点击统计按钮,选择同之前一样的选项。(4)点击确定。通过以上步骤即可得到拟合的模型中只包含有用变量的相关分析表。(六)模型的建立与求解1. 多元回归模型的初步建立与初步检验1.1多元回归模型的初步建立(1)对粮食产量与粮食播种面积、成灾面积、农业机械总动力、有效灌溉面积、化肥施用量建立一个回归模型:(注:是待定系数)(2)利用SPSS软件,通过最小二乘估计得到系数的估计值,如表2。表2 系数分析表CoefficientsModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta(Constant)播种面积成灾面积农用机械总动力有效灌溉面积化肥施用量-36622.5090.618-0.119-0.149-0.1329.08616184.8350.0770.0390.1730.3793.6521.017-0.255-0.775-0.1161.600-2.2637.977-3.035-0.866-0.3492.4880.0530.0000.0160.4120.7360.038Dependent Variable: 粮食产量B是待定系数值;Std. Error是标准误差;T检验是比较平均值的方法,Sig值是t值的显著性,它的意思是说,平均值是在百分之几的概率上是相等的。所以t和Sig两者是等效的,看Sig就够了。Sig值要求小于给定的显著性水平,一般是0.05、0.01等,Sig越接近于0越好。一般将这个sig值与0.05相比较,如果它大于0.05,说明平均值在大于5%的几率上是相等的,而在小于95%的几率上不相等。我们认为平均值相等的几率还是比较大的,说明差异是不显著的,从而认为两组数据之间平均值是相等的。如果它小于0.05,说明平均值在小于5%的几率上是相等的,而在大于95%的几率上不相等。我们认为平均值相等的几率还是比较小的,说明差异是显著的,从而认为两组数据之间平均值是不相等的。(3)确定初步模型方程由表2可以看到B对应的一列即为待定系数值,便可得到初步拟合后的多元回归线性方程:1.2多元回归模型的初步检验表3 最终模型的拟合优度检验表 Model SummaryModelRR SquareAdjustedR SquareStd. Error of the Estimate10.9840.9680.949626.81275Predictors: (Constant), 化肥施用量, 成灾面积, 播种面积, 有效灌溉面积, 农用机械总动力Dependent Variable: 粮食产量是相关系数;R Square是相关系数的平方,又称判定系数,判定线性回归的拟合程度,越大越好,一般的,大于0.8说明方程对样本点的拟合效果很好,0.50.8之间也可以接受;Adjust R Square是调整后的判定系数;Std. Error of the Estimate是估计标准误差。表4 回归模型的方差分析表ANOVAModelSum of SquaresdfMean SquareFSig.RegressionResidualTotal9649826131431539964141458131929965239289449.1270.000Predictors: (Constant), 化肥施用量, 成灾面积, 播种面积, 有效灌溉面积, 农用机械总动力Dependent Variable: 粮食产量F是检验方程显著性的统计量,是平均回归平方和与平均剩余平方和之比,越大越好。“Sig”,Sig=significance,意为“显著性”,后面的值就是统计出来的P值,如果P值是 ,则为差异显著,如果,则差异极显著。(1)从表3可以看到,,很接近1,表明模型拟合程度很好。而表4中的,而查表得,所以,并且F检验的显著性概率(Sig)为0.000,反映变量间呈高度线性。因此,我们可以得出结论:之间存在显著的线性关系。(2)但从表2总的T检验的显著性概率(Sig)可以看出的参数大于显著性水平,说明差异不显著,所以没有通过检验。我们首先考虑在变量间可能存在多重共线性。2.优化模型2.1因子分析诊断表5 KMO检验和巴特利球体检验表KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.0.589Bartlett's Test of SphericityApprox. Chi-SquareDfSig.90.78100.000可以看到KMO的检验系数,巴特利球体检验的统计值的显著性概率,满足做因子分析的条件,可以进行因子分析。表6 变量间的相关系数矩阵表Correlation Matrix播种面积成灾面积农用机械总动力有效灌溉面积化肥施用量Correlation播种面积成灾面积农用机械总动力有效灌溉面积化肥施用量1.0000.311-0.649-0.565-0.5720.3111.000-0.491-0.370-0.508-0.649-0.4911.0000.9680.990-0.565-0.3700.9681.0000.954-0.572-0.508-0.9900.9541.000从表6相关系数矩阵中,我们可以发现,具有高度相关性。表7 总方差解释表Total Variance ExplainedComponentInitial EigenvaluesTotal% of VarianceCumulative %123453.6590.7450.5570.0360.00373.17914.89911.1380.7200.06473.17988.07799.21699.936100.00Initial Eigenvalues是初始特征根;从总方差解释中可以看出,只有变量的特征值是大于1的,所有适合作为降维的公因子,它解释的累积方差为73.179%。表8 变量的因子载荷阵表Component MatrixComponent1播种面积成灾面积农用机械总动力有效灌溉面积化肥施用量-0.718-0.5830.9870.9410.971在因子载荷矩阵中,我们可以看出,第一个主成分因子是和高度相关的。2.2模型建立在因子分析的基础上,我们使用SPSS软件中的逐步分析,来观测模型的拟合。 表9 最终模型拟合的优度检验表Model SummarydModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1230.590a0.947b0.979c0.3480.8970.9580.2940.8780.9462326.74253966.42299645.900041.750a:Predictors: (Constant), 播种面积b:Predictors: (Constant), 播种面积, 化肥施用量c:Predictors: (Constant), 播种面积, 化肥施用量, 成灾面积d:Dependent Variable: 粮食产量 从表9中可以看出:第一种建立的模型(即只有一个变量)的,调整后的为0.294;第二种建立的模型(即有两个变量)的,调整后的为0.878;第三种建立的模型(即有三个变量)的,调整后的为0.946。因为值越接近1,拟合程度越好,所以由值我们可以得出第三种模型的拟合程度较好。表10 方差分析表ANOVAModelSum of SquaresdfMean SquareFSig.1RegressionResidualTotal346766456496476999641414112133467664554137306.4050.026a2RegressionResidualTotal893677071027370799641414211134468385393397347.8430.000b3RegressionResidualTotal95469546417186899641414310133182318241718676.2800.000ca:Predictors: (Constant), 播种面积b:Predictors: (Constant), 播种面积, 化肥施用量c:Predictors: (Constant), 播种面积, 化肥施用量, 成灾面积d:Dependent Variable: 粮食产量 从表10中可以看出:第一种模型的,,并且Sig.=0.026;第二种模型的,并且Sig.=0.000;第三种模型的,并且Sig.=0.000。看F检验的显著性概率sig的数值,在0.01至0.05之间就是显著,小于0.01就是极显著。所以由表中的Sig我们也可以看出第三种模型的拟合程度最好。表11系数分析表CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd.ErrorBeta1(Constant)播种面积9851.4470.35915228.340.1420.5900.6472.5310.5300.0262(Constant)播种面积化肥施用量-46430.50.6735.1319700.650.0720.6701.1070.904-4.7869.3777.6520.0010.0000.0003(Constant)播种面积化肥施用量成灾面积-37137.60.6784.330-0.1346923.740.0480.4950.0351.1160.763-0.287-5.36414.1338.753-3.8240.0000.0000.0000.003a:Dependent Variable: 粮食产量 从表11我们可以看出三种模型拟合的参数,由此可写出方程:第一种模型方程:;第二种模型方程:;第三种模型方程:。根据和,得出的结论,我们可以确定模型最佳的拟合方程为。2.3 最终模型的确定最后的回归方程为:通过以上分析,我们可以得到结论:粮食的产量与播种面积,受灾面积,化肥施用量有密切关系。经济解释: 播种面积每增加1千公顷,粮食产量就增加0.678万吨。 成灾面积每增加1千公顷,粮食产量就减少0.134万吨。化肥施用量每增加1万吨,粮食产量就增加4.330万吨,说明对我国的粮食产量的影响较大。2.4 结论与建议经过实证分析,粮食产量的主要受化肥施用量、播种面积和成灾面积的影响。播种面积的增加和成灾面积的减少使粮食产量增加,化肥施用量的增加使得粮食产量增加,但在实际中,有限的土地上只能施用有限的化肥。近年来城市化和工业化不得不再占用耕地,在耕地不足的情况下,为减少污染而将减少化肥施用的情况下,粮食产量将更多的依赖于技术进步。以下总结了四点粮食增产的建议。第一,加强耕地保护的执法力度。中国在耕地保护方面的政策和措施主要有:基本农田保护耕地、耕地总量动态平衡制度、土地用途制度等。但由于执行不严格,使得制度弱化,常常起不到应有的作用。因此,必须严格执行这些土地保护的政策和措施,以确保中国耕地在新的经济发展形式下能得到切实有效的保护。第二,将耕地保护和地方政府政绩挂钩,进一步规范地方政府的供地行为。第三,推进农业科技进步,提高农业生产能力解决“三农”问题,发展现代农业,必须重视农业科技的作业。增强我国农业科技的研发能力,研发出更为有效的化肥来增加粮食产量。第四,随着自然灾害的不断发生,使农业生产遭到了破坏,因此有关部门迎做好防御措施,使受灾程度降到最小。四、结束语通过上述利用主成分分析法来求解的实例,我们可以发现,如果所要研究的问题因素较多时,可以使用主成分分析法,将多个变量转换为主要成分。通过每个主要成分方差的大小来决定所研究对象在整体中的地位,从而构建新的函数模型,对研究对象进行综合评价。主成分分析的方法尤其适用于企业经济效益综合评价,能为决策者的决策做出判断或者提供依据。主成分分析法不需要人为的来确定每个指标的重要性,它是根据各个指标自身相关性来确定的,十分客观。伴随着 SPSS统计软件的普及,是我们在使用主成分分析法时更加的便捷、快速、准确。主成分分析法在信息爆炸的时代对复杂事物的研究起着越来越重要的作用。参考文献:1李小胜、陈珍珍.如何正确应用SPSS软件做主成分分析.统计研究. 2010.8,27(8),105-1082 郭呈全、陈希镇.主成分回归的SPSS实现.统计与决策.2011,(5),157-153 谢杰.中国粮食生产函数的构建和计量分析.统计与决策.2007,(20),74-764 张立军、任英华.多元统计分析实验M.北京:中国统计出版社. 2009,111-1195 中华人民共和国国家统计局.中国统计年鉴2009.2009.09致谢时光飞逝,转眼四年大学生活即将结束,感谢母校的栽培,感谢四年来各科老师的认真教诲,感谢这段时间来论文指导老师王虹老师的辛勤指导,因为有她的细心指导我才能如此顺利完成毕业论文,感谢学校领导的关注以及给我们提供详细全面的资料,感谢同学们给我的论文的建议,谢谢在这次论文工作中所有帮助我的人,我知道没有大家的帮助,我不可能这么顺利的完成我的论文.祝大家身体健康,万事如意。

    注意事项

    本文(主成分分析法在粮食产量中的应用.doc)为本站会员(laozhun)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开