用因子分析和聚类分析研究我国主要农产品单位面积产量解读.doc
《用因子分析和聚类分析研究我国主要农产品单位面积产量解读.doc》由会员分享,可在线阅读,更多相关《用因子分析和聚类分析研究我国主要农产品单位面积产量解读.doc(22页珍藏版)》请在三一办公上搜索。
1、统计计算方法与统计软件课程设计 题 目: 用因子分析和聚类分析研究我国主要农产品单位面积产量学 院: 班 级: 学 生 姓 名: 学 生 学 号: 指 导 教 师: 2015 年 07 月 10 日设计题目用因子分析和聚类分析来分析主要农产品单位面积产量设计类型(相应选项打)题目来源:科研项目 工程实际 自拟题目 其他题目性质:应用类 理论研究类 软件工程类 信息类设计目标运用因子分析和聚类分析来对我国主要农产品单位面积产量进行分析,找出他们之间的关系,从而得到结论。计划调查(或研究)内容 搜集我国主要农产品单位面积产量,运用所学的SPSS对数据进行合理的分析,找出他们之间的关系。可以预见的困
2、难及解决途径1、 运用软件对数据进行分析。解决方法:熟悉软件2、 计算时可能出现误差。解决方法:多次实验3、 软件的运用。解决方法:软件多次使用。参考文献与参考资源(包括网址与地址)1 肖华勇.统计计算与软件应用M.西北工业大学出版社,20092 3 林海明.对主成分分析法运用中十个问题的解析J.统计与决策,2007.(16):16-18.4 许丽利.聚类分析的算法及引用D.吉林大学,2014.计划与进度的安排1、第一天:根据设计题目,安排进度。2、第二天:查阅资料,进行设计前必要的资料准备。3、第三天、第四天、第五天:程序编写、上机调试。4、第二周的第一天:上机调试程序、结果分析。5、第二周
3、的第二天:撰写设计报告。指导教师评语: 签名:评分:目录摘要I1 题目分析2 1.1 调查目的21.2 设计方法22 背景分析32.1理论一 32.2 理论二33 实例分析43.1 数据43.2 运用公式进行分析54 运用SPSS进行分析75 结论167 参考文献17摘要针对统计计算方法与统计软件课程中所学的因子分析和聚类分析,对我国主要农产品单位面积产量进行分析,并对所得到的结论进行整理,调查面积按生产单位和农户所调查品种当年实际种植面积计算,不按耕地面积、收获面积和计划播种面积计算。如遇灾害全部或部分改种其它作物,则按各种作物实际种植面积计算。间作、套种的作物按各种作物占有面积折算,不要多
4、算或少算。多年生作物(如苎麻、甘蔗)按当年留存的可收面积计算。关键词:因子分析 聚类分析 农作物产量 单位面积 1 题目分析1.1调查目的 本次课程设计的目的是为了了解我国农产品的产量,农产品成本是农产品价值的重要组成部分,在市场经济条件下,及时、准确地了解和掌握农产品的生产成本水平,对于制定合理的农产品价格与流通政策,加强农业宏观调控,科学有效地组织指导农业生产,优化农业生产结构,促进农业生产的稳步发展,具有十分重要的意义。1.2设计方法运用因子分析和聚类分析两种方法,利用SPSS软件对主要农产品单位面积产量进行分析,从而得到结果。因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间
5、的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原资料的大部分信息。运用这种研究技术,我们可以方便地找出影响某时间的主要因素是哪些,以及它们的影响力运用这种研究技术,我们还可以为市场细分做前期分析。我们所研究的样品(网点)或指标(变量)之间存在程度不同的相似性(亲疏关系以样品间距离衡量)。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据。把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另一类,直到把所有的样品(或指标)聚合完毕,这就是
6、聚类分析。2 背景分析2.1理论一 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。 因子分析是处理多变量数据的一种统计方法,它可以揭示多变量之间的关系,其主要目的是从众多的可观测得变量中概括和综合出少数几个因子,用较少的因子变量来最大程度地概括和解释原有的观测信息,从而建立起简洁的概念系统,揭示出事物之间本质的联系。主要适用于在没有任何前提预设假定下,研究者用它来对观察变量因子结构的寻找、对因子的内容以及变量
7、的分类。通过共变关系的分解,进而找出最低限度的主要成分,让你后进一步探讨这些主成分或共同因子与个别变量之间的关系,找出观察变量与其对应因子之间的强度,即所谓的因子负荷值,以说明因子与所属的观察变量的关系,决定因子的内容。要求研究者对研究对象潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观测变量的组成模式,进行因子分析的目的是为了检验这一先前提出的因子结构的适合性。2.2理论二 聚类分析是研究“物以类聚”的一种科学有效的方法。做聚类分析时,出于不同的目的和要求,可以选择不同的统计量和聚类方法。 系统聚类是目前应用最为广泛的一种聚类方法,其基本思想
8、是:先将待聚类的n个样品(或者变量)各自看成一类,共有n类;然后按照实现选定的方法计算每两类之间的聚类统计量,即某种距离(或者相似系数),将关系最为密切的两类合为一类,其余不变,即得到n-1类;再按照前面的计算方法计算新类与其他类之间的距离(或相似系数),再将关系最为密切的两类并为一类,其余不变,即得到n-2类;如此下去,每次重复都减少一类,直到最后所有的样品(或者变量)都归为一类为止。 3 实例分析3.1数据表3-1 2013数据(单位:吨)地区谷 物棉 花花 生油菜籽芝 麻黄红麻甘 蔗甜 菜烤 烟北 京6191107829987909200000天 津5344123734840145000
9、00河 北547694636581613137523740455751807山 西4509130723141431108100488583030内蒙古572614541969116290300395883903辽 宁7044188132591911194300514022876吉 林7875184837650115100272612510黑龙江6248028756198145100319322511上 海6888195526692142142704832900江 苏66421349374527371781060761100001700浙 江645314232823198417003293619
10、5500安 徽565188147342289141229484012102582福 建600275526441456124632136115302141江 西5963154627611285116248684464302126山 东624492344302545162400223332677河 南5954101645442418152855827167802526湖 北6256110634002042161218383828824501906湖 南6163124125101545154628525181602203广 东5395028451188148324228978902391广 西536
11、7106627761013131614687203201720海 南4768027350159636066851001200重 庆622866020581860102916163709101918四 川5917942251622451315210540638212471995贵 州39735871894161410426005706020001640云 南453719421617171989620676269001976西 藏55230192426040000陕 西428615772946194016581003180002332甘 肃4333173239921950000503513397青
12、 海3822002070000225000宁 夏58793400179425167500004816新 疆62892047566125821493007230103.2运用公式进行分析因子分析:考虑个成分的随机观测向量。因子模型要求线性相依,其中有m个公共因子f1 f2.fm 和特殊因子组成。具体如下: 如果fi与fj相互独立(ij),则称该因子模型为正交因子模型。正交因子模型具有如下特性:x的方差可表示为:()hi2是m个公共因子对第i个变量的贡献,称为第i个共同度(communality)或共性方差,公因子方差(common variance)()i称为特殊方差(specific vari
13、ance),是不能由公共因子解释的部分因子负载aij是随机变量xi与公共因子fj的相关系数。称gj2为公共因子fj对x的“贡献”,是衡量公共因子fj重要性的一个指标。聚类分析:所谓直接聚类法,是指在建立模糊相似矩阵之后,不去求传递闭包,也不用布尔矩阵法,而是直接从模糊相似矩阵出发求得聚类图。其步骤如下: 取(最大值),对每个作相似类,且 =,即将满足的与放在一类,构成相似类。相似类与等价类的不同之处是,不同的相似类可能有公共元素,即可出现 ,.此时只要将有公共元素的相似类合并,即可得水平上的等价分类。 取为次大值,从中直接找出相似度为的元素对(即),将对应于的等价分类中所在的类与所在的类合并,
14、将所有的这些情况合并后,即得到对应于的等价分类。 取为第三大值,从中直接找出相似度为的元素对(即),将对应于的等价分类中所在的类与所在的类合并,将所有的这些情况合并后,即得到对应于的等价分类。 以此类推,直到合并到成为一类为止。4 运用Spss进行分析点击分析,在点击将维,选择因子分析,将谷物、棉花、花生油、菜籽、芝麻、黄红麻、烤烟、甜菜、甘蔗导入变量,在描述中选择单变量,在抽取中选择碎石图,点击确定因子分析表5-1附注创建的输出01-JUL-2015 11:57:28注释输入活动的数据集数据集1过滤器权重拆分文件工作数据文件中的 N 行31缺失值处理对缺失的定义MISSING=EXCLUDE
15、:用户定义的缺失值作为缺失对待。使用的案例LISTWISE:统计量基于对所使用任何变量都不含缺失值的案例。语法FACTOR/VARIABLES 谷物 棉花 花生 油菜籽 芝麻 黄红麻 甘蔗 甜菜 烤烟/MISSING LISTWISE/ANALYSIS 谷物 棉花 花生 油菜籽 芝麻 黄红麻 甘蔗 甜菜 烤烟/PRINT INITIAL KMO EXTRACTION ROTATION FSCORE/PLOT EIGEN/CRITERIA MINEIGEN(1) ITERATE(25)/EXTRACTION PC/CRITERIA ITERATE(25)/ROTATION VARIMAX/SAV
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 聚类分析 研究 我国 主要农产品 单位面积产量 解读

链接地址:https://www.31ppt.com/p-4167553.html