第3章 地理学中的经典统计分析方法——第1节 相关分析ppt课件.ppt
《第3章 地理学中的经典统计分析方法——第1节 相关分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《第3章 地理学中的经典统计分析方法——第1节 相关分析ppt课件.ppt(105页珍藏版)》请在三一办公上搜索。
1、1、相关分析2、回归分析3、时间序列分析4、系统聚类分析5、主成分分析6、马尔可夫预测7、趋势面分析8、地统计分析,第三章 地理学中的经典统计分析方法,3.1 相关分析,3.1 相关分析,相关分析的任务,是揭示地理要素之间相互关系的密切程度。而地理要素之间相互关系密切程度的测定,主要是通过对相关系数的计算与检验来完成的。两要素之间相关程度的测定 多要素间相关程度的测定,相关关系的分类 按照影响因素分类简单线性相关偏相关复相关,正相关,负相关,线性相关,非线性相关,主要步骤,判断现象之间是否存在相互依存的关系,是直线相关,还是曲线相关,这是相关分析的出发点;确定研究变量均为随机变量;根据变量个数
2、和特征选择合适的分析方法;计算相关系数;对相关系数进行显著性检验。,一、两要素之间相关程度的测定,相关系数的计算与检验秩相关系数的计算与检验,(一)、相关系数的计算与检验相关系数的计算 定义 和 为两要素的平均值。说明:-1=1,大于0时正相关,小于 0时负相关。的绝对值越接近于1,两要素的关系越密切;越接近于0,两要素的关系越不密切。,(3.1.1),极显著相关,显著相关,简化 记 公式3.1.1可简化为:,(3.1.2),表3.1.1 伦敦的月平均气温与降水量,资料来源:http:/www.cwb.gov.tw/V4/climate/wta_station/wta20.htm,相关分析实例
3、,根据表3.1.1中的数据,我们可以代入公式(3.1.1),计算伦敦市月平均气温(T)与降水量(P)之间的相关系数:计算结果表明,伦敦市的月平均气温(t)与降水量(p)之间呈负相关,即异向相关。,又如:,根据甘肃省53个气象台站的多年平均数据(见教材表3.1.2),可以对降水量(p)和纬度(y)之间的相关系数以及蒸发量(v)和纬度(y)之间的相关系数,分别代入公式(3.1.1)计算如下:,计算结果表明,降水量(p)和纬度(y)之间异向相关,而蒸发量(v)与纬度(y)之间同向相关。,相关系数的检验,相关系数是根据要素之间的样本值计算出来,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之
4、间的样本相关系数,只有通过检验,才能知道它的可信度。检验是通过在给定的置信水平下,查相关系数检验的临界值表来实现的。,自由度(degree of freedom,df)在数学中能够自由取值的变量个数,如有3个变量x、y、z,但x+y+z=18,因此其自由度等于2。在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。通常df=n-k。其中n为样本含量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。,在上表中,f称为自由度,为f=n-2,n为样本数;上方的 代表不同的置信水平;表内的数值代表不同的置信水平下相关系数的临界值;公式 的意思是当所计算的相关系数
5、 的绝对值大于在 水平下的临界值 时,两要素不相关(即)的可能性只有。,相关系数真值0时样本相关系数的部分临界值r,(1)对伦敦市月平均气温(T)与降水量(P)之间的相关系数,f=12-2=10,在显著性水平 上,查表3.1.3,得知:。因为,所以,伦敦市月平均气温(T)与降水量(P)之间的相关性并不显著。,(2)对于甘肃省53个气象台站降水量(P)和纬度(Y)之间的相关系数,以及蒸发量(V)和纬度(Y)之间的相关系数,f=53-2=51,表中没有给出相应样本个数下的临界值,但是我们发现,在同一显著水平下,随着样本数的增大,临界值减少。在显著性水平=0.001上,取f=50,查表3.1.3得知
6、:=0.001=0.4433。显然,PY和VY的绝对值都远远大于=0.001=0.4433,这说明甘肃省53个气象台站降水量(P)和纬度(Y)之间,以及蒸发量(V)和纬度(Y)之间都是高度相关的。,某地区土壤中有机碳和有机氮含量分别如1所示,试求两者之间是否存在线性相关关系。分析步骤:1.绘制散点图2.前提条件检验正态性检验3.计算Pearson相关系数4.显著性检验,分析结果表明:在0.01水平上,SON和SOC极显著正相关,pearson相关系数为0.96。,某山地各气象观测站的相关数据如2所示,试分析其相关关系。分析步骤:1.绘制散点图2.前提条件检验,正态性检验3.计算Pearson相
7、关系数4.显著性检验,分析结果表明:在0.01水平上,年降水量与经度极显著负相关,相关系数为0.559;年降水量与海拔极显著正相关,相关系数为0.937;经度与海拔在数值上极显著负相关,在专业意义上为假相关。,秩相关系数,又称等级相关系数,或顺序相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。,(3.1.4),(二)秩相关系数的计算与检验,书中表3.1.4给出了2003年中国大陆各省(直辖市、自治区)的GDP(x)和总人口(y)数据及其位次,将数据代入公式(3.1.4),就可以计算它们之间的秩相关系数:即:GDP(x)与总人口(x)之间
8、的等级相关系数为0.7847。,示例:,n代表样本个数,代表不同的置信水平,也称显著水平,表中的数值为临界值。,秩相关系数的检验,在上例中,n=31,表中没有给出相应的样本个数下的临界值,但是同一显著水平下,随着样本数的增大,临界值减少。在n=30时,查表得:0.010.432,由于xy=0.7847 0.010.432,所以在=0.01的置信水平上来看,中国大陆各省(直辖市、自治区)人口规模与GDP是等级相关的。,二、多要素间相关程度的测定,偏相关系数的计算与检验复相关系数的计算与检验,二元变量的相关分析在一些情况下无法较为真实准确地反映事物之间的相关关系。例如,在研究某农场春季早稻产量与平
9、均降雨量、平均温度之间的关系时,产量和平均降雨量之间的关系中实际还包含了平均温度对产量的影响。同时平均降雨量对平均温度也会产生影响。在这种情况下,单纯计算简单相关系数,显然不能准确地反映事物之间地相关关系,而需要在剔除其他相关因素影响的条件下计算相关系数。偏相关分析正是用来解决这个问题的。,问题产生,偏相关系数的计算与检验,偏相关系数的计算 定义:在多要素所构成的地理系统中,先不考虑其它要素的影响,而单独研究两个要素之间的相互关系的密切程度,这称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。计算:3个要素的偏相关系数,(3.1.5),(3.1.6),(3.1.7),四个要素的偏相关系数
10、,(3.1.8),(3.1.9),(3.1.10),(3.1.11),例如:对于某四个地理要素x1,x2,x3,x4的23个样本数据,经过计算得到了如下的单相关系数矩阵:,利用一级偏向关系数公式计算一级偏向关系数,如表3.1.5 所示:,利用 二级偏相关系数公式计算二级偏相关系数,见下表:,性质,偏相关系数分布的范围在-1到1之间;偏相关系数的绝对值越大,表示其偏相关程度越大;偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数,即 R123|r123|。,偏相关系数的显著性检验 t检验法的计算公式:,上例检验:查t分布表,在自由度为23-3-1=19时,t0.001=3.883
11、,显然,这表明在置信度水平=0.001上,偏相关系数r2413是显著的。,某山地各气象观测站的相关数据如所示,试分析消除经度影响后,年降水量与海拔的偏相关系。分析步骤:1.前提条件检验正态性检验2.计算偏相关系数3.显著性检验,偏相关分析,早稻产量与降雨量和温度之间的关系,实现步骤,图 在菜单中选择“Partial”命令,图“Partial Correlations”对话框,图“Partial Correlations:Options”对话框,结果和讨论,复相关系数,复相关系数:反映几个要素与某一个要素之间的复相关程度。计算 当有两个自变量时,当有三个自变量时,当有k个自变量时,,(3.1.1
12、5),(3.1.16),(3.1.17),性质 复相关系数介于0到1之间,即 复相关系数越大,则表明要素(变量)之间的相关程度越密切。复相关系数为1,表示完全相关;复相关系数为0,表示完全无关。仅表现出一个变量与一个变量集一起变化的程度。复相关系数必大于或至少等于单相关系数的绝对值。显著性检验 F-检验法。其统计量计算公式为,例题:在上例中,若以x4为因变量,x1,x2,x3为自变量,试计算x4与x1,x2,x3之间的复相关系数。,解:按照公式(3.1.16)计算:检验:,故复相关达到了极显著水平。,某山地各气象观测站的相关数据如2所示,试年降水量与海拔和经度的复相关关系.,假定有 n 个样品
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第3章 地理学中的经典统计分析方法第1节 相关分析ppt课件 地理学 中的 经典 统计分析 方法 相关 分析 ppt 课件
链接地址:https://www.31ppt.com/p-2133315.html