地理学中的经典统计分析方法.ppt
《地理学中的经典统计分析方法.ppt》由会员分享,可在线阅读,更多相关《地理学中的经典统计分析方法.ppt(243页珍藏版)》请在三一办公上搜索。
1、第三章 地理学中的经典统计分析方法,甘肃农业大学资源与环境学院,内容,第一节 相关分析第二节 回归分析第三节 时间序列分析第四节 系统聚类分析第五节 主成分分析第六节 趋势面分析方法第七节 马尔科夫预测方法,甘肃农业大学资源与环境学院,第1节 相关分析(correlation analysis),相关分析的任务,是揭示地理要素之间相互关系的密切程度。而地理要素之间相互关系密切程度的测定,主要是通过对相关系数的计算与检验来完成的。,甘肃农业大学资源与环境学院,地理相关的意义,相关与地理相关相关是指两个或两个以上变数间相互关系是否密切。在研究这种关系时并不专指哪一个是自变量,哪一个是因变量,而视实
2、际需要确定。相关分析仅限于测定两个或两个以上变数具有相关关系者,其主要目的是计算出表示两个或两个以上变数间的相关程度和性质地理相关,就是应用相关分析法来研究各地理要素间的相互关系和联系强度的一种度量指标,甘肃农业大学资源与环境学院,地理要素间的关系 函数关系:确定性的关系,这种关系在地理各要素间较少见,这是因为许多地理要素的变化具有随机性的缘故;相关关系:即要素间既存在密切的关系,但又不能由一个(或几个)要素(或变量)的值明确地求出另一个要素(变量)的值。,甘肃农业大学资源与环境学院,两要素之间相关程度的测定多要素间相关程度的测定,内容,甘肃农业大学资源与环境学院,一、两要素之间相关程度的测定
3、,相关系数的计算与检验秩相关系数的计算与检验,甘肃农业大学资源与环境学院,相关系数的计算 定义:和 为两要素的平均值。,(3.1.1),(一)相关系数的计算与检验,甘肃农业大学资源与环境学院,说明:-1=1,大于0时正相关,小于0时负相关。的绝对值越接近于1,两要素的关系越密切;越接近于0,两要素的关系越不密切。,甘肃农业大学资源与环境学院,简化:记 公式()可简化为,(3.1.2),甘肃农业大学资源与环境学院,表3.1.1 伦敦的月平均气温与降水量,资料来源:,相关分析实例,甘肃农业大学资源与环境学院,(1)根据表中的数据,我们可以利用公式(),计算伦敦市月平均气温(t)与降水量(p)之间的
4、相关系数(2)计算结果表明,伦敦市的月平均气温(t)与降水量(p)之间呈负相关,即异向相关。,甘肃农业大学资源与环境学院,又如:根据甘肃省53个气象台站的多年平均数据(见教材表),可以利用公式()对降水量(p)和纬度(y)之间的相关系数以及蒸发量(v)和纬度(y)之间的相关系数进行计算,结果如下,甘肃农业大学资源与环境学院,计算结果表明,降水量(p)和纬度(y)之间异向相关,而蒸发量(v)与纬度(y)之间同向相关。,甘肃农业大学资源与环境学院,相关系数的检验,相关系数是根据要素之间的样本值计算出来,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知
5、道它的可信度。检验是通过在给定的置信水平下,查相关系数检验的临界值表来实现的。,甘肃农业大学资源与环境学院,表3.1.3 检验相关系数 的临界值()表,甘肃农业大学资源与环境学院,在表中,f 称为自由度,其数值为 f=n-2,n为样本数;上方的 代表不同的置信水平;表内的数值代表不同的置信水平下相关系数 的临界值,即;公式 的意思是当所计算的相关系数 的绝对值大于在 水平下的临界值 r时,两要素不相关(即)的可能性只有。,甘肃农业大学资源与环境学院,对伦敦市月平均气温(t)与降水量(p)之间的相关系数,f=12-2=10,在显著性水平 上,查表,得知:。因为,所以,伦敦市月平均气温(t)与降水
6、量(p)之间的相关性并不显著。,甘肃农业大学资源与环境学院,对于甘肃省53个气象台站降水量(p)和纬度(y)之间的相关系数,以及蒸发量(v)和纬度(y)之间的相关系数,f=53-2=51,表中没有给出相应样本个数下的临界值,但是我们发现,在同一显著水平下,随着样本数的增大,临界值 减少。在显著性水平=0.001上,取f=50,查表得知:=0.443 3。显然,和 的绝对值都远远大于=0.443 3,这说明甘肃省53个气象台站降水量(p)和纬度(y)之间,以及蒸发量(v)和纬度(y)之间都是高度相关的。,甘肃农业大学资源与环境学院,举例,北京市多年各月平均气温与5cm深的平均地温,如表所示,请计
7、算两者的相关系数,甘肃农业大学资源与环境学院,用导出公式,甘肃农业大学资源与环境学院,相关系数计算表,甘肃农业大学资源与环境学院,甘肃农业大学资源与环境学院,秩相关系数 又称等级相关系数,或顺序相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。,(),(二)秩相关系数的计算与检验,甘肃农业大学资源与环境学院,教材中表给出了2003年中国大陆各省(直辖市、自治区)的GDP(x)和总人口(y)数据及其位次,将数据代入公式(),就可以计算它们之间的秩相关系数 即:GDP(x)与总人口(y)之间的等级相关系数为0.784 7。,示例:,甘肃农业大
8、学资源与环境学院,注:n代表样本个数,代表不同的置信水平,也称显著水平,表中的数值为临界值。,秩相关系数的检验,表3.1.5 秩相关系数检验的临界值,甘肃农业大学资源与环境学院,在上例中,n=31,表中没有给出相应的样本个数下的临界值,但是同一显著水平下,随着样本数的增大,临界值 减少。在n=30时,查表得:0.432,由于=0.784 7 0.432,所以在=0.01的置信水平上来看,中国大陆各省(直辖市、自治区)人口规模与GDP是等级相关的。,甘肃农业大学资源与环境学院,甘肃农业大学资源与环境学院,浙江省月平均气温与相关物理因子的相关关系 a.平均气温与海拔;b平均最高气温与日总辐射;c平
9、均最低气温与日照百分率;d.平均最低气温与相对湿度,甘肃农业大学资源与环境学院,二、多要素间相关程度的测定,偏相关系数的计算与检验复相关系数的计算与检验,甘肃农业大学资源与环境学院,(一)偏相关系数的计算与检验,定义:在多要素所构成的地理系统中,先不考虑其他要素的影响,而单独研究两个要素之间的相互关系的密切程度,这称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。,偏相关系数的计算,甘肃农业大学资源与环境学院,计算:3个要素的偏相关系数,甘肃农业大学资源与环境学院,4个要素的偏相关系数,甘肃农业大学资源与环境学院,例如:对于某4个地理要素x1,x2,x3,x4的23个样本数据,经过计算得
10、到了如下的单相关系数矩阵:,甘肃农业大学资源与环境学院,利用公式计算一级偏向关系数,如表所示:,利用公式计算二级偏相关系数,如表所示:,4个要素的一级偏相关系数有12个,这里给出了9个;二级偏相关系数有6个,这里全部给出来了。,表3.1.6 一级偏相关系数,表3.1.7 二级偏相关系数,甘肃农业大学资源与环境学院,偏相关系数的性质,偏相关系数分布的范围在-11之间;偏相关系数的绝对值越大,表示其偏相关程度越大;偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数,即 R123|r123|。,甘肃农业大学资源与环境学院,偏相关系数的显著性检验,偏相关系数的显著性检验,一般采用t检验
11、法。其统计量计算公式为,式中:为偏相关系数;n为样本数;m为自变量个数。,(3.1.14),甘肃农业大学资源与环境学院,查t分布表,在自由度为23-3-1=19时,t0.001=3.883,显然,这表明在置信度水平=0.001上,偏相关系数r2413是显著的。,譬如,对于上例计算得到的偏相关系数,由于n=23,m=3,故,甘肃农业大学资源与环境学院,复相关系数,实际上,一个要素的变化往往受多种要素的综合作用和影响,而单相关或偏相关分析的方法都不能反映各要素的综合影响。要解决几个要素与某一个要素之间的复相关程度,用复相关系数来测定。,甘肃农业大学资源与环境学院,(二)复相关系数的计算与检验,复相
12、关系数:反映几个要素与某一个要素之间的复相关程度。复相关系数的计算 当有两个自变量时 当有三个自变量时,(),(3.1.16),甘肃农业大学资源与环境学院,当有k个自变量时,(3.1.17),甘肃农业大学资源与环境学院,复相关系数介于01之间,即 复相关系数越大,则表明要素(变量)之间的相关程度越密切。复相关系数为1,表示完全相关;复相关系数为0,表示完全无关。复相关系数必大于或至少等于单相关系数的绝对值。,复相关系数的性质,甘肃农业大学资源与环境学院,复相关系数的显著性检验,复相关系数的显著性检验(F检验法)n为样本数,K为自变量个数,甘肃农业大学资源与环境学院,例题:在上例中,若以x4为因
13、变量,x1,x2,x3为自变量,试计算x4与x1,x2,x3之间的复相关系数。,解:按照公式()计算 检验:,故复相关达到了极显著水平。,甘肃农业大学资源与环境学院,各种相关系数的含义及用途比较,甘肃农业大学资源与环境学院,第2节 回归分析(regression analysis),一元线性回归模型多元线性回归模型非线性回归模型,Enquist&Niklas(Nature 2001),甘肃农业大学资源与环境学院,回归分析与相关分析的区别,相关分析中,变量x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化。相关分析中所涉及的变量x和y都是随
14、机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量。相关分析主要是描述两个变量之间关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。,甘肃农业大学资源与环境学院,什么是回归分析?,从一组样本数据出发,确定变量之间的数学关系式。对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。,回归分析就是对具有相互联系的要素,根据其联系的形态,选择一个合适的数学模式
15、,用来近似地表达要素间平均变化关系。这个数学模式称为回归模型(回归方程),甘肃农业大学资源与环境学院,地理回归分析的意义和作用,相关分析揭示了地理要素之间相互关系的密切程度。若能在某些难测难控的要素与其他易测易控的要素之间建立一种近似的函数表达式,可以比较容易地通过那些易测易控要素的变化情况,了解那些难测难控要素的变化情况。回归分析方法,是研究要素之间具体的数量关系的强有力的工具,运用这种方法能够建立反映地理要素之间具体的数量关系的数学模型,即回归模型。,甘肃农业大学资源与环境学院,回归模型的类型,甘肃农业大学资源与环境学院,一、一元线性回归模型,定义:假设有两个地理要素(变量)x 和y,x为
16、自变量,y为因变量。则一元线性回归模型的基本结构形式为 式中:a和b为待定参数;为各组观测数据的下标;为随机变量。,(),甘肃农业大学资源与环境学院,记 和 分别为参数a与b的拟合值,则一元线性回归模型为()式代表x与y之间相关关系的拟合直线,称为回归直线;是y的估计值,亦称回归值。,(),甘肃农业大学资源与环境学院,参数a与b的最小二乘拟合原则要求yi与 的误差ei的平方和达到最小,即 根据取极值的必要条件,有,(),(一)参数a、b的最小二乘估计,(),甘肃农业大学资源与环境学院,(),(),解上述正规方程组()式,得到参数a与b的拟合值,甘肃农业大学资源与环境学院,最小二乘法(图示),甘
17、肃农业大学资源与环境学院,(二)一元线性回归模型的显著性检验 方法:F 检验法。总的离差平方和:在回归分析中,表示y的n次观测值之间的差异,记为 可以证明,(3.2.9),(3.2.8),甘肃农业大学资源与环境学院,在式()中,Q称为误差平方和,或剩余平方和 而 称为回归平方和。,甘肃农业大学资源与环境学院,统计量F F越大,模型的效果越佳。统计量FF(1,n-2)。在显著水平下,若FF,则认为回归方程效果在此水平下显著。一般地,当FF0.10(1,n-2)时,则认为方程效果不明显。,(),甘肃农业大学资源与环境学院,甘肃农业大学资源与环境学院,二、多元线性回归模型,回归模型的建立 多元线性回
18、归模型的结构形式为,(),式中:为待定参数;为随机变量。,甘肃农业大学资源与环境学院,回归方程:如果 分别为式()中 的拟和值,则回归方程为 在()式中,b0为常数,b1,b2,bk称为偏回归系数。偏回归系数的意义是,当其他自变量都固定时,自变量 每变化一个单位而使因变量平均改变的数值。,(),甘肃农业大学资源与环境学院,偏回归系数的推导过程:根据最小二乘法原理,的估计值 应该使 由求极值的必要条件得 方程组()式经展开整理后得,(),(),甘肃农业大学资源与环境学院,方程组()式称为正规方程组。引入矩阵,(3.2.15),甘肃农业大学资源与环境学院,甘肃农业大学资源与环境学院,甘肃农业大学资
19、源与环境学院,则正规方程组()式可以进一步写成矩阵形式,甘肃农业大学资源与环境学院,求解得引入记号,(),甘肃农业大学资源与环境学院,正规方程组也可以写成,甘肃农业大学资源与环境学院,回归模型的显著性检验,回归平方和U与剩余平方和Q:回归平方和 剩余平方和为 F统计量为 计算出来F之后,可以查F分布表对模型进行显著性检验。,甘肃农业大学资源与环境学院,三、非线性回归模型,指数函数,线性化方法两端取对数得:lny=ln+x令:y=lny,则有y=ln+x,基本形式:,图像,甘肃农业大学资源与环境学院,三、非线性回归模型,幂函数,线性化方法两端取对数得:lg y=lg+lg x令:y=lgy,x=
20、lg x,则y=lg+x,基本形式:,图像,甘肃农业大学资源与环境学院,三、非线性回归模型,双曲线函数,线性化方法令:y=1/y,x=1/x,则有y=+x,基本形式:,图像,甘肃农业大学资源与环境学院,三、非线性回归模型,对数函数,线性化方法x=lgx,则有y=+x,基本形式:,图像,甘肃农业大学资源与环境学院,三、非线性回归模型,S 型曲线,线性化方法令:y=1/y,x=e-x,则有y=+x,基本形式:,图像,甘肃农业大学资源与环境学院,例:表给出了某地区林地景观斑块面积(area)与周长(perimeter)的数据。下面我们建立林地景观斑块面积A与周长P之间的非线性回归模型。,甘肃农业大学
21、资源与环境学院,表3.2.1 某地区各个林地景观斑块面积(m2)与周长(m),甘肃农业大学资源与环境学院,甘肃农业大学资源与环境学院,甘肃农业大学资源与环境学院,解:(1)作变量替换,令:,将表中的原始数据进行对数变换,变换后得到的各新变量对应的观测数据如表所示。,表3.2.2 经对数变换后的数据,甘肃农业大学资源与环境学院,甘肃农业大学资源与环境学院,甘肃农业大学资源与环境学院,(2)以x为横坐标、y为纵坐标,在平面直角坐标系中作出散点图。很明显,y与x呈线性关系。,图3.2.2 林地景观斑块面积(A)与周长(P)之间的双对数关系,甘肃农业大学资源与环境学院,(3)根据所得表中的数据,运用建
22、立线性回归模型的方法,建立y与x之间的线性回归模型,得到 对应于()式,x与y的相关系数高 达=0.966 5。(4)将()还原成双对数曲线,即,(3.2.19),(),甘肃农业大学资源与环境学院,甘肃农业大学资源与环境学院,第3节 时间序列分析(Time series analysis),时间序列分析的基本原理 趋势拟合方法季节变动预测,时间序列,也叫时间数列或动态数列,是要素(变量)的数据按照时间顺序变动排列而形成的一种数列,它反映了要素(变量)时间变化的发展过程。,甘肃农业大学资源与环境学院,过去2000a的30a尺度温度变化速率,甘肃农业大学资源与环境学院,渭河流域年径流丰枯年际变化,
23、渭河干流各水文站年平均径流量变化趋势,甘肃农业大学资源与环境学院,甘肃农业大学资源与环境学院,甘肃农业大学资源与环境学院,19602009全球主要国家人均GDP的增长,甘肃农业大学资源与环境学院,一、时间序列分析的基本原理,(一)时间序列的组合成份 长期趋势(Secular Trend,T)是指时间序列随时间的变化而逐渐增加或减少的长期变化的趋势。季节变动(Seasonal Fluctuation,S)是指时间序列在一年中或固定时间内,呈现出的固定规则的变动。循环变动(Cyclical Movement,C)是指沿着趋势线如钟摆般地循环变动,又称景气循环变动(business cycle mo
24、vement)。不规则变动(Irregular Variations.I)是指在时间序列中由于随机因素影响所引起的变动。,甘肃农业大学资源与环境学院,(二)时间序列的组合模型 加法模型 假定时间序列是基于4种成份相加而成的。长期趋势并不影响季节变动。若以Y表示时间序列,则加法模型为Y=T+S+C+I乘法模型 假定时间序列是基于4种成份相乘而成的。假定季节变动与循环变动为长期趋势的函数。该模型的方程式为,(),(),甘肃农业大学资源与环境学院,(三)时间序列的分类,甘肃农业大学资源与环境学院,(四)时间序列构成要素的测定方法,甘肃农业大学资源与环境学院,二、趋势拟合方法,时间序列分析的平滑法主要
25、有三类:移动平均法 设某一时间序列为 y1,y2,yt,则t+1时刻的预测值为 式中:为t点的移动平均值;n称为移动时距。,(一)平滑法,(),甘肃农业大学资源与环境学院,滑动平均法 其计算公式为 式中:为t点的滑动平均值;l为单侧平滑时距。若l=1,则()式称为三点滑动平均,其计算公式为 若l=2,则()式称为五点滑动平均,其计算公式为,(),(),(),甘肃农业大学资源与环境学院,指数平滑法 一次指数平滑 为平滑系数。一般时间序列较平稳,取值可小一些,一般取(0.05,0.3);若时间序列数据起伏波动比较大,则应取较大的值,一般取(0.7,0.95)。,(),甘肃农业大学资源与环境学院,高
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 地理学 中的 经典 统计分析 方法

链接地址:https://www.31ppt.com/p-6107313.html