气象资料及其表示课件.ppt
《气象资料及其表示课件.ppt》由会员分享,可在线阅读,更多相关《气象资料及其表示课件.ppt(120页珍藏版)》请在三一办公上搜索。
1、气象统计方法,第一章 气象资料及其表示方法,1.1 单要素的气象资料 单要素数据资料的表示 基本统计量1.2 多要素的气象资料 多要素数据资料的表示 基本统计量1.3 正态分布的统计检验1.4 区域资料的整理和利用,用统计方法作气象要素的分析和预报是依据大量的气象观测资料来进行的。某个气象要素及其变化可看成为一个变量(或随机变量)。总体(变量全部可能的取值)、样本(收集的一组资料)诊断分析:利用统计学方法对样本进行分析来估计和推测总体的规律性。气象上的单个或多个气象要素可看成为统计学中单个或多个变量。,研究对象-气象要素 如温度、湿度、降水量、气压等等。月、季、年平均值 日、侯平均值,第一节
2、单个要素气象资料,(短期气候预测)(短期天气预报),目的:了解气象要素随时间变化的规律性。如:选取南京市1961-2010年逐年7月份降水资料进行研究。,问题的提出:如何用数学方法表示样本?如何描述样本的统计特征?,一、单要素数据资料,1、表示:某要素x有n次观测值,其向量表达形式为:,n:样本容量,或,常用,2、含义:随时间变化的数据序列,习惯称为时间序列。3、几何意义:(1)n维空间中的一个点;(2)一维空间中的n个点。,二、基本统计量,在气候诊断中,常用一些量来表征气候状态的基本统计特征。,1、平均值(均值)是描述某一气候变量样本平均水平的量。它代表样本取值中心趋势的统计量。其表达式为:
3、,n 个样本,n+1个样本,推导?,中心趋势统计量,3.5,平均值作为要素总体数学期望的一个估计,反映了该要素的平均(气候)状况。气象上经常出现的月平均气温、年平均气温及某要素多年平均值就是这种统计量。(注意不同平均值的含义和计算方式,以1961-2010年南京逐月平均气温资料为例),意义及应用:,1961-2010年南京历年逐月平均气温资料,1961-2010年南京历年逐月平均气温,南京各月多年平均降水量,南京历年月降水量,问题:气温和降水量在计算统计平均值时有何不同?月平均气温与月气温是否一样?月平均降水量与月降水量是否一样?南京多年平均1月气温与南京历年1月平均气温的区别?,2、中位数
4、中位数是表征气候变量中心趋势的另一个量。在按大小顺序排列的气候变量中,位置居中的那个数就是中位数。其优点是它不易受异常值的干扰。特别是在样本量较小的情况下。样本奇数情况下直接取中位数 样本偶数情况?,取中间两数的平均值,3、众数,1)概念 要素(变量)值中出现次数最多的那个数。2)意义 表征研究要素的一般水平。众数和中位数又称为位置平均数,不受极端变量值的影响。,注:若有特别大的极大值和特别小的极小值存在,最好采用众数和中位数。变量取值次数较少,或虽然取值次数多,但无明显集中趋势,计算众数就没有意义了。,变化幅度统计量,气象和气候研究中,大家更关心的是其变化。如气候变化,天气变化等。均值和中位
5、数等只告诉气候变量变化的平均水平,却无法知道这种变化与正常情况的偏差和变化的波动。有没有其他的统计量来表征变化幅度和变化波动呢?,描述气候变化与正常情况的偏差和变化的波动量:距平 方差与标准差 变率和变差系数,1、距平(anomaly)描述气候变量偏离正常情况的偏差。气象上常用的变量,也就是通常说的异常。一组数据中的某一个数xi与均值的差就是距平。,单变量样本(序列)中每个样本资料点的距平值组成的序列称为该变量的距平序列。,4,xi,xdi,1961-2010年南京历年逐月平均气温资料,举例:1月份和7月份南京降水量情况,距平 值比原始绝对数量更能说明问题。,降水距平百分率:(距平/平均值)*
6、100%,气象上的应用:中心化的概念:把资料处理为距平的方法叫中心化。气象上常用距平值代替原样本中的资料值作为研究对象。中心化的必要性:因为气象要素的年变化周期影响很大,各月的平均值不一样,为了使之能在同一水平下比较,常使用距平值。用距平直接作为预报值,比较直观(偏高/偏低)。,主要特征:任何变量序列,经过距平化处理后,都可以化为平均值为0的序列。(证明?),19612008年黄河流域区域平均的夏季降水量距平的年际变化(单位:mm),正、负值总和相等,如何判断距平图是否正确?,地气温差(),19612008年西北干旱区春季地气温差距平的年际变化,地气温差(),错误的图,正确的图,问题:请问一个
7、距平序列与其原始序列的演变趋势(曲线图形状)有何不同?谁来回答?,2、标准差(均方差)与方差 方差s2与标准差(均方差)s是描述样本中数据与平均值差异的平均状态,反映变量以平均值为中心的平均振动幅度(离散程度)的特征量。,方差的向量表示形式:,xdi为距平值,T 表示转置.,1)如果12月份气温标准差比1月份大,反映了12月份气温随时间变化幅度比1月大。,气象上的应用:,均方差:12月 1.75 1月 1.09,问题:均方差小的要素预报比大的困难还是容易?原因?,3)变量加(减)某常数后均方差相同。,2)对于同一个月,如果南京气温的标准差比北京小,说明北京气温变化幅度大。(内陆日变化较沿海大,
8、这个比较就是使用标准差比较的),近100年北半球海平面气压场的方差分布图,图中是否会有负值?图中高,低值分别表示什么意思?,资料的标准化处理,Why standardized?,在气象要素中,各个要素的单位不一样,平均值及方差也不同。为使它们能在同一水平上进行比较,采用标准化办法,使它们变成同一水平的无单位(量纲)的变量-标准化变量。,在气候诊断分析中,也常对资料进行标准化处理,得到标准化序列来代替气候变量本身的观测数据。,气象变量xi,样本容量为n,为平均值,方差是s2,标准化后变量为xzi,平均值为,方差为,任何气候变量序列经过标准化处理后,都可以化为平均值为0、方差为1的序列,标准化处理
9、的好处:1)不同气象要素经标准化处理消去单位后,具有相同的均方差,可以互相比较异常程度;2)标准化处理后,变量的值一般在(-33)之间,绘图方便;变量值不在(-33)之间的概率仅为0.0027。3)一般距平达到或者大于2倍均方差概率不到5%,可以确定异常标准(如严寒、高温、旱涝年等)。4)可以检查资料的可靠性和正确性。,3、变率和变差系数,1)意义:说明变量值变化的大小。2)变率:绝对变率:距平绝对值的平均。相对变率:绝对变率与平均值之比(百分比)。,3)变差系数:标准差与平均值之比(%),表示变量的相对变化。,注意:变率和标准差的数量级与变量平均值的量级有关。有些同类型变量,彼此之间平均值差
10、别大,若要比较它们的变化性用绝对变率和标准差不恰当,应当利用相对变率或变差系数。,累积频率是反映分布形态统计量的一个指标。概念的引入:,平均值和均方差相同,但取值有很大区别,为区别其特征,需引入新的统计量-累积频率。,累积频率(样本特征)-有限样本的统计,累积频率的定义:变量小于某上限值的次数 与总次数之比。,上限,分布函量:无限总体中的累积频率。,为概率密度函数,其常见的函数形式为正态分布:,上限,和为变量的总体平均值(数学期望)和均方差,状态资料:表征气象要素的各种状态,观测结果无法用数据表示。如雾、冰雹、霜-用“有”或“无”、“强”或“弱”等表示。雨的强度-等级表示,如大暴雨、大雨等。风
11、的强度等级-1级、2级、12级等等。,状态资料及其统计特征:,对于气温、气压及降水量等气象要素,观测值在正、负无穷之间,这种类型要素可看成为连续型随机变量。气象中一些气象要素,如冰雹、晕、雾等天气现象,气象资料中仅记录为“有”或“无”可用“1”或“0”二值数字化表征,这类变量可看成离散型随机变量。其中云量,常用110来分级也属于这一类型。,状态资料及其统计特征:,频率表、分布列,对气象要素现象的各种状态如何描述其统计特征?列出各个状态出现的频率。对样本而言是频率表,总体而言称为分布列。,状态资料及其统计特征:,第一章 气象资料及其表示方法,1.1 单要素的气象资料 单要素数据资料的表示 基本统
12、计量1.2 多要素的气象资料 多要素数据资料的表示 基本统计量1.3 正态分布的统计检验1.4 区域资料的整理和利用,*也可以理解为同一要素多个站点(格点)的资料。,第二节 多要素的气象资料,全国160站站点分布,一、数据资料的表示 1、表示:多气象要素的样本如何表示?-矩阵 设有m个气象要素,每个要素有n次观测值,则数据矩阵为:,第j个样本的资料向量为:,温度/站点A,降水/站点B,R型因子分析,Q型因子分析,2、数据的两种空间表示(几何意义)n维空间中的m个点(行)R型因子分析:研究m个变量之间的关系-相关系数m维空间中的n个点(列)Q型因子分析:研究n个样本之间的关系-相似系数,3、均值
13、向量,m个变量的样本平均值组成的向量。,m维空间中的n个点的重心.,多年平均1月气温(19712010年),多年平均7月气温(19712010年),多年平均1月降水量(19712010年),多年平均7月降水量(19712010年),2013年7月131日,淮河以南地区平均气温30.6,比常年同期偏高2.9,为1961年以来同期最高。,沿江苏南部分台站极端最高气温超其建站以来极值。,月降水量大部分地区偏少,衡量任意两个气象要素(变量)之间关系的统计量主要有协方差、相关系数。,二、基本统计量-相关程度统计量,1、协方差:2个变量距平向量的乘积。定义:n个样本的资料序列,其协方差为:,协方差是反映两
14、个气象要素异常关系的平均状况。,变量自身的协方差-方差,T0与T1的距平符号相同率高,有相同的变化趋势;H与LE的距平符号相反率高,有相反的变化趋势;两组变量均有良好的关系。协方差为正 变化一致 负 变化相反 问题:协方差带单位,不同要素之间不好比较,如何解决?,1:12月2:1月3:2月,协方差矩阵,m阶对称矩阵,对角线元素是第i个变量的方差。,为方便起见,可用离差积表示,构成离差矩阵。,总体协方差矩阵的无偏估计:,若 是未知参数的一个点估计量,即,则 称为的无偏估计值.此时,用 代替不含系统误差.样本均值是总体均值的无偏估计值;修正样本方差是总体方差的无偏估计值.无偏估计值未必是唯一的,当
15、然应选对的平均偏差较小者为好(有效性),即估计值应有尽量小的方差,方差最小的估计值就是有效估计值。,求北京气温12月、1月、2月的协方差 阵:,协方差是带单位的统计量,不便于比较不同要素的异常关系。利用标准化处理方法,对变量先进行标准化,然后计算协方差(不带单位),这种协方差就是相关系数。,相关系数-标准化的协方差,2、相关系数(Pearson相关系数),相关系数计算公式:,相关系数是描述两个随机变量线性相关的统计量。用r表示。设有两个变量序列:,;,用标准差的形式表示的相关系数:,变量自身对自身的相关系数为多少?相关系数值的范围为-1+1 r0?r0?r=0?,计算出的相关系数是否显著,需要
16、经过显著性检验。,相关关系的描述与测度,1:12月2:1月3:2月,=0.352,计算北京12月和1月气温的相关系数:,相关矩阵,m阶对称矩阵,对角线元素是变量自身的相关系数。,求北京气温12月、1月、2月的相关 阵:,三、多维频率表、多维分布列,针对气象要素(现象)的状态资料;概念:统计多个气象现象的各种情况下的频率,组成一张多维频率表。当统计资料很多时,也称多维分布列。优点:对预报很有参考价值。,7月份某气象站24小时内(08时到次日08时)降雨量与08时绝对湿度关系,第一章 气象资料及其表示方法,1.1 单要素的气象资料 单要素数据资料的表示 基本统计量1.2 多要素的气象资料 多要素数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 气象 资料 及其 表示 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-3124773.html