地表太阳辐照度毕业论文.doc
目 录中文摘要1英文摘要21 引言31.1 前言31.2 太阳辐射的简介31.2.1 太阳与地球的运动规律31.2.2 太阳辐射与大气层的影响41.2.3 到达地面的太阳辐射41.3 课题研究的意义与重要性41.3.1 太阳辐射预测方法研究的理论意义41.3.2 太阳辐射预测为太阳能利用工程提供重要资料61.4 国内研究太阳辐射的现状72 常用的模型与预测方法82.1 常用的太阳辐射模型82.2 预测方法的分类92.3 常用的预测技术92.4 本文研究的内容和目标112.4.1 太阳辐射影响因素的研究112.4.2 对太阳模型进行预处理与相关性分析123 基于时间序列分析的短时间尺度太阳辐射模型研究133.1 时间序列概述133.2 时间序列分析的目的143.3典型时间序列分析模型153.4 ARMA模型163.4.1 平稳时间序列的定义163.4.2 平稳时间序列的模型174 地表太阳辐射时间序列模型与建模(ARMA模型)194.1 建模过程194.2 算例分析29结论32谢辞33参考文献34附录36地表太阳辐照度的模拟和预测摘 要:随着“能源危机”的临近,今天世界各国都在竭尽全力地进行着节省能源和开发新能源的研究工作。太阳能被看成巨大而清洁的具有代表性的新能源,随着太阳能利用技术的进步,需要的太阳辐射资料很多,精度要求又很高,并且对未来时间的太阳辐射强度预测技术提出了更高的要求。太阳辐射预测可弥补我国辐射资料的不足,并为太阳能工程、新能源的利用提供重要参考工具;同时,一个合理的太阳辐射模型,是获得空调负荷精确预测的关键性前提。本文拟就太阳辐射的预测从理论上和方法上进行深入的探索与研究。本文针对太阳实测数据是一个依时间顺序排列的序列,序列之间存在着某种关联,这种关联不是因果关系,统计学中成为相关性基于时间序列分析的ARMA模型能够准确模拟目标序列所包含的相关性,且模型形式简洁实用,对太阳辐射的时间序列分析与模拟研究已成为近年来太阳能技术领域的一个研究热点,并且也逐渐用于光伏发电系统设计与分析的研究中。通过对ARMA模型的序列处理,相关分析,模型估计,参数估计,模型的定阶与检验,然后实验模型预测,研究表明,该预测方法可以获得较好的预测性能,且预测精度可以较好的满足研究要求。关键词:太阳能,模型,预测,相关性,相关性分析Abstract:With the increasing problem of world“Energy Crisis”,today, every country all over the world are emphasizing on the research work of energy conservation and new energy development,teeth and nailSolar energy is a representative new energy which is abundant and cleanAs the technology of utilization of solar energy develops,the need of solar data are increasing,the demand of precious are heightening,and the technique of forecast solar intensity in future are requiring further improvingSolar forecast can fill in the database and provide an important tool for solar energy application and new energy utilizationMeanwhile,an appropriate solar model is a key precondition of accurate load forecast for air conditioning systemsThis paper aims to the deep research into the theories and methods of solar forecastIn this paper, the measured solar data is arranged in a chronological sequence, there is some correlation between them, it is not causality, but called correlation in Statistics. The ARMA model based on time series analysis can accurately simulate the target sequence contained in the relevant, and the form of the model is simple and practical, the time series analysis and simulation of the solar radiation has become a hot topic in the field of the solar technology, and gradually used for the study of power generation system design and analysis. To better understand the ARMA models, it should be done by the following steps, sequence processing, correlation analysis, model estimation, parameter estimation, model order determination and inspection, and then achieve the forecast.Key words: solar energy, model, forecast, correlation, correlation analysis1 引言1.1 前言能源是人类社会活动的物质基础。1973年发生的世界性的石油危机,敲响了燃料资源有限的警钟,许多国家认识到能源的至关重要性。随着“能源危机”的临近,今天世界各国都在竭尽全力地进行着节省能源和开发新能源的研究工作。人类所利用的能源,大都是由太阳能直接或间接转换而来。太阳能被看成巨大而清洁的具有代表性的新能源,所以,人们就它的直接和间接利用,积极地从事调查研究和推广普及工作是不言而喻的。由于热核反应,太阳能表面温度可以达到6000K,并且向宇宙释放巨大的辐射能。地球大气中发生的全部现象都是直接或间接来源于这一能源。狭义地说,来自太阳的太阳光照射到物体表面(特别是地球表面等)成为太阳辐射。近年来,作为表述太阳能的关联内容,太阳辐射的意义越来越广。太阳能利用工程主要包括:太阳能集热器、太阳能热水器、太阳热采暖、太阳能电池、太阳能制冷与空调、太阳热发电、太阳炉等1。太阳辐射强度是太阳能利用工程各种设备必需的基本量,实际到达地面的太阳辐射强度受各种因素的影响存在着很大的随机性。随着太阳能利用技术的进步,需要的太阳辐射资料很多,精度要求又很高,并且对未来时间的太阳辐射强度预测技术提出了更高的要求。1.2 太阳辐射的简介1.2.1 太阳与地球的运动规律 太阳是一个主要由氢(80%)和氮(19%)组成的气态火球,直径km,质量约为t,它是太阳系中最大的行星,也是离地球最近的恒星。太阳表面的有效温度为5762K,而中心区得温度可达K,压力为Pa,它的热量主要来源与氢聚变成氦的聚合反应,每秒有kg氢聚合变成kg氦,连续产生kW能量。这些能量以电磁波的形式向空间辐射,其中有二十亿分之一到达地球表面,约kW。太阳的结构可以分为太阳内核、辐射输能区、核对流区、光球区(肉眼所能见的太阳表面)、反色层、色球层和日冕。可见,太阳并不是一个一定温度的黑体,而是许多不同波长放射、吸收的辐射体。不过,应用于太阳能系统时,通常将太阳看成为温度为6000K,波长为的黑色辐射体。地球是一个近似圆球的球体,地球上任何地点的位置都是用地理坐标的经度与维度表示(对太阳能的利用中这类数据时必不可少的参数)。地球绕着地轴不断自转,自转一周,即经度,形成一昼夜。地球除了自转以外还绕着太阳绕着偏心率很小的椭圆形轨道公转,周期为一年。地球的自转轴与公转运行的轨道面(黄道面)的法线倾斜角成夹角,而且在地球公转时自转轴的方向始终指向天球的北极。1.2.2 太阳辐射与大气层的影响由于地球公转轨道是一个椭圆,所以地球和太阳之间的距离在一年之内是变化的。所谓的“平均日地距离”是指地球公转的长半径,等于km。当地球和太阳处于平均日地距离时,在地球大气层外,垂直于太阳辐射的表面上,在单位面积和单位时间内接收到的太阳辐射能,叫太阳常数,用表示,其值约为。大气层上界水平面的太阳辐射日总量可以用下式表示计算: (1-1) 式中 为日地距离变化引起大气层上界太阳辐射能量的修正值,其表达式为: (1-2)1.2.3 到达地面的太阳辐射太阳总辐射是指到达地表水平面的太阳直接辐射和散射辐射的总和,即 (1-3)1.3 课题研究的意义与重要性1.3.1 太阳辐射预测方法研究的理论意义地球表层998的能量来源于太阳,太阳辐射是指太阳向宇宙空间发射的电磁波和粒子流。太阳辐射是影响气候变化的重要因素之一。地球所接受到的太阳辐射能量仅为太阳向宇宙空间放射的总辐射能量的二十亿分之一,但却是地球大气运动的主要能量源泉。大气和地面接收到的太阳辐射能对大气的加热、 大气对流、 地面的热状况及生物的生长、 人类的各种活动,太阳能的利用等都有巨大的影响,同时它也是水体初级生产者的主要能量来源,其大小、变化将直接影响到湖泊水体生态系统的结构、功能和演变。随着生态学和地球科学研究尺度的扩展,太阳辐射的空间分布特征也日趋重要。但太阳辐射的观测由于其设备复杂, 成本费用高, 其观测密度远小于温度、 降水等气象要素的观测密度, 采用简单的空间内插或外推技术不可能合理的揭示太阳辐射的空间分布特征. 。但太阳辐射的观测由于其设备复杂,成本费用高,其观测密度远小于温度、降水等气象要素的观测密度,采用简单的空间内插或外推技术不可能合理的揭示太阳辐射的空间分布特征。所以,对太阳辐射各影响因素尤其是随机性因素进行研究,建立相应的动态预测模型,此研究方法在理论上具有相当重要的意义,其研究结果将丰富有关的数据库,其预测方法也具有一定的通用性,可移植至空调负荷、电力负荷等负荷预测领域,甚至可用来做河道浅滩演变、地震、股市、财务失败及农作物虫情预报等等。太阳能具有以下优点:1) 普遍:太阳光普照大地,没有地域的限制无论陆地或海洋,无论高山或岛屿,都处处皆有,可直接开发和利用,且无须开采和运输。 2) 无害:开发利用太阳能不会污染环境,它是最清洁能源之一,在环境污染越来越严重的今天,这一点是极其宝贵的。 3) 巨大:每年到达地球表面上的太阳辐射能约相当于130W亿吨煤,其总量属现今世界上可以开发的最大能源。 4) 长久:根据目前太阳产生的核能速率估算,氢的贮量足够维持上百亿年,而地球的寿命也约为几十亿年,从这个意义上讲,可以说太阳的能量是用之不竭的。综上所述,太阳能研究具有以下理论意义:1) 弥补我国辐射资料的不足,丰富有关的数据库。2) 为太阳能工程、新能源的利用提供重要的参考工具,是太阳能系统优化运行的一个重要前提。3) 对某些运用太阳能的项目提供更精确地参数,优化系统运行与控制,提高节能效率。 4) 为其他领域的预测提供参考与模型1.3.2 太阳辐射预测为太阳能利用工程提供重要资料地球表面的太阳总辐射强度是太阳能等可再生能源、农业、气象、电力、环境等领域的研究和生产活动的基本数据之一。利用太阳辐射作为能源时的基本问题之一,是关于入射到地球表面的太阳辐射强度的绝对值及其变化量。太阳辐射强度就是指太阳在垂直照射情况下在单位时间内,单位面积上所得到的辐射能量。人们肉眼所见到的光耀夺目的太阳表面叫“光球”,“太阳能”的绝大部分是由此发射出来的。光球以电磁波的形式向宇宙空间辐射能量,总称为太阳辐射。太阳辐射的总功率为W,而到达地面的太阳辐射总功率为W,仅占太阳总能量的二十亿分之一。某处所获得的太阳辐射的大小主要取决于如下影响因素:1) 天文因素 日-地距离,太阳赤纬角,太阳时角。2) 地理因素 太阳在某时刻对地球上某处的相对位置,当地的纬度与经度,海拔高度。3) 物理因素 太阳辐射进入大气层得衰减情况,接受太阳辐射表面的特性。4) 几何因素 太阳辐射接受地面的方位和倾角由于地球外表有一层厚约30km的大气层。虽然厚度不大,不及地球直径的四百分之一,但对太阳辐射有较大的影响。太阳辐射穿过大气曾时,将受到大气中的各类气体,如臭氧、二氧化碳以及水蒸气和灰尘等物的吸收、反射和散射,使得到达地面的太阳辐射显著衰减,据估计,反射回宇宙的能量约占总量的30%,被吸收的约占23%,其余47%左右的能量才到达地球陆地和海洋,成为地球上能源的主要能源。地球表面上的太阳辐射由两部分组成:1) 直接辐射 不改变方向的太阳辐射2) 散射辐射 被大气层或云层反射和散射后改变了方向的太阳辐射到达地球表面的太阳总辐射受太阳高度角、大气条件、日照时数及时间等各种因素的影响,因而存在着很大的随机性。气象领域发展至今,有关太阳辐射的研究已积累了大量传统的、具有明确物理意义的模型和方法。在缺乏太阳总辐射任何相关气象资料时,确定性模型具有一定的实用价值和存在价值,然而它最大的缺点是忽略了太阳辐射序列的随机性,而机械地按某一特定规律计算太阳辐射值,在很大程度上不能反映气象的变化情况与辐射值之间的联系,所以不管其形式如何,都不能反映太阳辐射序列很强的随机性。因此,本文提出了基于时间序列的ARMA模型,该模型不仅可以对历史数据进行分析,还能对未来一段时间的太阳模型数据进行预测,并且可以获得较高的精度,以此来弥补我们太阳能辐射数据库资源的不足,并为太阳能工程,新能源的利用提供参考工具1.4 国内研究太阳辐射的现状1984年由欧洲委员会(Dommission of the European Communities, Directorate General Science, Research and Development)负责组织,根据19661975期间欧洲340个气象台站的月平均总太阳辐射和日照时数,绘制了欧洲的太阳辐射地图2.我国的太阳辐射分区以前都是太阳辐射强度或者日照时数作为主要依据进行分区。左大康等在1960年前后研究了中国年、月总辐射的气候学计算方法,根据总辐射在全国范围进行了太阳辐射的空间划分。但由于该项研究在20世纪60年代,所用资料较少,现在很少被使用。文献3以19612000期间40年气候资料为基础,加上通过模型计算出的年总辐射对青藏高原进行了太阳辐射空间划分。文献4利用19611990年有关气候资料,计算辽宁省各地的总辐射和光合有效辐射资源,据此分析了辽宁的太阳辐射时空分布特征。该文献还指出,太阳总辐射的季节性变化很大,因此导致太阳辐射的空间分布也随季节有很大变化。分析上述对于太阳辐射空间分布的研究,发现:1)研究太阳辐射的空间分布大都是以太阳总辐射为主要依据;2)国内研究所用气象数据大都是偏旧,而气候影响的变化需要不断更新;3)所用气象台站数偏少,不能反映整体情况2 常用的模型与预测方法2.1 常用的太阳辐射模型5太阳辐射模型是关于计算地面所接收到的太阳辐射(总辐射、直接辐射和散射辐射)的模型,其中直射辐射和水平面散射辐射是由水平面总辐射经直散分离后得到的。根据应用对象的不同,太阳辐射模型可分为月值模型、日值模型和瞬时值模型(一般为小时值)。太阳辐射的逐日或逐时观测数据构成了随即性很强的时间序列,但太阳辐射序列的内部仍有某种确定性的规律,有其相对稳定的部分,故太阳辐射模型又有确定性模型与随即模型之分。计算太阳辐射的确定性模型多种多样,又得来自理论推导,又得属于经验公式,又得则是半经验半理论公式。如1970-1994年间,仅在日本建筑学会上发表的有关日射模型研究的论文就达218篇,并提出了一些日射模型和直散射分离模型,其中确定性模型主要有宇田川直散分离模型 、渡迈俊行模型;1978年,美国供暖、空调与制冷工程师协会天太阳模型(建成ASHTAE模型);1993年,宋爱国HRAE模型提出了北京地区的晴天太阳辐射模型(简称北京模型);以及文献6提出的适合阿拉伯半岛的太阳辐射模型、文献7提出的Hottel模型、文献8提出的Threlkeld&Rabl模型。如前1.2.2所述,在缺乏太阳总辐射任何相关气象资料时,确定性模型具有一定的实用价值和存在价值,然而其不能反映太阳辐射序列很强的随机性。因此,许多研究者都在确定性模型的基础上考虑因素的影响,提出了将序列的随机性考虑进去的建模方法,如文献9中提出的松尾太阳模型;文献10中郎四维根据松尾太阳模型提出了适合中国城市水平的太阳辐射量模型;文献11中采用半正弦模型与Collares-Pereira & Rabl模型中效果较好的计算太阳总辐射逐时序列的确定性部分,将计算残差作为随机部分进行ARMA模型的建立;文献12-16都提出了基于神经网络的太阳辐射预测模型;文献17提出了时间序列方法和神经网路法相结合的太阳辐射模型;文献18提出了改进的半正弦模型和Collares-Pereira & Rabl模型的预测修正模型、递归BP网络(RBPN)太阳辐射模型和混沌优化神经网络(CONN)太阳辐射模型。2.2 预测方法的分类5预测方法可以分成两类:经典预测方法和现代预测方法,经典预测方法又可分为定性预测(直观性预测)和定量预测(统计预测)。在暖冬空调领域,常采用定量预测的方法,即采用数学、概率论和数理统计的方法对历史数据进行处理,如回归分析和时间序列分析,近年来,随着现代预测方法的兴起,神经网路预测技术在暖通空调领域中已有广泛应用。根据负荷预测的周期,可统一划分为长期负荷预测(数年-数十年);中期负荷预测(1月-1年);短期负荷预测(半小时-1周);超短期负荷预测(5-10秒或1-5分钟)。如果按被预测负荷的特性划分,又可分为最大负荷预测、最小负荷预测、平均负荷预测、峰谷差预测、高峰负荷平均预测、低谷负荷平均预测、母线负荷预测、负荷率预测等。预测方法的应用领域广泛,从国民经济、各行各业工商技术到科学研究,都有其研究和应用空间。如果抽掉对象所需预测的因素的物理表征,那么对预测的数学方法的讨论和评价对于所有对象其基础都是一样的。下面以负荷预测领域内的各种技术为线索,简单列举和讨论已出现的典型的预测技术。2.3 常用的预测技术51) 回归分析法回归预测技术是通过回归分析,寻找预测对象与影响因素之间的因果关系,建立回归模型进行预测;由给定的多组自变量和因变量资料,研究各自变量和因变量之间的关系,形成回归方程;求解回归方程后,给定各自变量数值,即可求出因变量值。回归分析法根据历史数据和一些影响负荷变化的因素变量来推断将来时刻的负荷值,它适合于中长期负荷预测,且对数据的要求很高,特别是在历史数据残缺或存在较大误差的情况下,预测效果会很不理想2) 时间序列模型法 一段历史时期的负荷资料组成的时间序列可以看成一个随机过程,某一时期的负荷与它过去的负荷有关,是在过去负荷基础上的随机波动。这种相关关系可以用自协方差函数和自相关函数来描述,时间序列法正是通过研究这种相关关系来建立模型和进行预测的。时间序列模型有自回归(AR)、滑动回归(MA)、自回归-滑动平均(ARMA)、累积式自同归-滑动平均(ARMIA)模型等,模型辨识的基本途径是对原时间序列进行相关分析,也就是计算序列的均值、自相关和互相关函数,从而确定模型的类型。模型辨识后,利用原序列有关的数据,对模型参数进行估计。该方法建立的模型必须满足平稳性条件和可逆性条件,主要考虑负荷本身的变化规律,仅根据历史负荷值和干扰值来推算未来的负荷值,无法计及气象、日期特征等敏感因素对有功负荷的影响。因此,单纯的时间序列法精度较差,一般都是与其他方法结合使用。3) 卡尔曼滤波法又称为状态空间法,其指导思想是:把负荷分解为确定分量和随机分量,确定分量一般用一阶线性模型描述和预测,随机分量则用状态变量表示,通过建立状态空间模型进行负荷预报。当负荷数据表现为较强的非线性,则应采用广义卡尔曼滤波法。这种方法中,负荷是通过状态方程和输出方程来建模的。在系统噪声统计特征已知的情况下,卡尔曼滤波法能递推地进行计算,适用于在线负荷预测。但实际应用中,对量测噪声和系统噪声的统计特性的估计是卡尔曼滤波法的难点所在。4) 灰色模型法灰色预测技术是一种不严格的系统方法,它抛开了系统结构分析的环节,不需要确定负荷变动是否服从正态分布,不需要大的样本统计量,不需要根据负荷变化随时改变预测模型,直接通过对原始数据的累加生成寻找系统的整体规律,从而构建预测模型。灰色预测技术适合于长期负荷预测,用于中短期负荷预测时误差较大。特别是在数据样本缺乏时,该预测方法相对其他方法而言更有效。显然,灰色预测技术不太适合用于短期动态空调负荷预测。5) 模糊预测法负荷的影响因素是多方面的、不确定的,有些影响因素又是含糊的,比如天气情况、社会活动等;对于大型复杂系统,负荷数据及各因素的统计又难免存在偏差,这些因素都难以定量表示。模糊预测是建立在模糊数学理论上的一种预测新技术,包括模糊聚类预测方法、模糊相似优先比方法和模糊最大贴近度方法等。但单纯的模糊方法对于负荷预测精度往往是不尽人意的,这主要因为模糊预测没有学习能力,这一点对于不断变化的系统而言,是极为不利的。6) 专家系统法专家系统是一个基于知识的计算机智能化程序系统,它拥有某个领域内专家们的知识和经验,能像专家那样运用这些知识,通过推理做出决策。借助专家系统,能识别预报日所属类型,考虑天气因素对负荷的影响,按一定的规则推理并进行预报。其缺点是知识库的形成过程复杂,工作量大,而且把专家识有可能不同。因此在进行短期空调负荷精确预测时不推荐单独使用此预测方法。7) 小波分析法小波分析是一种新兴的数学工具,它能任意地提取负荷序列的细节。通过使用小波分析,可以在任何水平上分析负荷序列,它对信息成分采取逐渐精细的时域与频域处理,尤其对突发与短时的信息分析具有明显的优势。小波分析在时域和频域具有同样良好的局部化性质,可以对信号的任意细节加以提取、分析,且能将复杂的问题分解成若干个变化规律较为明显简单的问题。但小波分析应用于预测的预测结果是从小波系数序列的预测结果经重构所得的,因小波系数序列的预测误差将不同程度的影响最终的预报结果,由此,随着分解水平的提高,最终的预报点所受到的影响将迅速增加。8) 人工神经网络法人工神经网络(Artificial Neural Network,缩写为ANN)预测技术能从数据样本中自动地学习以前的经验而无需反复查询和表述过程,并自动地逼近那些最佳表征样本数据规律的函数,而不论这些函数具有怎样的形式,其考虑的系统表现的函数形式越复杂,神经网络这种特性的作用就越明显,即具有以任意精度逼近复杂的非线性函数的特性。ANN还具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适用于处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。但ANN网络也有自己的局限性,一般而言,ANN应用于短期负荷预测要比应用于中长期负荷预测更为适宜。神经网络方法存在局部极小值、过学习以及结构和类型的选择过分依赖经验等问题,容易导致结果的不确定性。2.4 本文研究的内容和目标2.4.1 太阳辐射影响因素的研究太阳辐射强度变化是具有动态性、时变性、多扰量性、不确定性等随即特性的典型非线性曲线。其主要影响因素包括地理位置、太阳高度角、太阳方位角、太阳时角、太阳赤纬、观测日期和时间、日照时数、云量、云态、大气状态,天气状况等。其中,云量、大气状况、天气状况等随机性因素的影响至关重要。在上述各参数中,有些量为非独立参数,可由其他参数通过代数计算得到,有些随机变量不容易得到。在确定太阳能辐射神经网路预测模型输入层神经元个数时一方面得考虑到信息量的充分性,另一方面也得避免信息的冗杂性,为此得对太阳辐射影响因素进行研究,以保证预测过程的收敛及预测结果的精度。对于大气状况、天气状况等非数值性参数,可以利用气象台得气象预报。在对太阳辐射进行预测时,充分利用气象台的气象资料显然可以提高预测模型的准确性。2.4.2 对太阳模型进行预处理与相关性分析太阳辐射历史数据可反映太阳辐射各影响因素的影响作用,通过分析太阳辐射的历史数据,一方面可间接研究其影响因素的作用,另一方面,也可研究太阳辐射时间序列间的影响程度。由此可知,太阳辐射历史数据可时间序列预测模型的主要输入数据。对太阳能时间序列的数据进行预处理与相关性分析,可以对所用的ARMA模型进行准确的辨认,从而更好的进行参数估计与预测. 3 基于时间序列分析的短时间尺度太阳辐射模型研究3.1 时间序列概述时间序列数据挖掘虽然目前较其他类型的数据挖掘研究少一些,但是也是数据挖掘中的一类重要问题。在现实世界里,数据与时间相关是十分普遍的,因此时间序列模式的挖掘在数据挖掘中占有很重要的地位。时间序列由来已久,但是他们作为数据挖掘的历史却很短,MichaelT.Rosenstein等人提出一种从时间序列中发现“概念”(ConcePt)的方法,可以算得上是一种时间序列数据挖掘的雏形。这里的“概念”是基于预测意义上的,概念就是模式的预测内容。时间序列19-21是指同一种现象在不同时间上的相继观察值排列而成的一组数字序列,在现实生活中很多数据都带有时间特征,时间序列随处可见,遍及经济、气象、通信、医疗等多个领域,股市每日(月)指数、交换机每小时业务量,以及本文的试验数据太阳辐射数据等,都形成了一个时间序列。从统计意义上讲,所谓时间序列就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响,往往表现出某种随机性,彼此之间存在着统计上的依赖关系。对时间序列数据进行分析,从中获取所蕴含的关于生成时间序列的系统演化规律,以完成对系统的观测及其未来行为的预测,这在工程应用中具有重要的价值和意义。时间序列的分析技术就起源于对市场经济的预测。当前时间序列分析技术主要是根据概率统计理论对时间序列进行分析,称为随机时序分析。利用一个时间序列在t时刻的有效观测值去预报在某个未来时刻t+l该序列的值,这一问题的提出是基于下列事实:(1)经济和商业计划,(2)生产计划,(3)库存和生产控制,以及(4)生产过程的控制和优化。正如帝国化工产业短期预报专题论文集中所述,预报往往要提前一段时间做出,即所谓的提前期,它是随着具体问题而不同。时间序列数据的研究包括以下几个重要方面,本论文对太阳能辐射数据预测主要是研究时间序列数据的趋势分析以便更好的利用利用太阳能。在进行时间序列的趋势分析中应考虑以下4种变动因素:1)长期趋势(T),也称趋势变动,是指时间序列在整个预测期内受某种根本性的支配因素影响所呈现出渐增或渐减的总倾向。例如,我国人口数时间序列呈现长期递增趋势。2)周期变动(C),以某一时间间隔为周期的有一定规律的周期性变动,如商业周期中危机和复苏的交替。3)季节变动(S),最基本的含义是指受自然界季节更替影响而发生的年复一年的有规律的变化,如服装行业销售额的季节性波动;实际分析中季节波动的概念已有了扩展,一年内由于社会、政治、经济、自然因素影响形成的有规律的周期性的重复变动都成为季节变动。例如,上下班制度对城市市内公交所带来的一天中客流高峰的规律性变化等。4)偶然变动(I),除上述三种情况之外的受众多偶然因素的影响而出现的不规则变动,又称随机变动。这4种因素的综合模式有加法模式、乘法模式和混合模式。若以表示时间序列(1,2,3,表示采样时刻),则加法模式的时间序列是上述4种变动因素的相加,(T)(C)(S)(I),而乘法模式的则是上述4种变动因素的相乘,=(T)×(C)×(S)×(I),一般来说将周期变动(C)和长期趋势(T)合在一起成为趋势(T)。时间序列法分为两类:不细分4种变动因素而直接利用时间序列数据建立数学模型,进行预测。对4种变动因素有侧重地进行预处理,从而派生出剔除季节变动法、移动(滑动)平均法、指数平滑法、自回归法、自回归滑动平均法、时间函数拟合法等具体预测方法。3.2 时间序列分析的目的时间序列分析的目的是不同的,它依赖应用的背景。统计学家通常把一个时间序列看作是一个随机过程的实现。分析的基本任务是揭示支配观测到的时间序列的概率律。利用这个概率律,我们能够理解所考虑的动态系统,预报将来事件,通过干预来控制将来事件。这就是时间序列分析的三个主要目的。尽管观测的数量总是有限的,但能够生成相同的观测数据的随机过程有无穷多个。然而,这些过程中的一部分比其他过程似乎更合理且有更好的理解。如果对所考虑的过程没有进一步限制的话,就不可能通过有限多个观测来识别该过程。一个流行的方法是限制概率律为一个指定的族,然后在这个概率律族中选择一个最合理的成员。前者称为建模,而后者称为估计,或者更一般地称为统计推断。除了一些有限维待定参数外,概率族中概率律的形式已被指定时,这个模型就称为参数模型。当待定参数落在一个无穷维空间的子集内,或概率律的形式不是完全确定时,这样的模型常被称为非参数模型。参数模型和非参数模型之间的界限总是模糊的。然而,这样的区别有助于我们选择适当的估计方法。这也就类似于“好”和“坏”、“冷”和“热”、“健康”和“不健康”等之间的界限是模糊的那样,但是,这种区别去有助于我们将所考虑情形的性质予以特征化3.3典型时间序列分析模型时间序列预测技术分为固定模型和开放模型技术。长期以来人们花费了相当的精力来研究固定模型,发现固定模型在调整时间序列水平变化等方面比开放模型技术更有效,故本论文选择使用固定模型。经典的固定模型主要有,平均值、滑动平均模型MA、指数平滑模型以下是对它们的概述221) 平均值预测模型所有固定模型时间序列技术本质上都是平均值,最简单的就是将平均值作为预测的模型其公式如下表示: (3-1)其中,是t+1时刻的预测值,表示第t时刻的实际值,N指的是时间。也就是下一时刻的预测值要用以前各时刻的平均值来表示,其优势是可以消除任何波动,从而也消去了噪音,这部分是时间序列所不能预测的。2) 滑动平均模型另一种描述观察时间序列的重要模型就是滑动平均模型也叫做移动平均模型,它与平均预测的不同在于它采用的不是过去所有的数据而是近期的数据,其公式如下: (3-2)其中,是t+1时刻的预测值,表示第t期的实际销量,N是移动平均包含的时刻数目。滑动平均面临的一个问题就是滑动平均时间N的选择问题,N越大滑动平均方法就越接近于平均值法,当N等于历史观测数据个数时滑动平均就演变为了先前的平均值法;当N越小时,滑动平均预测的变化就更加强烈;当数据带有趋势时,时间越长,预测反应就越迟钝,预测值滞后于实际趋势就越明显,相反地当时间N越小时预测反应就较快。由于滑动平均除了有消除噪音的能力外,还可以消除任何具有滑动平均长周期的变化,所以对于带有明显的季节性的预测数据,当选择季节周期作为平均步长时,可消除它的季节性。但滑动平均法运用时也存在着如下问题:加大滑动平均法的期数(即加大n值)会使平滑波动效果更好,但会使预测值对数据实际变动更不敏感;滑动平均值并不能总是很好地反映出趋势。由于是平均值,预测值总是停留在过去的水平上而无法预计会导致将来更高或更低的波动;移动平均法要由大量的过去数据的记录。3) 指数平均模型指数平滑法最初被称为指数权重移动平均法,是布朗(Robert G.Brown)所提出,布朗(Robert G.Brown)认列的态势具有稳定性和规则性,所以时间序列可被合理地顺势推延;他认为最近的过去趋势,在某种程度上会持续到最近的未来,所以将较大的权数放在最近的资料上。指数平滑法通过计算指数平滑值,配合一定的时间序列预测模型对现象的未来进行预测。其原理是任一期的指数平滑值都是本期实际观测值与前一期指数平值的加权平均。指数平滑的基本公式是: (3-3)其中,是第t期的预测值,表示第t期的实际观测值, 表示权重指数在0-1之间取值。在该公式中,值越大,则表示对本期的销售赋以更大的权重,也就是下期的预测值受本期的实际销量的影响要比本期的预测值大。当=1时,全部的权重都放在了本期的实际销售量上这时指数平滑就变成了天真技术,当接近于0时,表示对每一期都赋予了相等的权重,也就变成了前面的平均值法。指数平滑最重要的就是的取值,一般来说,水平变化愈大,的值就应该越大,这样能使预测做出迅速调整;数据的随机性越大,则的取值就应该相应地取较小的值,使得指数平滑能更多消除噪音指数平滑法的优点为:计算过程比较简单,预测时只需少量的观测值,而且能够对实际变化做出较迅速的反应。3.4 ARMA模型3.4.1 平稳时间序列的定义定义1 满足如下条件的序列成为严平稳序列23 正整数m, 正整数,有 (3-4)定义2 如果满足如下三个条件:(1) 任取,有;(2) 任取,有,为常数;(3) 任取,有;则 称 为宽平稳时间序列56,成为自协方差函数(Auto-covariance Function) (3-5)称为自相关函数(Autocorrelation Function),简称ACF。3.4.2 平稳时间序列的模型目前最常用的拟合平稳序列的模型是:ARMA模型,其全称为自回归滑动平均(auto regression moving average)模型,它又可以细分为AR模型(auto regression model)、MA模型(moving average model)和ARMA模型(auto regression moving average)三大类。 1. AR模型定义 具有如下结构的模型称为p阶自回归模型55,简记为AR(p),如下