数学建模论文基于多元统计模型的地震数据分析和处理.doc
《数学建模论文基于多元统计模型的地震数据分析和处理.doc》由会员分享,可在线阅读,更多相关《数学建模论文基于多元统计模型的地震数据分析和处理.doc(39页珍藏版)》请在三一办公上搜索。
1、题 目 基于多元统计模型的地震数据分析与处理摘 要:本文研究了地震数据的处理与分析问题。地震的发生是一个极其复杂的过程,存在大量不确定因素与不确定信息,给地震的预测带来诸多的困难。本文用主成分分析方法构建综合指标用于描述地震发生前的数据规律,并用贝叶斯判别分析方法对地震的样本数据进行学习、验证及预测,取得了较好的效果。针对任务一,我们从原始数据中计算出各项指标的日均值,绘制出各指标分年度的时间序列图,同时利用一阶差分法分析了这些指标对地震的影响情况(见正文表1),得到了较好的结果。针对任务二,我们选取了附件数据中的十个指标进行主成分分析,为了消除各指标量纲的不统一,我们使用了相关系数矩阵。根据
2、主成分分析,最终确定了5个主成分作为反应地震异常的综合指标,发现电磁波、气温、气压等因素的异常与地震的发生有密切的关系。针对任务三,我们使用了多元统计模型中的贝叶斯判别分析法,假定样本数据只来源于两个总体,即地震前兆的数据总体和正常的数据总体。考虑到地震前兆的样本数据均表现出显著的起伏波动特征,因此我们选取了标准差作为判别变量。在地震前兆的数据总体中抽取5组,在正常的数据总体中抽取6组作为学习和检验样本进行贝叶斯判别分析,判对比率为81.8%,并对2010年上半年的地震数据进行分析,发现里面包含地震前兆特征,后验概率接近于1。任务四中,我们阐述了对地震数据的分析处理步骤,并且指出了地震数据分析
3、平台建立的作用与意义。平台中包含的数据处理程序已在附件中给出。针对任务五,我们提出了一些可行性的设想,如观测站应在分布于不同地域的许多台站同时进行以提供更多的数据,加强震例总结和地震前兆时空分布特征的研究等。关键词:地震数据处理;主成分分析;贝叶斯判别分析参赛密码 (由组委会填写) 参赛队号 043 一、问题重述1.1 背景分析地震是地壳快速释放能量过程中造成的振动。虽然预测地震是世界性难题,但迄今科学界普遍认为,有可能反映地震前兆特征的指标可能不少于10个。已经有专业仪器在多个定点实时按秒记录这些指标的数据,期望通过对记录数据的分析研究找到地震的前兆特征。现已采集到某地2005年1月1日至2
4、010年6月30日按小时观测的10多个指标的数据,和该地区该时期内已发生地震的时刻、经纬度、震级及震源深度的数据。这些数据中隐藏着地震发生的前兆特征。科学地截取这些数据的有用片段,对数据进行合理地预处理,用数学方法揭示地震前兆的数据特征,是一项很有意义的研究工作。题给数据中的这10多个指标,究竟哪些与地震的发生有关,有何种关系,是单一关系还是复合关系;除这10多个指标外还有哪些因素及含题给指标在内的哪些指标的哪种数学模型更能反映地震的前兆特征等等,人们迄今仍不很清楚,需要进行深入地研究。地震数据的观测是持续进行的,随着时间的推移数据的规模会不断扩大。从中挖掘地震的前兆特征,必须有合理的数学模型
5、,也必须有科学高效的算法分析平台。因此,需要我们结合附件中给出的实际记录数据,尝试完成以下任务。1.2 任务的提出任务一:分析数据特征,建立数学模型以度量各指标对地震发生的敏感程度。任务二:构造由某些或全部指标构成的综合指标,使其尽可能地集中反映地震发生前的数据特征的统计规律。任务三:结合题给数据,广泛查阅与地震相关的其它指标的数据和分析方法,建立数学模型来研究地震发生前的数量特征。任务四:将前述各项任务的计算程序集结成地震数据分析平台,使其能够完成形如题给数据的其它地震数据的分析,并能自动输出前述任务的重要的分析结果。任务五:对于进一步的研究设想写一篇切实可行的报告。二、模型假设(1) 地震
6、监测点的监测设施能正常运转;(2) 地震监测设施周围不存在影响其工作效能的干扰源,如飞机场、发电厂等;(3) 由于题目中所监控到的地震均不属于强震,因此不考虑有余震的情况;(4) 对于监测记录中出现的个别数值极大预测量均当作极端异常值予以剔除。三、符号说明:原观测值时间序列,;:为第个指标第个样本的原始数据;:特征值,;:第个指标的贡献率;:表示第个主成分,;:样本综合评价值。四、问题分析根据问题重述,可以知道这是研究地震数据的处理与分析的问题。该问题的关键在于确定哪些指标与地震发生有着密切的关系,哪种数学模型更能反映地震的前兆特征。对此问题,从五个方面出发,分别建立数学模型来度量各指标对地震
7、发生的敏感程度、综合某些或全部指标使其尽可能地集中反映地震发生前的数据特征的统计规律、建立数学模型来研究地震发生前的数量特征、将计算程序集结成地震数据分析平台、对于进一步研究设想写一篇切实可行的报告。对于任务一,要分析附件中所给的数据,建立数学模型以度量各指标对地震发生的敏感程度。附件中已给的10多个指标是按小时给出的,为了更直观的显示各指标与地震的关系,首先剔除极端异常数据,对这些数据进行日平均处理。再对各个指标在地震前三个月的数据进行差分分析,比较分析后得到各指标对地震发生的敏感程度。对于任务二,运用主成分分析法找出由10多个指标的线性组合而成的综合指标。这些主成分可以尽可能地反映原来指标
8、的信息 ,同时彼此间相互独立,以达到集中反映地震发生前数据特征的主要统计规律。在所给的检测数据指标中,有些指标在地震发生前出现较明显的异常,而另一些指标并不出现异常,这些都会给考虑指标与地震关系带来困难。主成分分析法正是解决这一问题的理想工具。任务三中要结合题给数据,建立数学模型来研究地震发生前的数量特征。主要运用贝叶斯判别分析法进行建模,对已给数据进行先验信息、后验信息分析。任务四要将计算程序集结成地震数据分析平台,能够完成其它地震数据的分析,并能自动输出前任务的重要分析结果。任务五是针对进一步的研究设想写一篇切实可行的报告。五、模型的建立与求解5.1 任务一的分析与解答地震是地壳快速释放能
9、量过程中造成的振动,期间会产生地震波的一种自然现象。地震发生时,最基本的现象是地面的连续振动,主要是明显的晃动。由附件中所给的该地区该时期内已发生地震的信息,该地区地震发生频率比较高,在2007年和2008年都发生过两次,地震发生间隔最少为40天。针对题中所给的不同指标数据特征,分析其对地震发生的敏感度。考虑到数据量大,而且由于数据采集过程中,可能仪器出现故障等不可抗因素造成数据错误,所以我们首先必须剔除数据中的极端异常数据,例如:在2008年的数据中,6月2日11:00的雨量为335544.3;3月20日0:00-3:00的水温达到上万甚至几百亿等,像这些数据我们首先就把它们从数据中剔除。只
10、有在数据尽可能真实的情况下再来进行数据分析,才能得出数据的本质特征。5.1.1 指标异常分析在对附件中的数据进行处理修正后,先对各组数据进行分类汇总,计算出各组数据的日平均值,月平均值等,再利用软件画出各指标从2005年至2009年的日均值图,从日均值图来看,在每次地震来之前,电压、电磁波幅度EW、电磁波幅度NS、地温、水位、气温、气压、水温、气氡等指标的年变形态基本完好,但也有的指标由于受季节性的影响,如气温、气压等,不能很好地反映该指标数据的应震能力。为此,我们引入一阶差分方法1来刻画每个指标对地震发生的影响敏感度。一阶差分法是一种压制长周期,突出较短周期的高通线性滤波器。设原观测值时间序
11、列为,则一阶差分时间序列为:短临异常往往表现为测值突跳或离散度增大,而差分序列可以突出这类异常,对信息有一定的放大作用。根据已有专家学者的研究结果,结合前面我们对全年的日均值图的分析,我们发现在题中所给数据中,地震发生前各指标有明显波动异常的数据一般都在地震前的3个月左右,为了分析的方便以及对比,我们截取了每次地震之前90天的数据来进行一阶差分分析,利用统计软件画出了如下差分时间序列图:图5-1-1 2005年11月2日地震前电压一阶差分时间序列图图5-1-2 2006年7月26日地震前电压一阶差分时间序列图图5-1-3 2007年3月22日地震前电压一阶差分时间序列图图5-1-4 2007年
12、5月15日地震前电压一阶差分时间序列图图5-1-5 2009年11月5日地震前电压一阶差分时间序列图从图5-1-1到图5-1-5可以看出,2005年电压的变化起伏比较大,快到11月份的时候电压值也突然增加,表现出了一定的地震预兆特征;2006年电压变化处于平和状态,只有6月初出现了比较大的下降趋势,但很快有走向了平缓,对于这种情况,也有可能是发生地震的征兆;2007年电压变化比较小,未见显著的相关性;2008年和2009年在地震前电压都出现了比较大的变化,而且持续时间一个月左右,表现出了临震异常比较明显的征兆。图5-1-6 2005年11月2日地震前电磁波EW一阶差分时间序列图图5-1-7 2
13、006年7月26日地震前电磁波EW一阶差分时间序列图图5-1-8 2007年3月22日地震前电磁波EW一阶差分时间序列图图5-1-9 2008年5月15日地震前电磁波EW一阶差分时间序列图图5-1-10 2009年11月5日地震前电磁波EW一阶差分时间序列图图5-1-11 2005年11月2日地震前电磁波NS一阶差分时间序列图图5-1-12 2006年7月26日地震前电磁波NS一阶差分时间序列图图5-1-13 2007年3月22日地震前电磁波NS一阶差分时间序列图图5-1-14 2008年5月15日地震前电磁波NS一阶差分时间序列图图5-1-15 2009年11月5日地震前电磁波NS一阶差分时
14、间序列图地震时产生电磁波辐射现象目前已是不争的事实,其产生的主要原因是压电、压磁效应在岩石所受载荷超过其破裂强度产生破裂时,岩石晶格被破坏,产生电位跳跃辐射出电磁波信号。因此,电磁波辐射现象与地震活动有着较为密切的关系,电磁波观测资料是一种捕捉临震信号较有效的手段。图5-1-6至图5-1-15反应了地震前南北方向电磁波幅度和东西方向电磁波幅度的变化状况,总体来说,每次地震前,电磁波都表现出了较大的异常。因此,电磁波对地震的发生有比较明显的预测效应。图5-1-16 2005年11月2日地震前地温一阶差分时间序列图图5-1-17 2006年7月26日地震前地温一阶差分时间序列图图5-1-18 20
15、07年3月22日地震前地温一阶差分时间序列图图5-1-19 2008年5月15日地震前地温一阶差分时间序列图图5-1-20 2009年11月5日地震前地温一阶差分时间序列图大量研究表明,地温增加是比较可靠的地震前兆。从我们分析的数据也可以看出,2005年至2009年中,每次地震发生之前,地温都会表现出比较大的异常,特别是2005年11月2日的那次地震发生前,地温表现出了明显的上升趋势。图5-1-21 2005年11月2日地震前水位一阶差分时间序列图图5-1-22 2006年7月26日地震前水位一阶差分时间序列图图5-1-23 2007年3月22日地震前水位一阶差分时间序列图图5-1-24 20
16、08年5月15日地震前水位一阶差分时间序列图图5-1-25 2009年11月5日地震前水位一阶差分时间序列图地震会给地下水带来严重的影响,会引起地下水位的升降。反之,如果正常的地下水位突然出现水位升降的异常,可能是受到外力的作用而变化的,这时就 有可能发生地震,应做好准备,及时跟踪捕捉更可靠的信息。从2005年到2009年的数据我们也发现地震发生前该地区的水位出现异常,在做了一阶差分后,异常表现的更突出,因此,水位的变化也是一个地震前兆的一个重要因素。图5-1-26 2005年11月2日地震前气温一阶差分时间序列图图5-1-27 2006年7月26日地震前气温一阶差分时间序列图图5-1-28
17、2007年3月22日地震前气温一阶差分时间序列图图5-1-29 2008年5月15日地震前气温一阶差分时间序列图图5-1-30 2009年11月5日地震前气温一阶差分时间序列图气温这一指标是最容易受季节性影响的,从气温的日均值图中可以看出,气温变化呈现出周期性的变化,很难发现地震前气温的异常变化。在对温度数据进行一阶差分处理后,从图5-1-26到图5-1-30中我们可以看到图像的变化也是一直趋于平缓,未见很大的跳跃,据此,我们认为由于气温受外界影响的因素太多,比如天气、季节,等因素,因此我们不能武断地说气温不是地震前兆的一个指标,还有待进一步的研究。图5-1-31 2005年11月2日地震前气
18、压一阶差分时间序列图图5-1-32 2006年7月26日地震前气压一阶差分时间序列图图5-1-33 2007年3月22日地震前气压一阶差分时间序列图图5-1-34 2008年5月15日地震前气压一阶差分时间序列图图5-1-35 2009年11月5日地震前气压一阶差分时间序列图 气压的变化跟气温的变化类似,也是受外界太多的因素的影响,就题中的数据说明气压对地震的发生有一定的异常反应。图5-1-36 2005年11月2日地震前水温一阶差分时间序列图图5-1-37 2006年7月26日地震前水温一阶差分时间序列图图5-1-38 2007年3月22日地震前水温一阶差分时间序列图图5-1-39 2008
19、年5月15日地震前水温一阶差分时间序列图图5-1-40 2009年11月5日地震前水温一阶差分时间序列图水温前兆异常中,临震异常最为显著,一般认为获取水温临震异常时预测地震发生的有效手段。对该地区的每次地震前的数据进行分析,发现水温可以很好的反映地震的前兆。特别是在一阶差分方法处理后的数据中,2005年到2009年发生地震前,水温的一阶差分曲线都出现了比较大的波动。所以如果某观测点测得的水温数据突然异常,应该对其进行跟踪,并作出相应的处理。图5-1-41 2005年11月2日地震前气氡一阶差分时间序列图图5-1-42 2006年7月26日地震前气氡一阶差分时间序列图图5-1-43 2007年3
20、月22日地震前气氡一阶差分时间序列图图5-1-44 2008年5月15日地震前气氡一阶差分时间序列图图5-1-45 2009年11月5日地震前气氡一阶差分时间序列图氡是一种放射性气体,是镭衰变的中间产物。氡在岩石的孔隙和裂隙中以自由氡、吸附氡和封闭氡的形式存在,在地下水中以溶解氡的形式存在。自由逸出水面的氡称为气氡。通过附件中数据,选取的是2005年以来该地区发生的几次地震,从图5-1-46知,2006年1月至6月初呈锯齿状,6月15日以后呈急剧上升状态直到到7月初气氡量超过20,2006年7月26日发生地震。图5-1-46 2006年日均值2007年3月22日发生地震,震前气氡呈锯齿状在10
21、附近上下摆动,无明显异常状态。震后气氡持上升状态,3月28日起气氡量持续3天超过20,4月5日发生地震。图5-1-47 2007年日均值2008年2月至4月初气氡值持续在5以下,之后不断升高超过40,在5月15日发生地震。受地震影响气氡值在30左右跳动,6月21日跳到20以下后突然升高,6月27日高过40,7月5日再次发生地震。图5-1-48 2008年日均值 2009年6月中旬至7月中旬水氡异常,之后趋于平稳状态,11月5日发生地震。图5-1-49 2009年日均值研究表明,氡反应灵敏,气氡在地震分析预报中起着十分重要的作用。5.1.2 各指标对地震的敏感程度通过分析上面2005年至2009
22、年的数据,由于题中给的数据中雨量、倾斜仪等数据缺失太多,所以我们在此问中不予考虑,留在后面再做分析,通过分析其他指标数据,我得出如下表格来评价各指标对地震发生的敏感程度。表1 地震时间及各指标在震前是否记录到异常地震时间电压电磁波幅度EW电磁波幅度NS地温水位气温气压水温气氡2005-11-02是是是是是否是是是2006-07-26是是是是是否是是是2007-03-22是是是是是是是是是2007-04-05是是是是否是是否是2008-05-15是是是是是是是是是2008-07-05否是是否是是否是是2009-11-05是是是是是是是是是5.2 任务二的解答近年来,对短临地震预报的研究渐趋增多。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 论文 基于 多元 统计 模型 地震 数据 分析 处理
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-3944309.html