第四文鼎创杯华中地区大学生数学建模邀请赛.doc
第四届文鼎创杯华中地区大学生数学建模邀请赛承 诺 书我们仔细阅读了第四届文鼎创杯华中地区大学生数学建模邀请赛的选手须知。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们的竞赛编号为:我们的选择题号为:参赛队员(打印并签名):队员1:队员2:队员3:(以下内容参赛队伍不需要填写)评阅编号:武汉工业与应用数学学会第四届文鼎创杯华中地区大学生数学建模邀请赛竞赛组委会题目:摘要一、问题重述2010年三月份以来,我国的物价指数呈现飞速增长的趋势。“涨价”成为全国民众茶余饭后最频繁的交流词汇,普通百姓的生活成本帐单随着这些物品的快速上涨跳跃到了一个新的数字。物价上涨不仅给国家宏观调控政策带来一定程度的影响,而且还极大的影响着老百姓的日常生活消费水平。今年年初,社科院发布的一项调查表明,物价上涨已经成为头号社会热点,人们对物价的关注首次超过了收入差距的关注。尤其是食品类价格的上涨,更是成为影响居民生活消费信心的关键。由于2011年异常的气候情况,导致农产品生产成本大量增加,加之国际粮价对国内供需的影响,食品价格未来可能继续呈现上涨趋势。为了研究食品价格变动对居民生活的影响,在本文中,我们将以消费者物价指数作为切入点,解决城市居民食品分类及零售价格预测等相关问题。消费者物价指数(Consumer Price Index即CPI),也称消费价格指数,是指反映与居民生活有关的产品及劳务价格统计出来的物价变动指数,通常作为观察通货膨胀水平的重要指标,是与人民生活密切相关的参考指标。根据国家统计局公布的2011年一季度经济数据显示,3月份居民消费价格同比上涨5.4%,创出32个月以来新高。而如果消费者物价指数升幅过大,表明通胀过渡,会带来经济不稳定,央行就会有紧缩货币政策和财政政策的风险,从而会造成经济前景不明朗。因此,该指数过高的升幅往往不被欢迎。本文旨在通过分析武汉市2010年3月2011年4月的城市居民食品类零售价格数据,建立相对应的数学模型,获得各类相关食品对消费者物价指数的贡献度,进而解决以下三大问题:1:建立数学模型,将所涉及食品适当分类,并分析每类食品的特点;2:建立数学模型,预测2011年4、5月的城市居民食品零售价格走势;3:写一篇城市居民食品零售价格情况分析和对有关部门建议的文章。二、问题分析2.1问题理解及分析针对上面提出的三个方面的问题,我们分别做出了以下几个方面的分析:问题一分析从附录所给的相关数据,我们可以看出需要讨论的食品品种比较多,根据商品分类基本原则我们将所给食品分为五大类:油类:菜籽油、大豆油、花生油、大豆调和油肉蛋鱼类:鲜猪肉、鲜牛肉、鲜羊肉、活鸡、鸡肉、鸡蛋、带鱼、草鱼、鲫鱼、鲜牛奶蔬菜类:芹菜、大白菜、油菜、黄瓜、萝卜、茄子、西红柿、土豆、胡萝卜、青椒、尖椒、圆白菜、豆角、蒜苔、韭菜、豆腐水果类:芦柑、苹果、香蕉、西瓜调味料类:食用盐、绵白糖、白砂糖、红糖、酱油、醋在每一大类中,再根据不同的原则将其进行进一步细分。针对这个问题,我们从以下两种方面来对所讨论的食品进行分类:1.根据食品在历史上的变化相似程度在每个大类中,虽然各种食品的变化情况有着各自的特点,但是它们之间也存在着联系。比方说,如果在某一时期,猪肉的价格上涨,那人们可能会去选择鸡肉来作为它的替代品。这样也会导致鸡肉的价格的上涨,所以它们的的价格变化在历史上应该是十分相像的。基于这个原理,我们通过找出所给时间段内(2010.3-2011.2)的数据变化的相似性来将它们进行分类。为了找出各个食品的相似性,在这里我们利用FCM聚类算法对每个大类里面的食品进行再分类,使得食品对象之间相似度较大的被划分到同一簇,而相似度较小的被划到不同簇。2.根据各种食品对CPI的贡献 在上述得到的各类簇的基础上,再结合各种食品对CPI的贡献,从而对所给食品进行更加准确的分类。CPI (Consumer Price Index,消费者物价指数)是世界各国普遍编制的一种指数,它可以用于分析市场价格的基本动态,是政府制定物价政策和工资政策的重要依据。既然消费者价格指数,能够很好的反映市场商品的价格变动,根据这一特点,我们可以从各商品对CPI的影响角度出发,在每大类食品中,根据每类商品对CPI的“贡献”的大小来进行分类。在工程试验中,要想研究试验中每个实验变量对实验结果的影响程度,通常会采用单一变量试验的方法来进行量化。但是对于历史上发生过的事情,我们没法真正的进行试验,只能够进行模拟。要想知道食品价格与CPI之间准确的相互关系是十分复杂的。所以在这里我们利用的工具是神经网络。在神经网络中我们把这种未知的影响关系看作是一个“黑箱”。首先,利用已知的数据来对神经网络进行训练,进而不断完善黑箱里的内容,训练数据越多,黑箱就越接近真实状态,所以我们先利用样条插值来对黑箱数据进行丰富。然后,针对得到的黑箱,我们通过单一变量试验,来量化影响程度。最后根据影响程度的大小和不同对食品进行分类,最终得到分类结果。问题二分析为了预测2011年的4、5月份的城市居民食品零售价格走势,我们建立了如下两个预测模型分别进行预测,然后对比两个模型的预测结果,综合修正,最终得出2011年4、5月的城市居民食品零售价格走势。模型一 GM(1,1)模型考虑到数据可能的时效性问题,我们提取最近的数据(2010年9月25以后的)作为历史数据建立时间序列,得出白化方程,并进行精度检验,从而预测出4、5月每类食品的价格。模型二 神经网络为了运用已有的实验数据,对将来各种食品价格的发展趋势进行预测,在这里我们再次利用神经网络,以时间为网络的输入,以每个食品的价格为网络的输出。在得到网络之后,我们更换输入的时间点,得出对应的输出的价格数值,进而达到预测的目的。三、模型准备四、基本假设与符号说明五、模型的建立及求解5.1 问题一的求解根据问题1的分析,我们对五大类食品(第一次初步分类)进行了各大类食品内部的价格特点以及其对贡献两个方面的讨论和研究,分别建立了模糊矩阵划分模型和神经网络聚类模型。为此,我们定义第二次精细分类的两个标准:各食品间的价格变化趋势相似程度各食品价格对CPI变化的贡献率51.1 模型一之FCM模糊矩阵划分模型5.1.?模型二之网络神经聚类模型模型一中讨论并研究了各大类食品内部的发展变化的相关性这一标准,为了进一步分析各类食品对的影响,我们建立了能够很好地处理复杂数据关系,多变量的网络神经模型。5.1.?数据准备三次样条法从附录中提取的数据量相对BP网络模型精度要求比较少,而如果大量挖掘过期历史数据,其实效性较差,为了更好对神经网络进行训练,达到实验要求的精度范围,我们采用三次样条对近期历史数据进行插值,以获得相当量的数据,更合理准确地完成网络训练。采用三次样条插值增加数据的理由如下:i虽然价格的增长并不是一个连续的过程,而只是在某个时间节点发生,但我们可以近似地认为其是连续的(因为这并不影响其在该时间节点发生改变的数量或者幅度),故可以用插值法增加数据。ii.三次样条具有分段的性质,这是线性或非线性拟合所不能具备的,即三次样条能更好地反映数据的局部变化趋势而非过分得考虑整体趋势,符合价格变化的特点。iii三次样条插值使数据尽可能地平滑,可以更好地反映实际情况。通过三次样条插值,我们得到了一系列的近期数据,具体见表格: 5.1.?BP网络的建立总体思路:BP网络中网络是否可用,需要输入,输出数据的不断训练学习,最后建立一个精度在控制范围类的神经网络,为此我们提取上述插值获得的数据,以其中70%的数据为学习训练数据输入,30%的作为误差验证分析用,不断地调节各实验条件(BP神经网络中的迭代次数,学习率以及网络目标),使其不断完善。Bp神经网络的隐含层节点数对BP神经网络预测精度有较大的影响。如果节点数太少,网络不能很好的学习,需要增加训练次数,训练的精度也会受影响;如果节点太多,训练时间增加了,网络容易拟合。最佳隐含层节点数可参考公式:算法流程图精度及误差控制 数据表或者分析图5.1.?单一变量实验单变量实验方法就是单独地改变大类中的一个项目,其他各项目保持不变,通过模拟实验的方法确定该因子对总输出指标的影响程度。在本文中,我们给定每个项目一个相对数的增长或减少,其他项目保持不变,依次输入神经网络系统进行训练学习(我们称之为实验),进而得到在该条件下的CPI贡献绝对量,再以原相应CPI为基值,得到相对贡献也就是CPI贡献率。最后,根据所得各项目的CPI贡献率大小进行第二次精细分类。实验流程图及结果Figure?神经网络模型结构图5.2.1问题二的求解 根据数学知识,我们知道做预测分析的模型基本大致有:时间回归预测分析,傅里叶拟合,灰色模型预测,样条插值外推,以及神经网络预测等。而对于如何选择合适的预算模型是本问题的关键。根据本文数据特点以及预测因子的数量,我们以灰色模型和神经网络模型分别预测,并将二者结果进行比较分析与修正,最后得到精确的预测结果。模型三之灰色预测模型由于所搜集到的数据量并不太大,为了体现数据的实效性,我们以2010年9月25以后的数据作为初始数据对2011年4、5月份的数据进行预测,而灰色模型适合做短期预测,故我们采用模型各类食品价格进行预测,具体步骤如下:构造和预测步骤设已经参考数据列为做一次累加生成数列其中。求均值数列即,于是建立灰微分方程为相应的白化微分方程为(5)其中是发展灰度,是集中控制灰度由于,取为灰导数,为背景值,则将方(5)对应的灰微分方程即矩阵的形式为其中,则由最小二乘法,求使得达到最小值的.于是求解方程(5)得根据以上操作步骤,我们利用matlab编程,可以得到通用的预测程序【见附录】。由于本文篇幅有限,我们仅以在此展开花生油的预测过程,其他食品预测结果见附表。预测实例:表?花生油的单位价格表序号月份单价序号年份单价12010/9/2512.55112011/1/513.422010/10/512.18122011/1/1512.8332010/10/1512.38132011/1/2513.4542010/10/2512.7142011/2/514.0852010/11/513.48152011/2/1513.5362010/11/1513.24162011/2/2513.0372010/11/2513.37172011/3/513.3382010/12/513.37182011/3/1513.2892010/12/1513.12192011/3/2513.2102010/12/2513.28第一步级比检验建立花生油价格数据时间序列如下:(1)求级比(2)级比判断由于所有的,故可以用作满意的GM(1,1)建模。第二步 GM(1,1)建模1)对原始数据作一次累加,即 2)构造数据矩阵及数据向量于是得到3)计算于是得到,4)建立模型,白化方程为取,得时间响应函数5)求生成数列值及模型还原值:令由上面的时间响应函数可算得,其中取由取,得第三步模型检验花生油单价的各种检验指标值的计算结果见表4.3,经验证,该模型的精度较高,不需要作残差修正,可进行预测和预报。序号时间原始数据模型值残差相对误差精度12010/9/2512.550012.55000.00000.00000%22010/10/512.180013.18101.00100.07598%32010/10/1512.380013.18210.80210.06096%42010/10/2512.700013.18330.48330.03674%52010/11/513.480013.1844(0.2956)(0.0224)2%62010/11/1513.240013.1855(0.0545)(0.0041)0%72010/11/2513.370013.1866(0.1834)(0.0139)1%82010/12/513.370013.1877(0.1823)(0.0138)1%92010/12/1513.120013.18880.06880.00521%102010/12/2513.280013.1900(0.0900)(0.0068)1%112011/1/513.400013.1911(0.2089)(0.0158)2%122011/1/1512.830013.19220.36220.02753%132011/1/2513.450013.1933(0.2567)(0.0195)2%142011/2/514.080013.1944(0.8856)(0.0671)7%152011/2/1513.530013.1955(0.3345)(0.0253)3%162011/2/2513.030013.19670.16670.01261%172011/3/513.330013.1978(0.1322)(0.0100)1%182011/3/1513.280013.1989(0.0811)(0.0061)1%192011/3/2513.200013.20000.00000.00000%平均精度2%根据所得灰色预测方程,我们得到4,5月份的预测结果如下序号时间预测值14月5日13.20124月15日13.20234月25日13.20345月5日13.20455月15日13.20665月25日13.20776月5日13.2085.2.1 BP网络预测模型为了通过已有的实验数据,对将来的各食品价格的发展趋势进行预测,在这里同样我们利用神经网络,以时间为网络的输入,以每个食品的价格为网络的输出建立网络。在得到网络之后,我们更换输入的时间点,得出对应的输出的价格数值,进而达到预测的目的。预测模型算法流程图根据以上算法我们利用matlab编得相关程序,同样地以花生油的单位价格为例,预测出其4,5月份的单位价格。(程序结果)