时间序列分析结课论文.docx
时间序列分析结课论文全国社会消费品零售总额的时间序列分析全国社会消费品零售总额的时间序列分析摘要考试资料.时间序列分析是经济领域研究的重要工具之一,它描述历史数据随时间变化的 规律,并用于预测经济变量值。市场经济中,政府对市场变化的即时反应是各国 经济工作的重点。在我国,随着市场经济的日益成熟,各级政府逐渐认识到短期 计划的重要性。在要求减少对市场干预的同时,政府在经济中的作用主要体现在 保证经济运行的正常轨道,由于社会消费品零售总额反映了经济运行中的-个重 要环节消费,尤其是目前我国市场上的消费需求不足现象,使我国经济发 展受到外需与内需两方的困扰。因此对于社会消费品零售总额预测中的研究一直 具有积极意义。本文就以以我国1952年至2011年我国社会消费品零售总额为研究对象,做时 间序列分析。首先,对全国60多年来社会消费品零售总额的发展变化规律,运 用SAS软件进行分析其发展趋势。再则,通过检验说明模型拟合效果的好坏, 再利用模型对下一年进行预测。最后,从国家经济、政策和社会消费品零售市场 发展等方面对社会消费品零售总额变化规律及未来走势进行分析。关键字:社会消费品零售总额SAS软件时间序列分析预测一. 引言社会消费品零售总额是指各种经济类型的批发零售业、贸易业、餐饮业、制造 业和其他行业对城乡居民和社会集团的消费品零售额和农民对非农民居民零售 额的总和。这个指标能够反映通过各种商品流通渠道向居民和社会集团供应生活 消费品来满足他们生活需求的情况,是研究人民生活、社会消费品购买力、货币 流通等问题的重要指标。随着消费环境的逐步改善,人们的消费能力不断增强, 人们消费能力的增强直接带动了社会消费品零售总额的发展,“十一五”期间, 面对复杂多变的国内外形势,特别是为应对国际金融危机的冲击,国家出台了一 系列扩大内需、促进消费等政策措施,消费品市场的稳定发展对我国缓冲金融危 机起到了明显的积极作用,消费需求已经成为经济增长的重要组成部分。中国社会消费品零售业的发展将进入参与国际化竞争的新阶段,可靠准确的数 据体系有利于政府的宏观决策,而零售总额的数据受多种因素的影响。因此对我 国社会消费品零售总额进行预测是有积极意义的。本文利用时间序列分析方法对我国社会消费品零售总额进行分析和预测。时间 序列分析是根据动态数据揭示系统动态结构的规律的统计方法。其基本思想是根 据系统的有限长度的运行记录(观察数据),建立能够比较准确地反映时间序列 中所包含的动态依存关系的数学模型,并借以对系统的未来行为进行预报二. 问题重述1.1问题背景社会消费品零售总额指企业(单位、个体户)通过交易直接售给个人、社会 集团非生产、非经营用的实物商品金额,以及提供餐饮服务所取得的收入金额。 个人包括城乡居民和入境人员,社会集团包括机关、社会团体、部队、学校、企 事业单位、居委会或村委会等。社会消费品零售总额由社会商品供给和有支付能力的商品需求的规模所决 定,是研究居民生活水平、社会零售商品购买力、社会生产、货币流通和物价的 发展变化趋势的重要资料。反映一定时期内人民物质文化生活水平的提高情况, 反映社会商品购买力的实现程度,以及零售市场的规模状况。1.2问题的提出时间序列是指同一种现象在不同时间上的相继连续的观察值排列而成的- 组数字序列。时间序列预测方法的基本思想是:预测一个现象的未来变化时,用 该现象的过去行为来预测未来。即通过时间序列的历史数据就可以揭示现象随时 间变化的规律,将这种规律延伸到未来的一段时间,从而对该现象的未来做出预 测。对此希望建立相关的社会消费品零售总额的数学模型并来预测居民消费价格 指数未来年间的走势。社会消费品零售总额是一个具有滞后性的数据,根据社会消费品零售总额的 这一个特点,我们可以运用时间序列分析的方法对我国社会消费品零售总额进行 合理拟台,但不排除有误差的存在,从而对未来的社会消费品零售总额走势做出 合理的预测。三、时间序列模型3.1模型介绍对于短的或简单的时间序列,可用趋势模型和季节模型加上误差来进行拟台。 对于平稳时间序列,可用通用ARIMA模型及其特殊情况的自回归模型、滑动平 均模型或组合-ARIMA模型等来进行拟台。所谓的ARIMA模型是指将非平稳时间 序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及最忌误差项的现值 和滞后值进行回归所建立模型。ARIMA模型根据原来的时间序列是否平稳和回归 中包含部分的不同,分为了几个类别:MA(移动平均过程)、AR(自回归过程)、 ARMA(自回归移动平均过程)、ARIMA过程。当观测值多于50个时候一般都采用 ARIMA模型来进行拟台。本文社会消费品零售总额收集到的数据为6 0个,因此 采用ARIMA模型进行拟合和趋势的预测。求和自回归移动平均(AutoRegressive Integrated Moving Average,ARIMA)模型 是以序列不同时期内的相关度量为基础,进行的一种精确度较高的短期预测分析 方法。该法由美国学者Box和英国统计学者Jenkins于1976年提出来的,故又被 称之为Box-Jenkins模型。在ARIMA模型中,变量的未来取值可以表达为过去若干个取值和随机误差的'的= &(B)4 E(覆)= ST;,的源)=0搭 wL0, X/sVt.线性函数式中:二(1 时(B) = 1 办E . ®C8)二 1一由月一一其中B是后移算子,Et为各期的随机扰动或随机误差,dK差分阶数,p和q 5分别表示自回归阶数和移动平均阶数,Xt为各期的观察值(t=1,2, k)。3.2模型的建立步骤对于非平稳时间序列则要先将观测到的时间序列进行差分运算,并化为平稳 时间序列后,再用适当的模型去拟合这个差分序列。通常情况下,求和自回归移 动平均模型的建模过程分为以下几个步骤:(1) 对原序列进行平稳性检验,若原序列为非平稳序列则通过差分消除趋势;(2) 判断序列是否具有季节性,若具有季节性的波动,则通过季节差分来消除 季节性;(3) 进行模型识别(4) 进行模型定阶;(5) 对模型的参数进行估计;(6) 对模型的适合性进行检验,即对残差序列进行白噪声检验,判断是否是白 噪声序列;(7) 给出模型的预测结果,并画出趋势预测图。ARIMA模型建模步骤获得观察值序列差分运算拟合ARMA模型分析结束3.3ARIMA (p,d,q )模型在ARIMA模型的识别过程中,我们主要用到两个工具:自相关函数(ACF),偏 自相关函数(PACF)以及它们各自的相关图。对于一个序列Xt 来说,它的新阶自 相关系数定义为它的i阶自协方差除以它的方差,它是关于i的函数,因此我们 也称之为自相关函数,通常记ACF(i)。偏自相关函数PACF(i)度量了消除中间滞后 项影响后两滞后变量之间的相关关系。自相关系数和偏自相关系数这两个统计量来识别ARIMA(p,d,q)模型的系数特点 和模型的阶数。并用游程检验经过处理的序列是否为平稳化的序列。苴1 AKMA模型特不模型自相关系数偏自州关系数"顼)拖尾召阶截尾心3)g阶截尾拖尾拖尾摘尾可以利用平稳性检验、自相关函数ACF和偏自相关函数PACF(i),可识别ARIMA (P,d,q )模型。具体步骤如下:第一步,利用平稳性检验Ed的值。可运用前面学过的平稳性检验方法,检 验序列是否平稳。如果不是,通过几次差分才能得到平稳序列。若经过1次差分 就可实现平稳,则d就等于1,若经过2次差分就可实现平稳,则d就等于2, 如此类推。第二步,利用ACF和?入6来确定p和q的值。一般规则是:(1) 如果序W的ACF是截尾的,即过了某一滞后项值(设为q)后,ACF变得 不显著,接近于零,并且PACF是拖尾的,则可把序列设为MA(q)过程;(2) 如果序列的PACF是截尾的,即过了某一滞后项值(设为P)后,PACF 变得不显著,接近于零,并且ACF是拖尾的,则可把序列设为AR(p)过程;(3) 如果序列的ACF和PACF都是拖尾的,则可把该序列设为ARMA ( p,q ) 过程,而关于P和q的值需要不断地从低阶试探,并使信息准则达到最小。四、时间序列模型建立与拟台4.1.教据的录入根据中国国家统计局网站发布的社会消费品零售总额时间序列数据,经整理得 到了历年社会消费品零售总额(1952-2011 )($位 :亿元)。我国社会消费品零售总额":十-心*.319661 5 ;'-心零售总额3上6701 3732.3匕 j737. 3_ J7C_UF_1 j;21 _u7?冬售总翌商W. 21C23.HCu. 71工二?_271. 119761977二作1浮_SCO1981厂二-1432. 8寸"1 Pi'h'i3顼亏侈总萱"有1门IFgg25702849. 4洛土 -;sni-49505820M苣总萱心);(:isni二n,:: j'S'h . dr/. ):. 1! . :i1 )993,7IE;;一 .零M怠萱f-1睥。19961 W'_LuJL. :JJJlI. UJLLUl. JEML"顼,*零售总额2000LUJ_2DC2JUUL北史z-l lOE. 7虻0 一 =48135. 952, 516. 305u. 5C1. Cl?:? 2. GME2 CO;2Cuu2C132ul_套售忌翌711. 2E114830. 1132678. 4iFSl-Uj. 4l?我将这些数据编写了 SAS的程序(附录1),进行了下列的检验和预测。4.2擞兼分析4.2.1根据原始教据画出时序图HIM图2.1.1时间序列图有上图可知在1952-2011年我国社会消费品零售总额波动趋势总体上是持续 上升的,我们可以看出该时间序列图显示这是一个典型的非平稳序列,因为具有 明显的趋势性。4.2.2 一阶差分处理对于该非平平社会消费品零售总额的时间序列,首先可以利用SAS软件对数据 进行一阶季节性差分的处理,以便消除其具有的强烈的趋势性,来观察数据是否 大致趋于平稳。因此得到的一阶差分时间序列图如下:2.2. 1 1盼差廿时序困从图2.2.1中可以看出社会消费品零售总额时间序列的趋势性得到了一定的消 除,序列围绕均值为零的一个水区间内震荡,且方差明显有界。但是很明显在 1995-2000年这段时间波动比较大,影响这个波动较大的因素是由于在1997年 的亚洲金融危机的冲击下,国内的消费需求不振,从而导致我国的经济陷入衰退, 出现了通货紧缩的情况,社会消费品零售总额开始出现回落。2007年是由于美 国次贷危机的影响,有小幅度的波动,2008年的社会消费品零售总额略有下降, 但是国家政府为了促进经济的增长,采取了一系列的宏观调控政策。加宽松的货 币政策和财政政策,使得经济复苏,从而使得社会消费品零售总额稳中有降。此 时季节性性因素对社会消费品零售总额的影响表现出来。2.3平稳性检验为了进一步判断其平稳性,考察差分序列的自相关图,加图2.3.1所示,自相 关图显示延迟3阶之后,自相关系数都落入2倍标准差范围以内,而且自相关系 数向零衰减的速度非常快,延迟在16阶以后自相关系数即在零值附近波动,从 而判断该序列有很强的短期相关性,所以可以初步认为一阶差分后序列平稳。自 相关函数与偏自相关函数图如下:AutocorrelM ionEStd Errorc978BS270LOOUOft琳*米*出相林州麻率*神UH*#*:19U799490.0459322577S3I10.66953市市出*出来时tM申出虾市$皈如芾。电市;引树树市4144626420.367065A7156480,2600?*出*出娜.e6391493L17咿*ifi?2726A0.18UB卅*崔Be61549200.W471g58279080.16IG3104S934SE0.133G4114S2S0050.12523出年出.1;43881,30.13350*册.im56231J80. ID 16 5*帆B1461045950.16552卅*卅B156C410950JG17D*出.1$420(2880.11471卅*.1721477700JE749<Hi.1。28009.6G50.0007&<i1?-1G0IBI4-*0423020-esa»?4*0618221-2831749-*0766&i杵22-2778&775440,g *IBCovarianceCorrelMion -I 9 8 7 C 5 d 3 ? 1 0 12 3 4 5 6 7 8 9 1narks standard errors00.1801押0.2咔朝60,的前33 Q.260393 0.270451 0-274655 0.276453 0.2781 El 0.27S7S9 0.281319 U.202MS D.2S3334 0.284458 0.285807 i:i. 20/41/ 。.挖部璃 Q.28973S 0,239929 0.299929 。翊瑚 0.230267 0.230819图2.3. 1母幻自相关图Part iall AutocorrelationsLag Correlation -I 9 8: 7 S 5 J 3 2 I 0 11 2 3 4 5 6 7 8 9 1120.8101-0.06&00:*卅事:仔卧;*卅*:*出卅出牌*30.011054-0.21334.神蚪50.04933Hi 'O.OID5770,1"皑*出:想虬e9-0.(14t()e0.00379:*10W, 娜110.09Z8Gi邮:120.0187513D.1M?7*14-0.05328:W15-0.U13CS16-0.11900(1.0376317* B悟-0.022fle130.0 8U820-0.0475121-0.00938图2.3.2 VW偏自相关图4.2.4纯随机性检验对平稳的差分序列进行白噪声检验.编程运行结果为图2.4.1:Autocorrelation Check for liite NoiseTo风ChiSquareDF>>ChiSq -Autocorrelations-6111.106<.00010.6420感00.5膊0J47商0.17112120J7123叮10,167L1E50.1础0,1340.1290.1331C128.1619<J00l0.1510*60.IS20.1150J57挪1图匕4.LVt白噪声检验从图2.4.1可以看出,在显著水平为0.01的条件下,检验统计量的p值显著水于0.01,所以该序列是平稳非白噪声序列,我们可以利用ARIMA(p,d,q)模型进行建模.4.2.5ARIMA(p,d,q )模型拟合用ARIMA(p,d,q)模型对我国社会消费品零售总额进行建模拟台及预测并进行了 平稳化处理,因此直接对差分后平稳序列1进行建模.利用SAS软件进行编程拟 台分析:根据图2.3.1,自相关函数为3阶截尾,再根据图2.3.2确定偏自相关函数为1阶截尾,可以初步选择ARMA ( 3,1 )模型进行拟台。再由BIC准则确定模型的阶数,BIC值如下:Mini mum InformatI on Cri ter ionLagsMA 0MA 1MA 2MA 3MA 4MA 5蜩021.1S73617.9693317.5592117,315617.0511716.89494AR 116.3505312.4224912.2737512.3372312,397212.42006州214.5207112.421212.307&512.3799412.453口12.49654AR 314.3670112J197612.3786412.4542512.527&712.57348AR 413.7883212.3837312.452312.5216712.5957512.64225蜩513.1856412.4640212.627281?.5962512.B086112.50556Error series modeI: ARMinimum Uble Value: BIC(U2) = 12.2J975从图 2.5.1 可知,p=1, q=2 时 BIC(1,2 )=12.27375 最小,因此选择模型 ARMA(1,2)。然后对模型ARMA(1,2)进行参数估计和显著性检验,由SAS程序运行结果如图2.5.2:Condi t i ona I Least Squares Est i mat ii onParaaieterEst i rftateStandardErrort ValueApproxPr > IIIL站NU20491.27776.72.630.01080AR1,1L000000.0?87134.84<.00011图2.5.2参数估计及检验从图2.3.3知,参数估计显著,得到模型为:X/20491.2 十 2*-尤/品4.2.6残差检验模型检验主要是检验模型对原时间序列的拟和效果,就是检验整个模型对信息 的提取是否充分,即检验残差序列是否为白噪声序列。如果拟台模型通不过检验, 即残差序列不是为白噪声序列,那么要重新选择模型进行拟合。加残差序列是白 噪声序列,就认为拟台模型是有效的。对拟合好的模型的残差序列作白噪声检验,观察模型残差的自相关和偏自相关图,可以直观地看到,几乎95%的系数值全部 落在2。之间,说明残差之间没有相关性,即信息提取充分,模型建立良好。对模型进行残差检验,应用SAS程序运行结果加图2.3.4所示,显然,残差序 列为白噪声序列,说明模型提取信息充分,说明ARIMA(1,1,0)对该序列来说是 适应的。Autocutte1ation Check af ResidualsTaChi-?r,方0Las丸 uai eDrL U L: LUr tian DBSj100. 5350. L0010.6990.600Cl 5650.4070.355O. 30212113. 31110. 22300.1300.1660-1920.1790.1770.L76LS125.47170. 07650-179OB1880-1800.1550.12?0.0872d127.0723II. 41 :!-ll 061-56i .i 4m0.0 550.055ii. nd图2.6.1残差检验4.2.7运用模型ARIMA( 1,1,0)进行预测与分析(1)预测由上图可知,残差为白噪声序列,序列信息提取充分,不需要继续建模,通过模型对未来5期进行预测并做出原始序列的预测图,结果如下:beForecastSid Error95嚣 Conf i dencc Li mil鬻K】leaaiB.a?7776.?4;41舶HB*舒41就1W 的网G2163918-145010997.9671 £2362.52&9205473,?642631E3917.317513463.694157517.8013210318.133116391?.C9C115559-452153433.4336214401.89651S8917.462B17383-27&143835.1073217938.8178EE;193917.23511904SJJ85146S8U91 15221252,5507叩183817.007620575241143580.2772224243,73801G891B.780121S95JU?140905.7219227027.9983冏166916.552629880.097130190.4020229642.70327Ciie59ie,a25224E92.0B5195716.769971laasiB.oa?25792_3&71&3384.00&5234468. 1883721S3915-S70228S39_22B13111E.9G97236715.770773163915-642723033.0912835S.S0?2230371.483;3741S3915-41E229C9?-642240945.746 !57&198815.197730113.808124863.££77242947.U78Forecasts forvariable x图2.7.1 2012-2016年社会消费品零售总额预测结果ICdLidJ154133IHF图2.7.1 2012-2016年社会消费品零售总额预测结果(2)分析根据图2.7.1和图2.7.2可以看出在未来的时间居民消费价格指数还会有有所上 涨,但是涨幅不会偏大。2007-2010年期间趋势波动较大,是因为全球金融市场 进入剧烈波动的“多事之秋”。再加上2007年次贷危机使美国房地产衰退雪上加 霜,并将推迟其复苏时间。虽然相对美欧金融业而言,亚洲及中国遭受的直接影 响还相对较小。但是美次贷危机对国际金融市场和世界经济产生“溢出效应”, 可能通过其广泛的投资者、衍生品及影响市场预期和实体经济运行等多个渠道, 对亚洲及中国经济产生间接的影响。不过美国次贷危机和金融机构面临困难也为 亚洲经济体提供一些机遇。就像是我们中国的一句老话:“塞翁失马焉知非福”。 在图中也可以看出2007年美国次贷危机对我国经济也造成了一定的影响,使之 造成了一定通货膨胀。使其后两年的消费品零售总额有所下降。4.2.8模型的局限性。(1)ARIMA模型的短期预测效果要优于长期预测。原因在于本模型均是基于 过去时间序列数据建立的,并没有考虑预测期相应时间内突发情况等因素,随着 预测期的增长,预测效果自然会变得比较差。(2)针对于模型预测误差的产生原因,除了上述模型本身的问题外,笔者认 为还有人为因素的干扰。五. 总结在利用时间序列ARIMA模型进行分析、预测时需要对数列进行预处理,以检验 数列拟合ARIMA模型是否合适。通过对1952年至2011年我国社会消费品零售 总额的建模分析,本文建立了 ARIMA模型,并得到了较好的拟合效果。而对2012 年到2016年的我国社会消费品零售总额进行预测,从预测结果看,在2012年到 2016年间我国社会消费品零售月度总额将会有较大的增速。因此,政府可以参 考预测结果制定相应政策来调控宏观经济,可以从以下两个方面进行分析。了解 与建议:(一)导致我国消费品零售总额增加的原因主要有以下几方面。1. 国家政策措施效果明显。为了应对国际金融危机的不利影响,我国及时出台 了一系列扩内需、促消费的政策措施,成为消费品零售总额保持平稳较快增长的 首要因素。主要表现为直接提高居民特别是低收入群体的收入,增强了城乡居民 消费能力;加强民生工程建设,从一定程度上解除了居民消费的后顾之忧;稳定 大宗商品和热点消费品价格,有力地促进了相关商品销售。这些政策措施的实施, 提高了城乡居民实际消费能力和消费意愿,从而有效地阻止了我国消费品市场趋 冷的走势。2. 生产经营单位积极应对危机。为应对国际金融危机影响,商家普遍开展了长 时间、大范围、多形式的促销活动,一些外贸企业为缓解外需不足,也通过举亦 外贸大集等形式大力开辟国内市场。(二)保持消费品市场持续增长的建议投资与消费对GDP的贡献一般是此消彼长的关系,在研究GDP的相关问题时 常选取社会消费品零售总额代表经济的消费需求成分。根据预测,我国经济目前 处于一种稳定增长的态势,那么在逐渐提高效率和品质的供给能力支持下,驱动 我国经济发展的主要动力来自国内外的稳定需求增长。因此,在制定我国宏观经 济调控政策时的一个基本导向是:利用供给管理政策保证长期经济增长,利用需 求管理政策兼顾短期经济波动。在经济增长已经进入以累积需求为主导的发展阶 段时,能否有效地启动消费需求和保持消费需求水平,是促进增长型经济周期形 成的关键。具体做法有以下几点。1. 大力开拓农村市场,挖掘农村消费潜力。2. 继续发挥投资对消费的拉动作用。加强基础设施建设,加快城市化建设步伐, 增加有效需求,剌激市场发展。3. 健全社会保障机制,提高居民消费水平。消费要有收入作基础,收入是消费 的来源,是影响消费需求最重要的因素,只有全面提高居民人均可支配收入, 保障低收入家庭的收入,才能使人们放心大胆地进行消费。4. 进一步整顿和规范市场秩序。加强市场的监管力度,严把商品质量关,加大 对市场上商品的抽查力度,充分保障消费者的合法权益,增强消费者的信心, 努力扩大消费。六. 参考文献【1】中华人民共和国国家统计局数据库【2】肖枝洪,郭月明时间序列分析与SAS应用(第二版)武汉大学出版 社【3】张瑛,雷毅雄SAS软件实用教程科学出版社【4】王燕应用时间序列分析(第三版)中国人民出版社【5】百度文库 wenku.baidu./view/63f5f6c12124c.html也附录附录一:SAS程序如下datacurriculum_design; input x; difx=dif(x);time=intnx('year','01jan1952'd,_n_-1); format time date.; cards;276.8348381.1392.2461474.2548638696.96607.7604604.5638.2670.3732.8770.5737.3801.5858929.21023.31106.71163.61271.11339.41432.81558.61800.02140.02350.02570.02849.43376.44305.04950.05820.07440.08101.48300.19415.610993.714270.418622.9 23613.8 28360.2 31252.9 33378.1 35647.9 39105.743055.4 48135.9 52,516.3 59,501.0 68352.6 79145.2 93571.6114830.1 132678.4 156998.4 183918.6proc gplot;plotx*time difx*time;symbol c=black v=star i=join; proc arima;identify var=x(1) nlag=22; estimate p=1 noint;forecast lesd=5 id=time;run;proc arima data=curriculum_design;identify var=x nlag=22 minic p=(0:5) q=(0:5); estimate p=1;forecast lead=5 id=time out=results;run;proc gplot data=results;plotx*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay; symbol1 c=black i=none v=star; symbol2 c=red i=join v=none;symbol3 c=green i=join v=none l=32;run;