股票趋势分析技术与风险分析方法在电力系统短期负荷预报的应用研究电气工程自动化毕业论文.doc
股票趋势分析技术与风险分析方法在电力系统短期负荷预报的应用研究Electric Power Systems Short-term Load Forecasting Based on Stock Trend Analysis Technology and Risk Analysis Method摘要:电力系统短期负荷预测是能量管理系统(EMS)的重要组成部分,是电力系统安全、经济、可靠运行的前提和基础,其预测精度直接影响到电力系统的经济效益。研究负荷特性、负荷分析理论与预测算法并开发高效实用的负荷预测系统已成为当前十分重要的课题。本文首先介绍了短期电力系统负荷预测的意义和主要方法,然后对电力负荷预测与股票技术相结合的假想做了合理性分析,提出了采用SVM与股票技术指标相结合的方法。而后详细的介绍了SVM理论,并以SVM算法为核心,在输入矢量环节加入股票技术的元素,利用MATLAB编写具有图形界面的负荷预测软件,并且创造性的以股市K线图的方式进行输出表示。最后,在对全文总结的基础上讨论了存在的问题和今后的研究方向。关键词:电力系统负荷预测 股票趋势技术 SVM MATLABAbstract: Power system short-term load forecasting is an important part of energy management system (EMS),and it is also the premise and basis of the security,economic and reliable operation of power system.The forecast accuracy directly affect the economic benefit of power system. Research load characteristics, load analysis theory and prediction algorithm and the development of more effective and practical load forecast system has currently become very important topicThis paper first introduced the short-term the significance of power system load forecasting,then do the rational analysis of the hypothetical combining stock technologies with power load forecasting.The paper also put forward the method that applying technical indexes in SVM. Then detailed introduces the SVM theory, and for the core, with SVM algorithm in the input vector link to join stock technology elements, using MATLAB graphical interface with the load forecasting software, and creative by means of stock market K line for the output.Key words: Load Forecasting for Electric Power System Technical Analysis of Stock Trends SVM MATLAB目录摘要IAbstractII第1章 绪论11.1短期负荷预测的重要意义11.2短期负荷预测的研究现状21.3本文所作的工作3第2章 股票趋势分析技术应用在电力系统负荷预测的合理性分析42.1预测的广泛性和通用性42.2股票趋势分析技术简介52.3电力系统负荷预测与股票趋势预测之间的联系62.4股票技术应用在电力系统负荷预测中的方法7第3章 电力系统负荷预测的理论基础83.1支持向量机(SVM)的理论基础83.2支持向量机实现的基本思想83.3 SVM训练求解算法11第4章 结合股票技术的短期负荷预测的方法研究114.1利用K线图进行负荷分析114.1.1图形概述124.1.2 K 线图在负荷分析与预测中的应用134.1.3应用实例154.2利用股票技术指标进行负荷预测164.2.1采用神经网络进行预测时输入矢量选择的重要性164.2.2改进的输入矢量的选择办法16第5章 基于SVM与股票技术的电力系统负荷预测175.1 SVM回归问题的数学描述175.2输入矢量与样本的选择185.3输入数据的预处理195.4误差分析195.5我国调度部门关于预测效果的评价与考核205.6使用MATLAB实现SVM负荷预测模型20第6章 软件开发及功能模块介绍226.1 MATLAB工程软件及神经网络工具箱介绍226.2负荷预测软件的介绍及应用23第7章 预测结果及分析287.1武汉市负荷预测结果287.2预测效果的评价和考核317.3误差分析及小结32第8章 结论32致谢34附录34附录1 BIAS的意义与算法34附录2 SVM预测的详细代码35参考文献50第1章 绪论1.1短期负荷预测的重要意义电力负荷预测是在充分考虑一些重要的系统运行特性、增容决策、自然条件和社会影响的条件下,研究或利用一套系统地处理过去与未来负荷的数学方法,在满足一定精度要求的意义下,确定未来特定时刻的负荷数据1 牛东晓,曹树华,赵磊,等. 电力负荷预测技术及其应用M. 北京:中国电力出版社,1999,1-21。在计划经济体制时代,用电计划由发电计划决定,发多少用多少,始终存在瓶颈效应和人为干预的情况,对负荷预测准确率要求不高。随着国民经济的发展和电力体制的改革的深化,电力走入市场经济,发电计划越来越取决于市场的要求,同时人们对电能质量的要求越来越高。所以对负荷的大小和特性进行事先估计,是电力系统控制与运行研究的重要内容,是电力系统规划与运行的基础。电力系统负荷预测理论就是因此而发展起来。短期负荷预测的重要意义可以归纳为以下几个方面:(1)短期负荷预测是电力系统优化调度的基础。准确的短期负荷预测是电网调度机构制定发供电计划、合理安排机组启停和做好电网供需平衡的关键。有助于运行人员估计电能的生产、输送、分配和消费各个环节的情况,制定出合理的运行方案,确保电网和机组的安全、稳定、经济运行。以短期负荷预测和在线实时负荷预报为依据,系统才能有计划地安排旋转备用和不同网间可能实现的功率交换,这是决定系统供电安全水平的重要因素。(2)随着我国社会主义市场经济的不断完善,电力企业逐步走向市场,电力系统的经营方式从垄断转变为市场竞争将成为必然趋势。在电力市场条件下,短期负荷预测不再是纯技术性的问题,它应当是一个技术性与经济性相结合的问题。同时也不再仅仅是能量管理系统(EMS)系统的一部分,它是电力市场制定各种计划的重要依据。对于发电单位,短期负荷预测是制定发电计划和报价的依据;对供电部门,短期负荷预测为供电方制定购电计划提供依据;对输电单位,短期负荷预测也是制定发电计划及安全、可靠、经济运行的基础。(3)电价的制定也是在对未来给定计算期内负荷预测的基础上完成的。因此发电企业要保证其电价的竞争能力,就必须获得比较精确的短期负荷预测数据。(4)为用户提供安全、可靠、经济、优质的电能是电网运营企业的首要目标,如果电网运营商没有按规定完成网供电量、负荷预测和低谷电量比三大指标。其中负荷预测的考核将按照在允许误差范围内以基本电价购电,超出允许误差范围电价按110%-200%浮动的原则2 姚建刚,章建,银车来. 电力市场运营及其软件开发M. 北京:中国电力出版社,2001,53-663 陆海峰,单渊达电力系统的递推自适应超短期负荷预报电网技术V0124,No3,Mar2000,283l页4 冉启文,单永正,王骐电力系统短期负荷预报的小波一神经网络一PARIMA方法中国电机工程学报V0123,No3,Mar2003,38_43页5 王辛改进径向函数网格(RBFN)在电力负荷预报中的应用中国电机工程学报V0116,No4,Jul1996,285287页6 彭晓兰,程时杰,陈德树短期负荷预报的灰色系统方法华中理工大学学报V0123,No2,Mar1995,138一141页7 潘力强,马歆,杨常青广义BP网用于电力系统短期负荷预报湖南电力Mar1998,1416页8 谢开,葛维春应用Kalman滤波方法的超短期负荷预报中国电机工程学报V0116,No4,Jul1996,245_249页9 VSKodogiannis,EMAnagnostakis Soft Computing Based Techniques for Shortterm Load ForecastingFuzzy Sets and Systems128(2002),413426P10 Domingo AGundin,Celiano Garcia,Eduardo Gomez,Guillermo VegaSHORT-TERM LOAD FORECASTING FOR INDUSTRIAL CUSTOMERS USING FASART AND FASBACK NEUROFUZZY SYSTEMS14th PSCC,Sevilla,2428 June 2002,Session 20,Paper2,1-7 P11 Changil Kim,Inkeun Yu,YHSongKohonen neural network and wavelet transform based approach to shortterm load forecastingElectric Power Systems Research63(2002),169176 P12 Tatsuya Iizaka,Tetsuro Matsui,Yoshikazu FukuyamaA Novel Daily Peak Load Forecasting Method using Analyzable Structured Neural NetworkIEEE T&D Asia,Yokohama,Oct2002,1-6 P13 Huang,SungHab KimImpl ementati on of Hybrid Shortterm Load Forecasting System Using Artificial Neural Network and Fuzzy Expert SystemsIEEE Transactions on Power Systems,V01i0,NoAugust 199515341539 P14 康重庆,夏清,刘梅.电力系统负荷预测.中国电力出版社,2008,2315 Guinand. P. S, Marcoux. J. T. Between the unitary and similarity orbits of normal operators. Pacific Journal of Mathematics, 1993, 159(2): 29933516 卢虎,李彦,肖颖支持向量机理论及其应用空军工程大学学报(自然科学版) ,2003 年8 月,4(4):899117 姬水旺,姬旺田支持向量机训练算法综述微机发展,2004 年1月,14(1):182018 杨惠昶.股票知识入门.长春:吉林出版社,1992,18-3219 叶伟成.股票知识与投资技巧.北京:新华出版社,1992,24-2920 张学工关于统计学习理论与支持向量机自动化学报,2000年1月,26(1):334221 朱国强,刘士荣,俞金寿支持向量机及其在函数逼近中的应用华东理工大学学报,2002年,28(5):55555922 康重庆,夏清,刘梅.电力系统负荷预测.中国电力出版社,2008,616223 史峰 王小川 郁磊 李洋MATLAB神经网络30个案例分析. 北京航空航天大学出版社, 2010-4-1 2。也就是说,准确的负荷预测就使得电网运营企业可以在电力市场中以较便宜的电价购电。1.2短期负荷预测的研究现状长期以来,国内外学者对电力系统负荷预报进行了广泛而深入的研究,提出了许多有效的方法,主要有时间序列法,指数平滑法,专家系统法,神经网络法,卡尔曼滤波法,小波分析法等。它们均有各自的优点,但是没有一种方法是绝对准确的,也没有一种方法可以适用于一切电力系统。所以各个国家在预测时根据本国的特点,采用的方法也都不一样:日本采用的是自组织的方法,韩国采用的是人工神经网络法,沙特阿拉伯采用的是时间序列法,印度采用的是谱分析法,美国采用的是综合知识库方法,台湾采用的是专家系统法,而我国东北电网采用的是AR+修正数据库的方法。由此可以看出,各种方法在应用上都有所体现。目前国内的学者应用的方法比较多样:东南大学的陆海峰、单渊达应用时间序列法,在ARMA的基础上引入反馈量为随机序列建模,并用F检测逐步自动定阶,以长自回归计算残差法估计模型的初值,用递推最小二乘法对模型进行修正,以实现实时自适应负荷预报3;武汉大学的段俊东、陈昆薇采用模糊理论对日负荷曲线预报中的天气因素进行了模糊处理,根据季节,气候的不同对天气因素做不同的模糊处理和不同的数学模型,提高了短期负荷预报的精度;哈尔滨工业大学的冉再文、单永正等人把小波分解的特性和分解数据随尺度倍增而倍减的规律用于感知神经网络(MLP)和周期自回归移动模(PARIMA)的建模,各尺度小波分解用MLP进行建模和预报,最大尺度上的尺度分解用PARIMA进行建模和预报,最后利用径向基函数网络(RBF)将各尺度域的预报结果组合成为负荷最终预报4;山东大学的王辛等人通过对神经网络BP算法的改进,提出一种局部化的BP预报算法一(局部化了BackPropagation),解决了目前BP算法不能利用单一网络精确预报假日及工作目的负荷和不能体现各工作日负荷波动的弱点5;华中科技大学的彭晓兰等人应用改进的灰色系统方法,能根据电力负荷在不同预测点的变化趋势,自动选择在给定预测点上预测误差最小的预测模型,并针对电力负荷的季节性、周期性变化的特点,采用系数法进行修正6;湖南大学潘力强、马歆、杨长青利用广义误差反向传播算法生成了一种神经网络,克服了传统BP网络所存在的易陷入局部极小和对初值要求较高的缺陷,同时考虑了影响短期负荷预报的若干重要因素,从而增强了模型的精确性和适用性7;电力科学研究院的谢开等人将Kalman滤波方法应用于超短期负荷预报,并在预报过程中引入了极大似然估计进行负荷未知参数辨识,达到了参数估计过程与预报过程的统一8。 国外学者目前大多数都采用与神经网络有关的各种方法来进行负荷预测: XWang, L.H.Tsou kalas利用神经网络来获得用户电力消耗的模型,又使用一种基于模糊逻辑的模块以最快的速度探测到信号趋势并帮助人工神经网络校正预测结果,改进了系统对突变或者特殊情况的适应能力;VSKodogiannis,EMAnagnostakis运用径向基函数,动态神经网络以及神经模糊技术等方法,改进了负荷预报模型,比传统的方向传播网络预报模型更加精确9;西班牙学者DomingoAGundin,CelianoGarcia等人应用两个神经模糊系统FasArt和FasBack,另外还有带BP学习算法的前向多层感知机神经网络(MLP)以及ARIMA模型,获得了不错的预报效果10;ChangilKim,In-keun Yu,YHSong应用神经网络将季节性的历史负荷数据分为四个类型,而后进行小波变换以便预报未来每小时的负荷11。并使用传统的多重回归的方法校正小波变化系数,并且将各部分重构,通过五尺度合成技术预测最终的负荷;Tatsuya Iizaka,Tetsuro Matsui,Yoshikazu Fukuyama设计的一种由两个隐蔽层组成的可分解结构神经网络(ASNN),它可以有效的预报每天负荷的峰值12;韩国学者KwangHo kim,JongKeun Park,KabJuHwang提出用神经网络和模糊专家系统混合建模预报,先用训练过的神经网络进行小时预报,而后用模糊专家系统针对温度和负荷变化进行校正13。总之,目前国内外对电力系统负荷预报的研究的方法很多,但是越来越多的学者倾向于用神经网络结合其他方法进行建模预报。1.3本文所作的工作我们将支持向量机(SVM:Support Vector Machine)理论应用于电力系统短期负荷预测。由统计学习理论发展的通用学习方法支持向量机(SVM)在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。本文通过实验筛选合理的历史数据,股票指标以及温度数据构成训练样本,再将预测的平滑性和误差损失函数相结合构成问题的目标函数,采用LIBSVM算法将SVM的大规模优化问题转化为具有解析解的二次优化问题,成功地应用到短期负荷预测中。最后,本文使用MATLAB语言强大的矩阵运算能力和神经网络工具箱,将SVM两个模型编制成相关软件,并制作友好的用户界面和参数自定义选择功能。然后应用该软件对武汉市的负荷进行仿真预测,得到类似于K线图一样的预测结果,并得出相关结论。第2章 股票趋势分析技术应用在电力系统负荷预测的合理性分析2.1预测的广泛性和通用性预测,是一类科学问题的总称14,是对尚未发生或目前还不明确的事物进行预先的估计和推测。科学的预测是正确决策的依据和保证。许多行业和领域,都会遇到预测问题。由于各个预测问题都是服务于某个特定的行业和领域的,因此人们会想象,各行各业的预测问题必然有着本质的区别。但是,恰恰与人们的想象相反,许多预测问题的核心原理是大同小异的,基本的预测技术和评价手段几乎可以可以运用于各个预测领域。也正是因为如此,在某个领域所形成的预测思想,很可能在较短时间内被其他领域所借鉴。这个事实可以从如下几个方面进行证实。l 在国际上具有较高学术地位的专门讨论预测的杂志,如International Journal of Dorecasting(http:/www.forecasters.org/ijf)和Journal of Forecasting(http:/ideas.repec.org/s.jof/jforec.html),都专注与讨论最新的预测方法、各领域预测研究的新进展、各行业预测的实际应用等。值得注意的是,这些杂志无一例外 的都是以各学科的预测问题为讨论对象,并没有仅仅局限于某类预测(当然,经济预测的论文是主体)。l 类似的,我国的专业预测杂志预测(),也是一个以经济为主、兼顾其他领域预测问题的专业性杂志。l 欧洲所建立的智能预测系统(Intelligent Forecasting Systerm,IFS,http:/www.unipaderborn.de/IFS)就着眼于众多学者、科研机构、企业用户之间的跨学科、跨行业的联合。实际上,IFS尝试建立一个遍及欧洲甚至全球性的,一直能预测为主题的工作网络,可以应用于各行各业的预测问题。在此网络中,大学研究中心、工业界相互协作,及时交流信息,探讨预测方法。l EUNITE Network 于2001年8月1日宣布举行一次全球性的网上预测竞赛(http:/neuron.tuke.sk/competition/index.php),竞赛内容是:组织者公布了斯洛伐克东部电力公司19971998年每30min的负荷数据以及每天的温度、节假日类型等数据,要求参赛者根据这些数据,以及1999年1月各日的气象数据,预测出1999年1月31天的每日最大负荷。要求参赛者必须于2001年11月20日前向比赛网站交预测结果,随后评价这些结果,并公布成绩,还举行了专门的工作组会议进行研讨。虽然这次竞赛的预测对象是电力系统,但是这个比赛得到了众多的关注与参与,预测结果最好的事台湾大学计算机科学与信息工程系的林智仁所领导的团队(他本人的研究领域主要是机器学习和运筹学,而不是电力系统),所采用的方法是支持向量机(Support Vector Machine,SVM)。在2002年4月19日,还进行了其他领域类似的竞赛,可参见其网站http:/neuron.tuke.sk/competition2。这些都充分表明了预测技术的跨领域特征。而在现如今,大量研究者尝试基于多种数学模型的技术指数及机器学习技术预测股票价格或指数,并且现有方法展示了较满意的预测成就。因此本文根据股票指数预测和电力系统负荷预测之间的相关性,参考股票指数预测的方法,进行电力系统负荷预测。2.2股票趋势分析技术简介证券市场的价格是复杂变化的,投资者在这个市场上进行投资时都要有一套方法来制定或选择投资策略进行投资。股票技术分析是以预测市场价格变化的未来趋势为目的,通过分析历史图表对市场价格的运动进行分析的一种方法。股票技术分析是证券投资市场中非常普遍应用的一种分析方法。股票技术分析的理论基础是空中楼阁理论。空中楼阁理论是美国著名经济学家凯恩斯于1936年提出的,该理论完全抛开股票的内在价值,强调心理构造出来的空中楼阁。投资者之所以要以一定的价格购买某种股票,是因为他相信有人将以更高的价格向他购买这种股票。至于股价的高低,这并不重要,重要的是存在更大的“笨蛋”愿以更高的价格向你购买。精明的投资者无须去计算股票的内在价值,他所须做的只是抢在最大“笨蛋”之前成交,即股价达到最高点之前买进股票,而在股价达到最高点之后将其卖出。股票技术分析建立在三个前提条件下,如果三个前提条件不存在的话,那么技术分析没有任何意义。 第一个条件是市场行为包容消化一切。技术分析者认为,能够影响某种证券价格的任何因素(不管是宏观的或是微观的)都反映在其证券的价格之中。研究影响证券价格的因素对普通投资者来说是不可能实现的,即使是经济学家对市场的分析也是不确定的。因此,研究证券的价格就是间接的研究影响证券价格的经济基础。技术分析者通过研究价格图表和大量的辅助技术指标,让市场自己揭示它最可能的走势。 第二个条件是价格以趋势方式演变。技术分析者通过经验的总结,认为证券的价格运动是以趋势方式演变的。研究价格图表的全部意义,就是要在一个趋势发生发展的早期,及时准确地把它揭示出来,从而达到顺应趋势交易的目的。正是因为有趋势的存在,技术分析者通过对图表、指标的研究,发现趋势的即将发展的方向,从而确定买入和卖出股票的时机。 第三个条件历史会重演。技术分析者认为人类的本性就是“江山易改本性难移”。图表表现了人们对于市场的看法,通过对于图表的研究可以找到相似的形态从而找到未来价格运动的方向。2.3电力系统负荷预测与股票趋势预测之间的联系我们发现,无论是电力系统负荷预测还是股票趋势预测,他们都是根据历史负荷与气象数据以及预测的相关数据信息(抑或历史指数与公司基本面情况以及相关的政策变化),运用一定的方法和模型,分析负荷本身及其有关因素的相互关系,从而揭示和总结出负荷自身的特性和变化的规律。预测过程中,历史负荷序列、历史气象数据与预测气象都是自变量,预测结果是因变量,对于这些自变量,人们很难做出明晰的量化,多因素的共同作用,使因变量带有明显的随机性,可见,负荷预测所研究的对象是不确定的事件。总的说来,短期电力系统负荷预测与短期股票趋势预测具有以下相似的特点:1.非线性短期负荷的增减变化基本上不与任何影响因素的变化值成正比,线性模型在短期负荷预测中的效果不够理想。2.周期性周期性也就是负荷在一定时间内的重复性。最典型的是年周期性、周周期性、日周期性。一年内春夏秋冬四季的更替是年周期性的根本原因,由于人们的生产、生活与季节直接相关,季节不同,决定了人们生产和生活方式的不同,负荷变化的年周期性是进行年负荷预测和月负荷预测的基础,所以掌握负荷的年周期性对年负荷预测与月负荷预测意义重大(如图2.1 所示);一周内周一至周五的工作日与周末的双休日交替使负荷具有周周期性,工作日与双休日具有不同的负荷水平。基于负荷特性分析的短期负荷预测的研究与实现周周期性是负荷分析和日负荷预测的关键;一天内的昼夜变换使得曲线的日周期性非常明显,每天的负荷曲线可以分为峰荷、谷荷、腰荷,形状常常有些相似。日周期性是日短期负荷预测和超短期预测的依据和基础。3.相似性尽管客观世界中各种事物的发展各不相同,但一些事物发展之间还存在着相似之处,人们可以利用这种相似性规律进行预测。在很多情况下,作为预测对象的一个事物,其现在的发展过程和发展状况可能与另一事物过去一个阶段的发展过程和发展状况相类似,人们就根据后一事物的已知发展过程和状况,来预测所预测的对象的未来发展过程和状况。预测技术中使用的类推法和历史类比法,就是基于这个特点的预测方法。总的来说,短期电力负荷和证券交易指数都具有较强的周期性和随机性,一方面,电力负荷和证券交易指数与其历史负荷序列密切相关,它总是按一定的趋势有规律地、周期性的成长变化;另一方面,他们又与社会、经济、气象、政治等因素都有着极为复杂的关系,这些不确定因素使得负荷具有很大的随机性。他们之间如此紧密的关系促使我们思考能否用股票技术的方法进行电力系统负荷预测。2.4股票技术应用在电力系统负荷预测中的方法对于股价变化趋势的预测根据观点分类有两种:其一是基本分析学派主张任何时点,每一股票皆有其真值存在,其价值高低取决于公司整体的经营能力而且股票价格会向此真值调整,同时受整体经济情况、产业动态、以及发行公司业绩、财务状况、股市政策与管理交互影响。其二为技术分析学派,分析的基本假设是历史会再次重演,投资人会再重蹈覆辙,因此技术分析支持者认为股价变动有趋势可循利用证券成交价、成交值、成交量的历史资料归纳出一些操作技术来预测股价未来的走势。很明显技术分析学派的研究内容对电力系统负荷预测有重要的参考意义。 股票市场预测被认为是金融时间序列预测的一项有挑战性的任务。在这一领域有很多用人工神经网络的研究。许多成功的应用显示人工神经网络是时间序列建模和预测的一个非常有用的工具,早期的研究者集中在用人工神经网络预测股票市场,最近的研究趋向杂交好几种人工智能技术。后来提出了遗传算法来进行特征离散化,人工神经网络连接权的决定来预测股票价格指数,这些方法减少了特征空间的维数,加强了预测性能。可是,这些研究中有些表明人工神经网络在学习模式上有些缺陷,因为股票市场数据有巨大的噪声和复杂的维数。因此,人工神经网络在噪声数据上展示了不一致和不可预测的性能。然而,BP神经网络,最流行的神经网络模式,在选择大量的包括相关输入变量、隐层的大小、学习速率和动量常数的控制参数上遇到了困难。我们注意到一种新的神经网络算法,SVM。许多传统的神经网络模式落实了实证风险最小化原则,而SVM落实了结构风险最小化原则。前者寻求最小化误分类错误或与训练数据的正确解决方案的偏离程度,而后者寻求最小化一个上界泛化误差。此外,SVM的解决方案可能是全局最优的,而其他神经网络模式可能趋向落人局部最优的解决方案。因此,SVM不可能发生过拟合。于是我们决定采用SVM作为算法核心,仿照预测股票指数的办法,进行电力系统负荷预测。第3章 电力系统负荷预测的理论基础3.1支持向量机(SVM)的理论基础支持向量机(SVM)是上世纪90 年代中期提出的一种机器学习算法,它的基础是Vapnik创建的统计学习理论15。传统的学习方法(如神经网络) 采用经验风险最小化(ERMEmpirical Risk Minimization) 准则,在训练中最小化样本点误差,因而不可避免地出现过拟合现象,这样模型的泛化能力受到了限制。而统计学习理论采用结构风险最小化(SRMStructural Risk Minimization)准则,在最小化样本点误差的同时,缩小模型泛化误差的上界,即最小化模型的结构风险,从而提高了模型的泛化能力,这一优点在小样本学习中更为突出。3.2支持向量机实现的基本思想l 最优超平面16设给定训练数据为 (,),(,) , ,(,) ,其中x , y - 1 ,+ 1,又若n 维空间中的线性判别函数一般形式为:图3.1 SVM 算法原理示意图 (3-1)集合中的所有数据都可以被分类面所正确划分,则该分类面就是最优超平面。而距离该最优超平面最近的异类向量就是所谓的支持向量(Support Vector),支持向量与超平面之间的距离最大(即边缘最大化) , 一组支持向量可以唯一的确定一个超平面,如图3.1 所示。图中,实心点和空心点代表两类样本,H为分类线,H1,H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔。由于支持向量与超平面之间的距离为,则支持向量间距为,寻找超平面的问题,可转化为求解以下二次规划问题: (3-2)约束条件为不等式: (3-3)对一个规范超平面子集,其VC 维h 满足不等式: (3-4) 式中n 为向量空间的维数,R为覆盖所有向量的超半球半径。由式(3-4)可以得到,通过最小化可使V C 置信度最小,若固定经验风险,则最小化期 望风险的问题就是最小化的问题。此即SVM 算法的理论出发点。l 构造最优超平面可知,在线性条件下式(2-2)的最优解为下面Lagrange 函数的鞍点: (3-5)为非负Lagrange 乘子。在鞍点处,由于w 和b 的梯度均为零,则可知最优超平面系数满足: 当=0 ,此时最优超平面是训练集合中的向量的线性组合: (3-6)因为只有支持向量可以在w 的展开式中具有非零系数 ,这时的支持向量就是使式(2-3)成立的向量,即只有支持向量影响最终的分类结果,数学表述如下: (3-7)根据Kühn - Tucker 条件可知,最优解满足: (3-8)将式(2-7) 、(2-8) 代入式(2-6) 中,构造最优超平面的问题就转化为一个较为简单的二次规划问题, 可知分类平面为 (3-9)对于线性不可分的情况, SVM 引入松弛变量和惩罚因子,使目标函数变为 (3-10)此外,SVM通过非线性变换将输入空间变换到高维空间,然后在新空间中求解最优分类面,线性可分情况下的点积运算变为k(x ,y)=(x)·(y)。由此得到的分类函数为 (3-11)l 支持向量机 支持向量机实现的是如下的思想:通过事先选择好的非线性映射将输入向量x 映射到一个高维特征空间Z ,在这个空间构造最优分类超平面。SVM 的分类函数在形式上类似神经网络,输出是中间节点的线性组合,每个中间节点对应一个支持向量,如图3.2 所示。图3.2 支持向量机示意图 由以上对最优超平面的讨论可知, 向量之间只进行点积运算。因此,如果采用核函数,就可以避免在高维特征空间进行复杂的运算。该过程可以表述如下:首先将输入向量x 通过映射: : H 映射到高维Hilbert空间H 中。该核函数K 满足: ,显然不同的核函数将形成不同的算法(即不同的支持向量机) ,目前,主要有:多项式核函数:,得到d 阶多项式分类器;径向基函数(RBF) : , 所得分类器与传统RBF 的区别是:这里每个基函数中心对应一个支持向量,它们及输出权值都是由算法自动确定的。另外,还有其它一些核函数。3.3 SVM训练求解算法训练SVM 的本质是解决二次规划问题,在实际应用中,如果用于训练的样本数很大,标准的二次型优化技术就很难应用。针对这个问题,研究人员提出了各种解决方案,这些方案的核心思想是先将整个优化问题分解为多个同样性质的子问题,通过循环解决子问题来求得初始问题的解。下面介绍SVM 训练两种主流算法:分解算法和顺序最小优化算法17。l 分解算法分解算法最早是由Osuna等人提出的。后来C.W. Hsu 和T. Joachims等人又对其进行了改进。分解算法的基本思想是把问题分解成为固定样本数的子问题:工作样本集的大小固定在算法速度可以容忍的限度内,迭代过程中只是将剩余样本中部分“情况最糟的样本”与工作样本集中的样本进行等量交换,即使支持向量的个数超过工作样本集的大小也不改变工作样本集的规模,而只对支持向量中的一部分进行优化。l 顺序最小优化算法在分解算法的基础上,微软研究院的John C. Platt 等人提出并且改进了SMO 算法。这种算法将工作样本集的规模减到了最小两个样本。之所以需要两个样本是因为等式线性约束的存在使得同时至少有两个Lagrange 乘数发生变化。由于子问题的优化只涉及两个变量,而且应用等式约束可以将其中一个变量用另一个变量线性表示出来,所以迭代过程中每一步的子问题的最优解可以直接用解析的方法求出来,无需使用数值分析中的二次规划软件包,提高了子问题的运算速度。第4章 结合股票技术的短期负荷预测的方法研究4.1利用K线图进行负荷分析目前负荷分析的表现手段方面的研究甚少。传统单一的图形分析工具应用于负荷分析时不但表现能力差,而且信息量少。新颖独到的图形化工具一直没有移植于负荷分析的相关报道。股票预测与负荷预测一样,都是根据已知的历史数据,考虑其影响因素后,对未来的变化状况做出预测。随着中国股市的日趋成熟,研究者开发出了大量的股票分析软件,这为股票分析图移植到负荷分析中提供了参考。股票分析局部图4.1。图4.1股票分析图在进行深入的对比研究后,本文提出了一种全新的基于股票图形的,包含丰富、详细信息的,便于用户使用的,直观、可视的负荷分析与趋势预测的方法。4.1.1图形概述l K 线图1