《电工技术学报》论文投稿模板.docx
D01:10.19595/ki.l000-6753.tces.基于卷积神经网络和简单循环单元集成模型的风电场内多风机风速预测XXXX(西安交通大学电气工程学院西安710049)摘要在传统风电场风速预测中,往往将风电场视作一个整体,进而给出较大空间尺度下的单一整体风速预测结果。但在实际风电场中,多台风机分布在不同的地理位置上,其各自的本地风速也存在明显差异。对此,该文提出一种通过学习历史风速和历史风向中空间相关性和时间相关性,从而实现不同地理位置上多风机各自本地风速的预测方法。该方法首先利用卷积神经网络(CNN)提取空间相关性信息,然后将蕴含空间信息的特征序列交由简单循环单元(SRU)处理,进而学习时间相关性信息。风速和三角函数化的风向构成类似于RGB图像结构的三维矩阵。CNN非常适合处理RGB图像类型的数据,故使用CNN提取多风机的风速和风向在同一个时刻下的空间信息。与其他循环神经网络相比,由于SRU可大幅减小计算代价,故使用SRU提取多风机的风速和风向随时间变化的动态信息。在实际风电场数据上的仿真测试表明:在多个不同的预测时域下,该方法与现有利用时空相关性的预测方法相比,不仅显著减小了计算代价,而且提高了预测的准确性。关键词:多风机风速预测卷积神经网络简单循环单元改进循环神经网络时空相关性中图分类号:TM614WindSpeedForecastsofMultipleWindTurbinesinaWindFarmBasedonIntegrationModelBuiltbyConvolutionalNeuralNetworkandSimpleRecurrentUnitXXXX(SchoolofElectricalEngineeringXi,anJiaotongUniversityXi,an710049China)AbstractConventionalwindspeedforecastsfocusedontheoverallwindspeedofawindfarm.However,inanactualwindfarm,multiplewindturbinesarewidelydistributedindifferentgeographicallocations,andtheirlocalwindspeedsaresignificantlydifferent.Toaddressthis,thispaperproposesamethodfortheturbine-specificwindspeedforecastsinawindfarm.Thismethodteamsthehistoricalspatialandtemporalcorrelationbetweenwindspeedandwinddirection.Firstly,theconvolutionalneuralnetwork(CNN)isusedtoextractthespatialcorrelationinformationamongmultiplewindturbines.Subsequently,theextractedspatialinformationisprocessedbythesimplerecurrentunit(SRU),whichlearnsthetemporalcorrelationinformation.Duringthedatapreprocessprocedure,windspeedandtrigonometricwinddirectionformathree-dimensionalmatrix,whichissimilartotheRGBimageseries.CNNisverysuitableforprocessingdataofRGBimagetype,sothespatialinformationofwindspeedandwinddirectionofmultiplewindturbinesatthesamemomentisextractedbyCNN.Comparedwithotherrecurrentneuralnetwork(RNN),SRUhasmuchlowercomputationalcost.SoSRUisutilizedtoextractthedynamicinformationofwindspeedandwinddirectionofmultiplewindturbinesovertime.The国家自然科学基金(51777162)和中央高校基本科研业务费专项资金(XZyOI2019022)资助项目。收稿日期2019-12-08改稿日期2020-02-24simulationresultsonactualwindfarmdatavalidatetheeffectivenessoftheproposedmethod.Keywords:Windspeedforecastofmultiplewindturbines,convolutionalneuralnetwork,simplerecurrentunit,improvedrecurrentneuralnetwork,spatio-temporalcorrelation0引言随着经济的发展,人类社会对电力的需求越来越大。鉴于化石能源的不可再生性和其造成的环境压力,新能源发电技术越来越受到世界各国的重视。风力发电是新能源发电中重要的一部分,在2018年,全球风电装机容量规模达到597GW,中国的风电装机容量规模占据全球第一,超过200GW。随着风电渗透率的不断增加,由于风速的随机性和不确定性,风电功率的波动会对电网的安全性造成影响e*风电功率主要由风速决定%明准确的风速预测可用于指导设计高效的风电控制策略,进而减小对电网不利影响。但由于一个风电场中的风机广泛分布在不同的地理位置上,每个风机的风速都不相同。若能精细化地预测风电场中每台风机的本地风速,则可为风电场控制提供更为充分的信息,进而提升风电场控制的灵活性和最优性。近年来,国内外学者已经对风速预测做了大量的研究,并且也取得了很多成果。文献9-10利用历史数据的潜在规律,实现单一风机风速的预测,文献11-15利用小波变换等机器学习方法将一个风电场中的所有风机作为一个整体进行风速预测,但这些研究均是对单个风机或者将整个风电场的风机当为整体进行预测。相较于欧美地区,我国季风区在冬季风、夏季风时期的风速有较高的空间相关性故在进行风速预测时,此自然条件应予以充分利用,即应考虑风速和风向的空间相关性。文献17-18利用风速的时间相关性进行多风机风速等预测,但是其均没有考虑不同位置下风速和风向的空间相关性。文献19-21虽然考虑了风场内多风机风速间的空间相关性,但是没有考虑各风速序列内部的时间相关性。文献22使用环境和地理参数(如湿度、温度、大气压力等)预测多风机风速,虽然考虑了风速的时空相关性,但是计算代价大,参数依赖性强。文献23利用卷积神经网络(ConvolutionalNeuralNetwork5CNN)和长短期记忆网络(LongShort-TermMemory,LSTM)进行多风机风速预测,但神经网络输入仅为风机风速,输入特征较为单一,且计算代价较大。一个风电场往往会有多台风机,相应地其数据量也较大,所以需要有高效的处理工具来挖掘其内含的特征信息。深度学习是在海量数据中寻找复杂规律的有效工具,随着特征数据的增大,其表征数据特征的能力会不断提升。因此,风电场内多风机风速预测问题非常适合使用深度学习来解决。准确的风速预测模型需要尽可能地获取到有效信息,所以多风机风速预测需要同时考虑风速及风向的时间相关性和空间相关性。现有基于时空相关性的多风机预测模型的输入特征仅有风速,但多风机之间的时空相关性依赖实时风向,且随风向实时变化。因此,一个有效的空间时域预测模型应同时将多风机的风速和风向作为输入特征。在时间相关性方面,考虑风向之后,特征维数增大,不仅模型计算代价大,而且捕捉不同时刻间风电场整体风速和风向分布动态特性的难度变大,所以需要更加有效,且能减小计算代价的时间域建模方法。鉴于此,本文提出了一种基于深度学习的风电场多风机风速集成预测模型。该模型同时学习多风机间风速和风向的时空相关性。风速和经三角函数处理的风向构成三维输入矩阵,此特征输入矩阵与彩色图像RGB三维通道的结构类似。而CNN非常适合处理具有类似彩色图像结构的数据,CNN每一个卷积层中具有多个卷积核,可以逐层学习到数据在多个方面的特征,所以在空间相关性方面使用CNN进行空间特征提取。将经过CNN处理后、蕴含空间信息的数据再进行时间特征提取。在时间相关性方面,由于简单循环单元(SimPIeRecurrentUnit,SRU)不仅具有并行处理能力,能极大地减小计算代价,而且可以有效地缓解梯度消失问题,解决长期依赖问题124-251,因此可使用SRU进行时间特征提取。1风电场多风机风速预测问题描述本文所采用的时空集成预测模型是基于风电场中每台风机的历史风速数据和历史风向数据,采用CNN和SRU集成预测模型,提取到上述风机特征数据之间内在的时空相关性,进而得到风电场中每台风机精细化风速预测结果。进行风电场中每台风机精细化风速预测需要详细的风机数据,此风机数据必须真实地反映风电场中多个风机的时空相关性。本文所采用的数据来源于美国国家可再生能源实验室(NatiOnaIRenewableEnergyLaboratOry,NREL)提供的风能综合国家数据集(WindIntegrationNationalDataset,WlND),WIND是迄今为止公开可用的最大最完整的风能数据集,通过其网站可以十分容易地获取所需风能数据。WIND现己公开提供2007年2012年美国本土超过12.6万个陆基和海基处的风向、风速、温度、表面空气压力和空气密度等数据,其数据每5min采集一次,即时间分辨率为5mino本文仿真案例选择2012年数据,地点位于怀俄明州的梅迪辛博和埃尔克芒廷之间的144台风机测量点。其中,最大风速为27.353ms,最小风速为0.061ms,144台风机测量点以12x12的矩阵形状排列,各风机测量点轮毂高度一致,均为100m,每两个相邻的风机测量点间距2km,如图1所示。此研究对象可视作拥有多台位于不同地理位置风机风电场的般案例。图IWIND中美国怀俄明州12X12风机矩阵FigJThewindturbinearrayof12×12inWyomingofWIND,USA2多风机风速序列间空间相关性和风向序列间空间相关性建模在集成预测模型中,CNN负责多风机风速序列间空间相关性和风向序列间空间相关性的建模。CNN是深度学习领域中重要的一种学习模型,于1998年被Y.LeCun等提出国,它非常适合处理图像类结构的数据。在很多领域,CNN都得到了广泛的应用,如图像识别、语言识别和气候预测等。与常见的神经网络相比,CNN最主要的特征在于卷积层【26】,即卷积操作。CNN一般由输入层(INPUT)、卷积层(CONV)、池化层(POOL)和全连接层(FC)构成。2.1 卷积神经网络设计基本思想在CNN中,输入层的数据一般先由卷积层进行特征提取,为保持卷积之后的特征图尺寸不变,卷积核尺寸不应为偶数,并且卷积过程中需进行零填充操作。由于卷积层中有多个卷积核,卷积层输出往往具有较大的参数量,而池化层可以减小数据和参数的数量,所以卷积层后一般会加上池化层。为了提取最显著的特征,避免平均池化造成的模糊化效果,选用最大池化。由于在线性模型中加入非线性激活函数可以实现去线性化,故卷积层中每个神经元的输出通过一个修正线性单元(ReCtifiedLinearUint,ReLU)激活函数进行处理。使用多个较小尺寸的卷积核代替较大尺寸的卷积核,不仅可以减小参数,减轻过拟合,而且还增加了多层的非线性扩展能力。在卷积神经网络的底层构建全连接层,对所得到的高维特征进行综合处理,做出最后的决策输出。在卷积层中,其学习复杂结构的能力应该被保证。为了定量衡量卷积层的学习能力,定义卷积层学习能力C为当前层卷积核尺寸一当前层感受野尺寸为了保证卷积层学习复杂结构的能力,每个卷积层的C值都应该大于某一最小值,一般可设1/6为此下界口刀。此外,当最深层网络神经元的感受野大于输入图像的尺寸时,单个神经元已经可以学习到整幅图像的特征,故不应再继续加深网络层数,以免产生过拟合现象,即最深层网络神经元的感受野必须略大于输入图像的尺寸。如果其感受野比输入图像尺寸小,那么此神经网络丧失了学习高级特征的能力。相反,若最深层网络神经元的感受野比输入图像尺寸大得多,不仅过深的卷积网络对整体网络性能没有帮助,而且增加了过拟合的风险,可能会对最终结果造成不好影响因】。2.2 卷积神经网络具体设计综合考虑硬件平台和上述设计思想,本文构建如图2所示的CNN模型,其输入层为三维数据,Fig.2TheCNNstructure每一维是12x12矩阵,CNN结构中具有2个卷积层,2个池化层和2个全连接层,卷积中最后的一个全连接层也被视为回归层。卷积层中卷积核输入通道数应与输入卷积层数据的维度一致,故两个卷积层的卷积核输入通道数分别为3和6。令卷积核尺寸为5×5,C2和Cl卷积层中卷积核输出通道数分别为16和6。采用自顶向下的方法来计算每层网络层的感受野2阴,当卷积核尺寸为5,第二层卷积层C2的感受野尺寸为6,故其学习能力C=56大于其下限值1/6,满足设计要求,采用自顶向下的计算方式得到第二个池化层P2的感受野为14,略大于输入图像尺寸12,满足设计要求,故在第二个池化层P2后,不应再新增卷积层。因池化层中的滑动步长大于3时提纯操作过于剧烈,故一般设步长为2。2.3 卷积神经网络2.3.1 卷积层卷积层是CNN中的基本操作,视作是加权求和的过程。通过卷积运算,原始数据的局部低维特征被映射到高维特征。对于输入到卷积层的每个局部区域,卷积计算是这个局部窗口内的所有元素和卷积核的内积,这个内积为下一层的对应元素。通过遍历上一层的所有局部进行卷积,即可得到通过卷积层运算的下一层。其卷积计算公式为g=i*k(2)式中,i为局部区域内的元素;土为卷积核;g为卷积计算后的元素。给出一个二维卷积的例子,当局部区域,卷积核无二-10-10-10时,滑动步长为1,二维卷积核1 0卷积后的内积输出g = 0。输入二维矩阵卷积运算后图3二维卷积示例卷积过程(-1)×1-H)×(>+1×2+(-l)×540×4¼l×2+(-1)×3-H)×4+1×5)风速和三角函数化的风向构成三维矩阵输入,需要对其进行三维卷积操作。三维卷积与二维卷积类似,三维卷积的每一个维度都进行二维卷积,最后将每个维度上面的卷积结果叠加即是三维卷积的结果,故三维卷积的最终结果也是一个Ixl的数,如图4所示。输入三雉矩阵三维卷积核卷积运算后 的输出值图4三维卷积示例Fig.4Theexampleofthree-dimensionalconvolution2.3.2池化层图5最大值池化操作示例Fig.5 The example of max pooling经过卷积层提取特征之后,一般会进行池化操作。由于一幅图像的相邻局部区域往往具有相同的特征,所以CNN对其进行池化操作,以达到防止过拟合的作用,并且经过池化操作后的数据对应原始输入数据的感受野也不断增大,可以提取到更高维的特征,这种操作也可以认为是一种下采样操作。池化操作最常见的是最大池化(MaXPooling),其次是平均池化(AVeragePOoIing)。图5给出了最大值池化操作示例,池化窗口2x2,步长2。3 多风机风速序列内时间相关性和风向序列内时间相关性的建模循环神经网络(ReCUrrenlNeuralNetwork1RNN)是一种专门用来处理具有时序特征数据的深度神经网络,于1980年被JJHop行eld等提出。RNN广泛应用在自然语言处理、计算机视觉、地球科学和计算生物学等领域29。RNN根据“未来的状态与过去和现在的状态相关”提出,因此RNN非常适合分析时间序列数据,并且它可以将任意长度的序列作为输入预测未来的输出。3.1 简单循环单元深度学习研究的进展常常涉及更大更深的深层神经网络,虽然RNN被设计为利用具有时序特征的历史数据做出当前时刻的决策输出,但RNN对最近输入的历史数据非常敏感,而更早之前的历史数据会随着时间的推移,其辅助作用越来越弱,这种问题被称为长期依赖问题。LSTM和门控循环单元(GatedRecurrentUnit5GRU)的提出解决了长期依赖问题。但LSTM和GRU的“细胞”之间的计算具有前后的依赖性,所以它们只能串行计算,计算代价大。SRU是RNN的一种变体形式,它于2017年被TaoLei等提出al,SRU通过将每一时间步的主要计算部分优化为不依赖之前时间步的计算,从而可以实现并行化计算,进而减小计算成本。因此SRU不仅有利用长时间信息的优势,解决有着复杂时间相关性的长期依赖问题,而且可以大幅减小计算成本。SRU的结构如图6所示,SRU的计算公式为E=H七ft=(W,xl+bf)<rl=(Wrx,+br)(3)=Z0.1+(I-Z)X,4 Og(Ci+(1GoU式中,W、叼和Wr分别为对应输入的权重矩阵;力和瓦为偏置向量;Xr为在/时刻的输入向量:flt为,时刻的输出;。为激活函数Sigmoid函数:cl.为在Ll时刻的SRU的单元状态;3表示Hadamard运算。值得说明的是,cm虽然表示LI时刻的单元状态,但是包含了从LA到LI时刻的输入序列对,时刻预测输出的影响,故C,记录了过去的输入状态对,时刻输出的影响。由式(3)可知:儿计算不依赖于4.1。故SRU可以实现并行计算,大幅减小计算成本。而LSTM和GRU的品均依赖于Am,破坏T独立性和并行性,故与LSTM和GRU相比,SRU能减小计算代价。图6SRU结构框图Fig.6 SRUstructureblockdiagram3.2基于SRU的时间相关性学习模型本文所提的集成预测模型使用SRU进行空间时域建模,其中采用的是单层网络结构的SRU,如图7所示。该时域预测模型使用Lk至/时刻的历史数据给出未来时刻的预测数据。值得说明的是:由于SRU的输出是一维向量形式,在计算损失函数的时候,需要将144个风机组所构成的风速预测12x12矩阵映射为1x144向量,进而计算损失函数。图7单层SRU连接Fig.7 TheconnectionofsinglelayerSRU4空间相关性和时间相关性的深度集成预测模型7.1 数据处理风机风向数据的范围在0。36()。之间,但是位于最大值附近(例如359。)和最小值附近(例如1。)的风向数据,对于风机扇叶来说相差并不大,若不进行任何处理直接将此风向数据输入到集成预测模型中,因实际风向的物理角度相差并不大,但是输入的风向数据却相差较大,故向集成预测模型输入相差较大的风向数据并不是合理有效的信息,会导致预测误差较大,因此需要对风向数据进行预先处理。本仿真案例中采用三角函数化处理,即Sin风向和cos风向Ml。在每一个采样时刻k,用12x12x3的三维矩阵/人将此时刻风电场中的12×12个风机的风速,cos风向和sin风向构成的三维信息存储起来,V具体结构如图8所示,此三维输入矩阵可视为类似于彩色图像的三维RGB结构。图8三维矩阵特征Fig.8 Three-dimensionalmatrixfeature4.2时空集成预测本文采用的方法通过考虑风电场中144台风机阵列风速和风向的时空相关性来实现时空联合预测。首先使用CNN提取要预测时刻前20个时刻的三维矩阵的各自空间特征,再将CNN提取到的空间特征依次输入到20个SRU中提取时序特征,由最后一个SRU的输出作为最终的多风机风速预测。时空集成预测模型的整体结构如图9所示,预测值为ST="",/I,11)=/(SM,S3,s,DsDS*,DsF,DCrDCr,Dc/)=gttJM(SiSL,.,sF,DsM,Ds/,DsT,D<',D<2,D<t)(4)式中,S广为在&+人在时刻的预测风速值,即为预测时域;厂为k时刻下由风速和三角函数化风向构成的三维矩阵;SM为在hl时刻风速的测量值;DSY为I时刻的sin风向测量值;De:为bl时刻的cos风向测量值;gtan和4分别为以I2×12排列风机的风速和风向内在的时间相关性和空间相关性。图9集成预测模型结构Fig.9Integratedforecastmodelstructure对于确定的预测时域人二1和输入历史序列长度L=L1,本案例采用滚动预测的方法进行多步预测,即迭代式。具体而言,在任意时刻匕都基于历史序列长度Lx的风机特征数据(/I,/",.)预测出未来加时刻的风速S;+%,当在下一个时刻+l时,根据历史序列长度Li的风机特征数据(k-)预测出未来历时刻的风速SrSo如此循环迭代下去,即为迭代预测过程。5仿真算例5.1仿真设置本次仿真基于TenSOrfIoW框架的python语言实现,利用统一计算设备架构(ComPUIeUnifiedDeviceArchitecture,CUDA)加速,仿真硬件平台设置:CPU为IntelCorei5-74003.40GHz,内存RAM为16GB,GPU为NvidiaGeForeGTX10603G。在本次仿真案例中使用风速和风向作为特征,设置预测时域h为1。又本案例中风电场风机特征数据每隔5min更新一次,故当预测时域人为1时,即预测当前时刻后未来5min的多风机风速。相较于仅给出风电场单一整体的风速预测结果,进行风电场每台风机精细化风速预测需要更加综合的评价指标,以衡量风电场中所有风机的整体预测效果。本案例采用方均根误差(RoOtMeanSquareError,RMSE)和平均误差(MeanError,ME)作为仿真的综合评估损失函数。RMSE'和ME人用于衡量在火时刻风电场中每台风机精细化风速预测的综合误差大小,分别为me=-¾)iy/-I式中,RMSEA为火时刻风电场每台风机精细化风速预测的方均根误差;MEA为A时刻风电场每台风机精细化风速预测的平均误差;N为预测的总风机数量,在本次仿真2144,即认为此风电场中共有144台风机;S*为在4时刻风电场中第i台风机风速的测量值;席为在女时刻风电场中第i台风机风速的预测值。由于采用迭代预测,若风电场中每台风机总计滚动迭代预测M步,则在整个M步迭代预测中,风电场中每台风机精细化风速预测的综合评价指标RMSE和ME分别为iMRMSE=ZRMSEA“i/N'M(6)MEqXMEA由式(6)可知,综合评价指标RMSE和ME使用总计M步迭代预测中每一步中的RMSE人和ME«进行计算,因此,RMSEA和ME"表示迭代预测过程中,在女时刻,此步的精细化风速预测的误差。RMSE和ME表示在整个迭代预测过程中的综合误差评价指标。本次仿真首先将数据划分为训练集、验证集和测试集。训练集用来训练深度神经网络的各种参数,验证集用来验证模型是否建立合适,而测试集用来进行实际的预测。使用所获得的数据前50000条作为仿真数据,在时间尺度上对应16月的风机数据,取其中040000条数据作为训练集,40000-45000条数据作为验证集,45000-50000条数据作为测试集.由于深度神经网络模型中的参数采用随机梯度下降法进行训练,所以一般会将同样的一批数据多次输入该模型中,这样能保证模型中的权重值和偏置值训练得更加充分,将这样的一次训练过程叫作Epocho在本次仿真中,设置EPOCh=I00,且为了实时了解训练的效果,在训练的过程中,每训练200次进行一次验证集的测试。对于输入集成预测模型的历史特征序列长度L的选定来说,需要综合考虑网络参数的训练时间成本和先验知识的完备程度。若L太大,网络训练的时间成本及复杂程度会上升,网络参数优化不佳,且过于复杂的模型训练可能会影响参数的最终优化效果,进而影响预测的准确性;若L太小,则先验知识不完备,历史特征序列蕴含的预测知识欠缺,从而限制了预测精度。因此,需要折中考虑L的选定。文献14,22中分别选定历史特征序列长度L为12和32,随后采用人工试探的方法。参考上述选定经验,设置L在1232之间,在采用上述仿真条件下只改变L参数计算得到风速预测误差RMSE,由所计算的若干仿真结果点,得到RMSE=/(L)在LU(12,32)定义域内的散点图如图10所示。由图10可知,随着L的逐渐增大,历史特征序列长度不断增加,其蕴含的预测先验知识逐渐完善,所以RMSE逐渐降低。当L增加到某一临界点后,随着L的继续增加,历史特征序列长度过于冗长,网络参数没有得到合适的训练,影响了预测效果,又或是在此仿真设置中,数据训练迭代次数Epoch过小,过长的历史特征序列没有得到充分利用,反而导致网络参数没有得到最优或次优解,故RMSE又较缓慢增加。0.90X2-70.853*0.850.800.750.700.65X16 J0.735X20 7 0.661*X3228Y0.784.X0.749wX2A/0.683121620242832输入历史序列长度图10历史输入序列长度L与方均根误差RMSE关系(预测时域力=1,Epoch=100)Fig.10ThegraphofhistoricalinputsequencelengthLandRMSE(forecasthorizonj=1,Epoch=100)故在本仿真案例所用条件下,综合考虑选定经验和人工试探结果,最终选定输入集成预测模型的历史序列长度L=20,即使用前20个时刻的风速和风向特征来预测下一预测时域的风速。5.2仿真结果给出144个风机阵列在某一个时刻的预测结果,同时给出多个不同编号风机在多个时刻的迭代预测结果,如图11图16所示。在图11中,将某一时刻144台风机的风速预测误差RMSE中最小值T.098ms置为青色(RGB分别为0,255,255),最大值1.057ms置为品红色(RGB分别为255,0,255),预测误差RMSE中间值采用线性插值方法得到相应RGB,最后得到对应的颜色。本次仿真算例中,测试集中风电场精细化风速预测综合误差评价指标RMSE=O.661ms,集成预测模型神经网络参数训练耗时为1987.3s。方均根误差/(m/8) 1.0风机矩阵行号-0.6-0.8-1.0图11144台风机在某一时刻的预测输出误差热力图(预测时域=1,即预测未来5min的多风机风速)Fig.l1Lossthermodynamicgraphoftheforecastedoutputof144windturbinesatacertaintme(torecasthozon=1,thatistoforecastthewindspeedofmultiplewindturbinesinthenext5minutes)050100150200250时间/(5min)图12编号I风机的风速预测结果(预测时域=1,即预测未来5min的多风机风速)Fig.12ForecastedoutputofsiteID1windturbine(forecasthorizon=1,thatistoforecastthewindspeedofmultiplewindturbinesinthenext5minutes)图13编号20风机的风速预测结果(预测时域力=1,即预测未来5min的多风机风速)Fig.13ForecastedoutputofsiteID20windturbine(forecasthorizonA=1,thatistoforecastthewindspeedofmultiplewindturbinesinthenext5minutes)50100150200250时间/(5min)050505050 0Z5.2O.Z5.2 2 1111H图14编号40风机的风速预测结果(预测时域=1,即预测未来5min的多风机风速)Fig. 14 ForecastedoutputofsiteID40windturbine(forecasthorizon=1.thatistoforecastthewindspeedofmultiplewindturbinesinthenext5minutes)针对工程中风速预测中常见的多步时域预测问题,本文也给出了多个预测时域的预测结果,预测时域力分别为1、2、5和10,即预测当前时刻后未来5min%IOmin、25min和50min的多风机风速。集成预测模型参数训练耗时和风电场中每台风机精图15编号60风机的风速预测结果(预测时域=l即预测未来5min的多风机风速)Fig. 15 ForecastedoutputofsiteID60windturbine(forecasthorizon=1,thatistoforecastthewindspeedofmultiplewindturbinesinthenext5minutes)20.017,15.0字25310.0售75区5.0X50时间/(5min)图16编号80风机的风速预测结果(预测时域h=,即预测未来5min的多风机风速)Fig.16ForecastedoutputofsiteID80windturbine(ForecasthorizonA=1,thatistoforecastthewindspeedofmultiplewindturbinesinthenext5minutes)细化风速预测误差的仿真结果见表1。表1预测性能与预测时域关系Tab.lRelationshipbetweenforecastperformanceandforecasthorizon预测时域力训练耗时/SRMSE(ms)ME(ms)11987.30.661-0.02621998.70.9200.15752002.61.5830.440IO2004.51.8160.506由表1可以看出,随着预测时域的增加,RMSE逐渐增大,预测效果逐渐变差。预测时域增加的同时,输入到CNN和SRU集成预测模型的特征将越来越偏离预测时刻的特征,所以取得的预测效果也相对比较差。但在预测时域人V10的情况下对风电场中所有风机进行精细化本地风速预测仍能取得相对比较好的预测效果。若在工程中需要取预测时域A>l()时,即预测50min后的风速,可以考虑增大Epoch来提高预测的准确率。5.3对比分析表2给出使用CNN和SRU集成预测模型,但使用不同的数据特征在多个预测时域的仿真结果。表2风向特征对预测性能的提升表Tab.2Improvementtableofwinddirectioncharacteristicforforecastperformance预测时域Zt特征训练耗时/SRMSE(ms)ME(ms)风速和风向1987.30.661-0.026风速1958.60.713-0.0792风速和风向1998.70.9200.157风速1960.70.9630.182风速和风向2002.61.5830.440风速1963.51.6360.558风速和风向2004.51.8160.506IOM1速1967.22.0720.681由表2可知,较仅使用风速作为特征,使用风速和风向作为特征来预测风速可取得更好的预测效果。因为在一个风电场中,众多风机分布在不同的地理位置下,不仅风速具有时空相关性,风向也同样具有时空相关性,而且多风机风速序列的空间相关性主要受风向影响。通过同时考虑风速和风向的时空相关性,可以获得更加丰富和有效的信息,更有利于进行风速预测。为了说明本文所提方法的优越性,给出了多个不同预测方法的对比仿真。由之前仿真的对比分析可知,使用风速和风向作为特征取得的预测效果更佳,所以在下文的对比分析中,均采用风速和风向为特征。对比的预测方法包括:CNN和SRU集成预测模型、CNN和LSTM集成预测模型、CNN和GRU集成预测模型、CNN及简单人工神经网络(ArtificialNeuralNetwork,ANN)o在预测时域为1时,图17图21分别给出不同预测模型的训练误差、网络中某一参数及其梯度随训练次数的变化。表3给出了不同预测模型在训练过程中网络某一参数梯度绝对值的平均值。由图中可知,在训练过程中,较其他两种集成预测模型,CNN和SRU集表3不同预测模型梯度绝对值的平均值Tab.3Averagevalueoftheabsolutegradientindifferentforecastmodels模型整个训练过程中梯度绝对值的平均值CNN+SRU0.15CNN+LSTM0.0018CNN+GRU().0()()35 0 3图17预测误差随训练次数变化对比Fig. 17 Comparisongraphofforecastedlosswiththetrainingtimes-0.10J-0.20 W-0.50-0350200400600 MX) 1000图18网络中某参数随训练次数变化对比Fig. 18 Comparisongraphofaparameterinthenetworkvarieswiththetrainingtimes0200400600AOO100Oia«A:e图19CNN和SRU集成预测模型中梯度变化Fig.19GradientvariationgraphintheintegratedforecastmodelofCNNandSRU0200400600BOOIOQO图20CNN和LSTM集成预测模型中梯度变化Fig.20 GradientvariationgraphintheintegratedforecastmodelofCNNandLSTM0200«10«00HOO1000图21CNN和GRU集成预测模型中梯度变化Fig.21 GradientvariationgraphintheintegratedforecastmodelofCNNandGRU成预测模型的RMSE下降最快。LSTM和GRU分别在训练的前期和后期存在一定的梯度消失问题,但SRU整个训练过程中一直存在较大的梯度。故在神经网络参数迭代过程中,SRU可以有效地缓解梯度消失问题,其参数收敛得更快,预测效果更好。为了说明在不同预测时域