删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于遗传算法优化卷积长短记忆混合神经网络模型的光伏发电功率预测

本站小编 Free考研考试/2021-12-29

摘要:光伏发电受天气与地理环境影响, 呈现出波动性和随机多干扰性, 其输出功率容易随着外界因素变化而变化, 因此预测发电输出功率对于优化光伏发电并网运行和减少不确定性的影响至关重要. 本文提出一种基于遗传算法(GA)优化的卷积长短记忆神经网络混合模型(GA-CNN-LSTM), 首先利用CNN模块对数据的空间特征提取, 再经过LSTM模块提取时间特征和附近隐藏状态向量, 同时通过GA优化LSTM训练网络的超参数权重与偏置值. 在初期对历史数据进行归一化处理, 以及对所有特征作灰色关联度分析, 提取重要特征降低数据计算复杂度, 然后对本文提出来的经GA优化后的CNN-LSTM混合神经网络(GA-CNN-LSTM)算法模型进行光伏功率预测实验. 同时与CNN, LSTM两个单一神经网络模型以及未经GA优化的CNN-LSTM混合神经网络模型的预测性能进行比较. 结果显示在平均绝对误差率(MAPE)指标下, 本文提出的GA-CNN-LSTM算法模型比单一神经网络模型最好的结果减少了1.537%的误差, 同时比未经优化的CNN-LSTM混合神经网络算法模型减少了0.873%的误差. 本文的算法模型对光伏发电功率具有更好的预测性能.
关键词: 光伏发电/
人工智能/
卷积神经网络/
长短记忆神经网络

English Abstract


--> --> -->
随着全球传统化石能源日益枯竭, 并且污染严重, 能源危机与环境问题渐显突出. 当前光伏新能源具有清洁、可持续性等特点, 越来越受到人们的重视. 但是近些年我国新能源遭遇严重的弃光问题. 光伏发电受天气等多种因素影响呈现出波动不稳定[1], 所以在其并网输出电力使用时, 提前预测发电输出功率变得尤其重要.
目前在光伏发电功率预测领域研究热点是基于人工智能的方法, 主要包括机器学习, 以及深度学习[2]神经网络等技术. 2012年, Shi等[3]建立基于支持向量机(SVM)的预测模型, 从预测效果来看机器学习模型明显好于传统数学统计模型. 2016年, Liu等[4]采用最大期望(EM)算法将天气进行聚类, 通过聚类结果, 选出反应预测日天气特点的样本作为输入, 利用小波SVM回归模型进行输出预测, 分类后的机器学习模型表现出更好的预测效果. 2018年, Liu等[5]提出反向传播(BP)神经网络模型, 利用15 kW并网光伏系统的四种光伏输出和气象数据对该方法进行了测试, 在置信度分别为95%, 90%, 85%和80%的置信水平下计算预测区间覆盖率(PICPs), 它们所提出的模型在短期光伏功率输出和相关不确定性的预测方面优于传统的预测方法. 2019年, Gao等[6]提出利用长短记忆神经网络(LSTM)对光伏系统的输出功率进行预测, 该方法使用一年内不同地点的每小时数据集进行评估, LSTM进一步减少了预测误差, 体现出更优的预测效果[7]. 虽然上述的研究取得了不错的结果, 但是他们所采用的模型, 特别是人工神经网络模型, 过多的输入数据、隐含层数和隐含层节点很可能导致网络训练的过拟合、梯度消失和爆炸等问题, 并且单一神经网络模型普遍表现出预测精度不够高等缺点.
针对以上问题与缺点, 本文提出了一种基于遗传算法(GA)优化的卷积长短记忆神经网络混合模型(GA-CNN-LSTM). 首先对数据进行归一化处理去除量纲, 统一数据范围, 然后对历史数据特征进行灰色关联度分析[8], 选取最重要几个特征变量, 达到了降低计算复杂度和提高预测精度的目的. 该模型利用GA算法解决了训练容易陷入局部最小值、收敛速度慢等问题, 同时使用辍学机制[9](Dropout)避免了模型易出现过拟合等缺点, 以及CNN和LSTM相结合的混合神经网络模型明显提高了预测精度, 并且在运行时间上表现出良好的性能.
本研究采用DC竞赛光伏发电输出功率预测数据[10], 截取其中66860组单年份数据作分析, 其中有风速、风向、温度、压强、湿度和实发辐照度为输入变量特征, 输出为实际发电功率. 我们首先对数据进行预处理, 将所有输入数据特征进行数据标准化, 去除量纲, 便于一致性分析, 然后采取灰色关联度分析筛选其中与输出实际发电功率相关程度更高的变量特征, 降低整体计算的复杂度, 同时能提高模型的精度.
2
2.1.归一化
-->数据归一化主要目的是将多种变量的数据统一缩放到一个范围[11], 这样的范围通常是(–1, 1)的一个数值区间, 转换函数为
$x' = \frac{{2[x - 0.5(\max + \min )]}}{{\max - \min }},$
其中max为样本数据的最大值, min为样本数据的最小值. x为当前样本点的值, x' 为归一化转换计算所得的数值. 通过统一的归一化处理有利于加快模型的收敛速度, 同时能提升其计算结果的精度.
2
2.2.灰色关联度分析
-->通过分析两个变化量之间的关系, 来衡量两个量之间的关联程度, 以表达一个量对另外一个量的影响程度, 计算其灰色关联度的值通常有以下五个步骤[12]:
步骤1 对所有数据进行归一化处理;
步骤2 计算每个样本点的差值绝对值X;
步骤3 找出样本点的最大值和最小值MAX, MIN;
步骤4 计算每个对应的关联系数Y, 公式如(2)式所示:
$Y = \frac{{{\rm{MIN}} + 0.5 {\rm{MAX}}}}{{X + 0.5 {\rm{MAX}}}};$
步骤5 对每列的所有关联系数Y做平均计算, 得出结果. 结果越接近于1, 相关联程度越高.
通过归一化和灰色关联度分析后得出结果如表1所列, 其中实发辐照度的关联度值最高, 压强的关联度值最小. 在风况数据特征中, 虽然风速和风向与功率相关程度相近, 但是风速对光伏板的影响更为直接, 一方面, 风速越大光伏板的表面积尘越少, 进而使得光伏板实际接收到的辐照度越大; 另一方面, 在白天工作时, 风速越大光伏板表面散热效果越好, 光伏板表面温度降低, 有利于光伏输出. 实验数据分析选取前四个相关联程度最高的特征变量(实发辐照度、湿度、温度、风速)作为下一步算法模型的输入数据样本变量. 这样的筛选, 一方面减少了特征数量, 有助于降低计算成本; 另一方面, 通过选择相关联程度更高的特征量有利于提高模型预测精度.
变量特征风速风向温度压强湿度实发辐照度
Y0.340.280.450.010.620.97


表1灰色关联度分析值
Table1.Grey relational analysis value.

本文采用遗传算法(GA)优化后的CNN-LSTM混合算法模型, 如图1所示. 模型结构主要由卷积神经网络和长短记忆神经网络组成, 先由卷积神经网络提取数据的空间特征[13], 再由长短记忆神经网络提取时间特征. 整个模型结合了两种神经网络的优势, 并且在训练LSTM神经网络的超参数时, 网络的权重系数和偏置值由GA更新计算, 替换了传统的梯度下降法的训练方法, 使得整个训练学习的过程得到了优化.
图 1 CNN-LSTM混合算法模型
Figure1. CNN-LSTM hybrid algorithm model.

2
3.1.卷积神经网络(CNN)
-->CNN是一种专门用于处理具有已知网格状拓扑结构的数据的神经网络[14]. 例如, 时间序列数据可以看作是按一定时间间隔采样的一维网格, 图像数据可以看作是由像素组成的二维网格, 在计算时, 网络主要采用了一种称为卷积的数学运算. 卷积是一种特殊的线性运算, 由它来代替一般矩阵计算可以达到多倍的运算效果[15]. 随着CNN的发展, 出现了许多卷积网络结构的变体, 但它们的基本结构大多相似, 包括输入层、卷积层、池化层、全连接层和输出层[16]. 由于本文实验数据是以时间序列为主, 所以本文采用的是一维的卷积神经网络结构, 如图2所示, 这样的选择避免了前期输入和后期输出数据维度的转换. 一维卷积核以时间步长单一方向的滑动为主, 这样的设置更有利于对时间序列数据的卷积处理.
图 2 一维卷积神经网络结构[14]
Figure2. One dimensional convolutional neural network structure.

2
3.2.长短记忆神经网络(LSTM)
-->LSTM网络是一种递归神经网络[17](RNN). 与所有的递归神经网络一样, LSTM可以计算传统计算机在具有足够网络元素情况下的数据, 特别对时序数据能够体现更好的优势. 它的大体结构如图3所示.
图 3 LSTM神经网络结构[17]
Figure3. LSTM neural network structure.

图中三个模块框部分可以看成三个细胞结构, 前后两个细胞A代表前一个时刻和后一个时刻的细胞状态, 中间的细胞是当前时刻的状态, 它可以分为三个门控部分, 分别表示遗忘门、输入门、输出门[18]. 三个门接收前一个时间状态的LSTM输出值ht-1和当前时间的输入数据xt作为输入[19]. 遗忘门部分的ft可以看成是由输入的xtht1得到, 用来控制ct1中的信息的遗忘程度, ft中的每个值都是属于[0, 1]的范围, 下界值0代表完全遗忘, 上界值1代表完全不变, 可以保留下来[20]. 遗忘门决定了前一个时期状态信息的遗忘程度, 之后输入门的作用就是往当前状态信息中添加新的内容[21]. 同样, 输入门部分由输入的xtht–1得到当前的it用以控制当前状态信息的更新程度. 这里当前状态信息cg也是通过输入的xtht1计算得出. 那么当前新的状态信息ct就很显然可以通过下面的公式计算得出, 通俗地说就是遗忘一些旧信息, 更新一些新信息进去[22]. 最后就是输出门部分, 类似地, 根据xtht1计算得出ot用以控制哪些信息需要作为输出. 具体计算公式为:
${f_t} = \sigma \left( {{{{w}}_f}\left[ {{h}_{ t- 1},{x_t}} \right] + {{{b}}_f}} \right),$
${i_t} = \sigma \left( {{{{w}}_i}\left[ {{h}_{ t- 1},{x_t}} \right] + {{{b}}_i}} \right),$
${h_t} = {\rm{tanh}}\left( {{{{w}}_g}\left[ {{h}_{t - 1},{x_t}} \right] + {{{b}}_g}} \right),$
${c_t} = {f_t} \times {c_t} - 1 + {i_t} \times {g_{t}},$
${o_t} = \sigma ({{{w}}_{\rm{o}}}\left[ {{h}_{ t- 1},{x_t}} \right] + {{{b}}_{\rm{o}}},$
${h_t} = {o_t} \times {\rm{tanh}}\left( {{c_t}} \right),$
其中wb表示上述门的权矩阵和偏置向量, Ct表示存储单元, σ和tanh代表s型函数和双曲正切激活函数.
2
3.3.遗传算法(GA)
-->遗传算法(GA)是模拟生物进化进行个体的选择、交叉和变异的一种算法, 它的主要核心是参数编码、初始群的设定和适应函数的确定, 然后通过最终的搜索得到最优解[23]. 本论文采用GA优化LSTM神经网络训练时权值以及偏置的确定计算, 优化改进模型流程如图4所示.
图 4 遗传算法优化流程
Figure4. Optimization process of genetic algorithm.

在衡量模型预测的性能时, 通常选取以下四个误差指标: 平均绝对误差(MAE)、平均平方差(MSE)、平均平方根误差(RMSE)和平均绝对误差率(MAPE). MAE是一种基础性的考察误差的指标; MSE作为平方效果后的误差, 侧重放大偏差较大的误差, 可评估出一个模型的稳定性; RMSE作为一种方均根误差对异常点比较敏感[24]; MAPE不仅考虑预测值与真实值的误差, 同时它更能显现出误差与真实值的比率[25]. 假定预测值为$ x = \{x_1, x_2, x_3, x_4,\cdots, x_n\} $, 真实值为$ y = \{y_1, y_2, y_3, y_4, \cdots, y_n\} $, 四种指标的计算为:
${\rm{MAE}} = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {{x_i} - {y_i}} \right|} ,$
${\rm{MSE}} = \frac{1}{n}\sum\limits_{i = 1}^n {({x_i}} - {y_i}{)^2},$
${\rm{RMSE}} = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {({x_i}} - {y_i}{)^2}} ,$
${\rm{MAPE}} = \frac{{100{\%} }}{n}\sum\limits_{i = 1}^n {\left| {\frac{{{x_i} - {y_i}}}{{{y_i}}}} \right|} .$

为验证算法模型的可行性, 本文选取前期预处理好的实验数据集, 将80%的数据作为训练集, 剩余20%的数据作为测试集. 实验选择在电脑上进行, CPU配置为Inter Core I7-3770k, 频率为3.60 GHZ, 显卡为MX250, 系统为win10, 程序代码选择python3.6版本, 编辑器是pycharm.
实验对本文提出的GA-CNN-LSTM算法模型进行测试, 同时与CNN, LSTM两个单一神经网络模型和未经优化的CNN-LSTM混合神经网络模型的预测结果进行比较. 本实验不仅考量模型的预测误差性能指标, 还考量整个模型的训练和测试运行时间.
2
5.1.多种模型实验误差性能对比结果
-->实验对LSTM, CNN两个单神经网络模型和CNN-LSTM混合神经网络算法模型, 以及一种经过GA优化过的CNN-LSTM混合神经网络算法模型进行性能测试. 实验测试结果如图5图8所示, 分别为四种模型截取一周预测数据的时间与发电功率的关系图, 选取每15 min为一个间隔的发电输出功率值, 其中红线代表实际发电输出功率, 绿线代表预测发电输出功率. 单方面从图的预测线和实际线重合程度来看, 经GA优化的CNN-LSTM混合神经网络模型明显优于其他三种模型, 特别是在夜晚时间呈现的拟合情况, 预测值更贴近于实际值.
图 5 CNN模型预测功率图
Figure5. Power diagram of CNN model prediction.

图 6 LSTM模型预测功率图
Figure6. Power diagram of LSTM model prediction.

图 7 CNN-LSTM模型预测功率图
Figure7. Power diagram of CNN-LSTM model prediction.

图 8 GA-CNN-LSTM模型预测功率图
Figure8. Power diagram of GA-CNN-LSTM model prediction.

进一步通过具体的预测误差指标分析, 如表2所列, 在MAE和MAPE指标下, LSTM预测值呈现性能最差, CNN模型次之, GA-CNN-LSTM预测最好. 特别是在MAPE指标下, GA-CNN-LSTM比单一神经网络模型最好的结果减少了1.537%的误差, 比未经优化的CNN-LSTM混合神经网络算法模型减少了0.873%的误差. 在MSE和RMSE指标下, CNN模型预测值呈现性能最差, LSTM模型次之, GA-CNN-LSTM预测效果依然是最好的. 尤其是在RMSE指标下, GA-CNN-LSTM比CNN-LSTM减少了8.108%的误差, 体现了GA训练超参数的优势, 不仅避免了模型训练过拟合, 同时防止了梯度消失和爆炸的情况发生, 提高模型结果预测精度. 综合图像和图表结果, 本文提出的GA-CNN-LSTM模型在各种误差指标下都呈现最优效果, 而且相对于单一神经网络模型, 混合的神经网络模型的预测性能更好, 充分表现了CNN-LSTM混合模型既保留了CNN在空间特征提取的优势也发挥了LSTM在时间特征提取的优势.
模型CNNLSTMCNN-LSTMGA-CNN-LSTM
MAE0.347650.366810.287630.21424
MSE0.650340.634470.604370.58529
RMSE0.806430.774310.693210.61213
MAPE0.060130.062330.054390.04476


表2模型预测误差指标
Table2.Error index of model prediction.

2
5.2.多种算法模型运行时间对比结果
-->从运行时间方面来看, 具体训练与测试时间值如表3所列. 首先在训练时, CNN和LSTM两个单神经网络模型所耗时间分别是456.434和51.576 s, 而混合神经网络模型CNN-LSTM和GA-CNN-LSTM所耗时间分别为611.88和503.74 s. 其次在测试时, CNN, LSTM, CNN-LSTM和GA-CNN-LSTM四个模型所耗时间分别是1.13, 1.22, 3.69和2.77 s. 单一神经网络模型消耗训练时间和测试时间都相对较少, 但是综合误差性能, 混合神经网络模型更具性价比, 尤其是经过GA优化后的混合算法模型更具优势.
模型CNNLSTM CNN-LSTMGA-CNN-LSTM
训练时间/s456.43451.576611.880503.740
测试时间/s1.1301.2203.6902.770


表3模型运行时间
Table3.Model running time.

为了保证光伏发电与电网电力供需平衡, 进一步提高光伏发电预测的准确率, 本文提出了基于遗传算法(GA)优化CNN-LSTM混合神经网络的模型, 通过数据处理和算法模型实验分析表明:
1)采用归一化处理和灰色关联度分析, 降低了数据的维度, 减少了计算成本, 同时通过保留相关性较高的数据特征有助于为后期提高模型精度作准备;
2)通过将CNN和LSTM混合, 等同于将两种神经网络在空间特征与时间特征提取的优势相结合. 在MAPE误差指标下, CNN-LSTM混合模型比单一神经网络模型最好的结果减少了0.574%误差, 能够进一步提高模型精度;
3)经GA优化LSTM训练后所得的GA-CNN-LSTM混合神经网络模型, 改进了传统梯度下降法的训练缺点. 在MAPE误差指标下, 比未经优化的CNN-LSTM混合神经网络算法模型减少了0.873%的误差, 表现出更高的预测精度;
4)从训练与测试运行时间来看, GA-CNN-LSTM模型所花费时间略高于单个神经网络模型, 但劣势不是太明显.
综合预测性能和运行时间比较结果, GA-CNN-LSTM模型在光伏预测系统以及整个光伏发电站运维工作中, 具有一定的应用价值.
相关话题/数据 计算 优化 指标 实验

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 确定大气边界层顶高度的新方法及数值实验
    摘要:提出了一种确定大气边界层顶高度的数值微分新方法,该方法使用了正则化技术,把对弯角廓线求导数的数值微分问题转化为求目标泛函极小值的问题,采用双参数模型函数方法来选择正则化参数,最后利用最大梯度法确定边界层顶高度.首先通过两个数值实验验证了新方法的有效性,实验结果显示,随着掩星资料噪音的增多,由差 ...
    本站小编 Free考研考试 2021-12-29
  • 爆轰加载下高纯铜界面Rayleigh-Taylor不稳定性实验研究
    摘要:金属界面不稳定性是内爆物理压缩过程中关注的重要问题,与传统流体界面不稳定性具有显著区别.由于相关理论和实验诊断技术的限制,目前该问题的研究还明显不足.为加深对金属界面不稳定性扰动增长行为的认识,本文建立了爆轰加载下高纯铜界面Rayleigh-Taylor不稳定性研究的实验诊断技术和数据处理方法 ...
    本站小编 Free考研考试 2021-12-29
  • 网络直播平台数据挖掘与行为分析综述
    摘要:随着移动通信和互联网技术的不断发展,网络直播逐渐成为了新媒体环境下人们青睐的在线娱乐和信息传播方式.目前广泛应用于课堂教学、真人秀、电竞赛事、品牌营销等方面.数百万主播与数亿计观众的活跃加入和互动,产生了丰富的在线人群行为活动数据,为开展大规模人群行为动力学、平台内容推荐与检测、在线社群演化等 ...
    本站小编 Free考研考试 2021-12-29
  • 蚁群元胞优化算法在人群疏散路径规划中的应用
    摘要:针对疏散路径规划问题,以栅格化地图为背景的基础上,提出了蚁群元胞优化算法.首先为统一仿真时间步长,建立以六边形元胞为基础的栅格地图;然后利用静态势场对启发函数进行优化,利用分段更新规则优化信息素更新方式;最后,将模型参数作为粒子群优化算法的粒子位置信息进行优化,求解参数的最优组合值.仿真结果表 ...
    本站小编 Free考研考试 2021-12-29
  • 纳米流体液滴内的光驱流动实验及其解析解
    摘要:在光透过性的流体介质中添加具有高光响应特性的纳米颗粒,可以形成光驱动纳米流体,实现对光能的高效利用.本文针对光驱纳米流体流动行为开展实验观察和理论分析研究,这是实现光驱纳米流动精确调控的理论基础.首先利用粒子图像测速技术对液滴中直径为300nm的Fe3O4颗粒在不同光源照射下受Marangon ...
    本站小编 Free考研考试 2021-12-29
  • 涡轮导向器对旋转爆轰波传播特性影响的实验研究
    摘要:为了研究涡轮导向器对旋转爆轰波传播特性的影响,以氢气为燃料,空气为氧化剂,在不同当量比下开展了实验研究.基于高频压力传感器及静态压力传感器的信号,详细分析了带涡轮导向器的旋转爆轰燃烧室的工作模式以及涡轮导向器对非均匀不稳定爆轰产物的影响.实验结果表明:在当量比较低时,爆轰燃烧室以快速爆燃模式工 ...
    本站小编 Free考研考试 2021-12-29
  • Ar原子序列双光双电离产生光电子角分布的理论计算
    摘要:基于多组态Dirc-Fock方法和密度矩阵理论,给出了原子序列双光双电离光电子角分布的计算表达式,发展了相应的计算程序.利用该程序对Ar原子3p壳层序列双光双电离过程进行了理论研究,给出了光电离的总截面、磁截面、剩余离子取向以及光电子角分布的各向异性参数与入射光子能量的函数关系.结果显示在光电 ...
    本站小编 Free考研考试 2021-12-29
  • 东方超环上低杂波驱动等离子体环向旋转实验研究
    摘要:旋转和旋转剪切能抑制磁流体不稳定性和增强等离子体约束.低杂波电流驱动作为未来聚变堆上可能的旋转驱动手段,探索低杂波在现有托卡马克装置上驱动等离子体旋转的驱动机制,可以为未来的聚变堆上旋转预测提供重要参考.在东方超环托卡马克装置上,早期发现了2.45GHz的低杂波能有效驱动等离子体旋转的现象,认 ...
    本站小编 Free考研考试 2021-12-29
  • 热光伏能量转换器件的热力学极限与优化性能预测
    摘要:受不可逆损失的影响,热光伏能量转换器件在高品位热能回收与利用方面受到限制.本文揭示不可逆损失来源,提供热光伏能量转换器件性能提升方案.利用半导体物理和普朗克热辐射理论,确定热光伏能量转换器件在理想条件下的最大效率.进而考虑Auger与Shockley-Reed-Hall非辐射复合和不可逆传热损 ...
    本站小编 Free考研考试 2021-12-29
  • 肖特基钙钛矿太阳电池结构设计与优化
    摘要:有机-无机杂化钙钛矿材料有高吸收系数、低廉的制作成本以及较为简单的制备工艺,在近年来表现出良好的发展前景.本文采用wx-AMPS模拟软件对平面结构钙钛矿太阳电池和肖特基钙钛矿太阳电池进行建模仿真对比,从理论上分析无载流子传输层的肖特基钙钛矿太阳电池的优势.结果显示,器件两侧电极功函数和吸收层的 ...
    本站小编 Free考研考试 2021-12-29