全文HTML
--> --> -->目前在光伏发电功率预测领域研究热点是基于人工智能的方法, 主要包括机器学习, 以及深度学习[2]神经网络等技术. 2012年, Shi等[3]建立基于支持向量机(SVM)的预测模型, 从预测效果来看机器学习模型明显好于传统数学统计模型. 2016年, Liu等[4]采用最大期望(EM)算法将天气进行聚类, 通过聚类结果, 选出反应预测日天气特点的样本作为输入, 利用小波SVM回归模型进行输出预测, 分类后的机器学习模型表现出更好的预测效果. 2018年, Liu等[5]提出反向传播(BP)神经网络模型, 利用15 kW并网光伏系统的四种光伏输出和气象数据对该方法进行了测试, 在置信度分别为95%, 90%, 85%和80%的置信水平下计算预测区间覆盖率(PICPs), 它们所提出的模型在短期光伏功率输出和相关不确定性的预测方面优于传统的预测方法. 2019年, Gao等[6]提出利用长短记忆神经网络(LSTM)对光伏系统的输出功率进行预测, 该方法使用一年内不同地点的每小时数据集进行评估, LSTM进一步减少了预测误差, 体现出更优的预测效果[7]. 虽然上述的研究取得了不错的结果, 但是他们所采用的模型, 特别是人工神经网络模型, 过多的输入数据、隐含层数和隐含层节点很可能导致网络训练的过拟合、梯度消失和爆炸等问题, 并且单一神经网络模型普遍表现出预测精度不够高等缺点.
针对以上问题与缺点, 本文提出了一种基于遗传算法(GA)优化的卷积长短记忆神经网络混合模型(GA-CNN-LSTM). 首先对数据进行归一化处理去除量纲, 统一数据范围, 然后对历史数据特征进行灰色关联度分析[8], 选取最重要几个特征变量, 达到了降低计算复杂度和提高预测精度的目的. 该模型利用GA算法解决了训练容易陷入局部最小值、收敛速度慢等问题, 同时使用辍学机制[9](Dropout)避免了模型易出现过拟合等缺点, 以及CNN和LSTM相结合的混合神经网络模型明显提高了预测精度, 并且在运行时间上表现出良好的性能.
2
2.1.归一化
数据归一化主要目的是将多种变量的数据统一缩放到一个范围[11], 这样的范围通常是(–1, 1)的一个数值区间, 转换函数为2
2.2.灰色关联度分析
通过分析两个变化量之间的关系, 来衡量两个量之间的关联程度, 以表达一个量对另外一个量的影响程度, 计算其灰色关联度的值通常有以下五个步骤[12]:步骤1 对所有数据进行归一化处理;
步骤2 计算每个样本点的差值绝对值X;
步骤3 找出样本点的最大值和最小值MAX, MIN;
步骤4 计算每个对应的关联系数Y, 公式如(2)式所示:
通过归一化和灰色关联度分析后得出结果如表1所列, 其中实发辐照度的关联度值最高, 压强的关联度值最小. 在风况数据特征中, 虽然风速和风向与功率相关程度相近, 但是风速对光伏板的影响更为直接, 一方面, 风速越大光伏板的表面积尘越少, 进而使得光伏板实际接收到的辐照度越大; 另一方面, 在白天工作时, 风速越大光伏板表面散热效果越好, 光伏板表面温度降低, 有利于光伏输出. 实验数据分析选取前四个相关联程度最高的特征变量(实发辐照度、湿度、温度、风速)作为下一步算法模型的输入数据样本变量. 这样的筛选, 一方面减少了特征数量, 有助于降低计算成本; 另一方面, 通过选择相关联程度更高的特征量有利于提高模型预测精度.
变量特征 | 风速 | 风向 | 温度 | 压强 | 湿度 | 实发辐照度 |
Y | 0.34 | 0.28 | 0.45 | 0.01 | 0.62 | 0.97 |
表1灰色关联度分析值
Table1.Grey relational analysis value.

Figure1. CNN-LSTM hybrid algorithm model.
2
3.1.卷积神经网络(CNN)
CNN是一种专门用于处理具有已知网格状拓扑结构的数据的神经网络[14]. 例如, 时间序列数据可以看作是按一定时间间隔采样的一维网格, 图像数据可以看作是由像素组成的二维网格, 在计算时, 网络主要采用了一种称为卷积的数学运算. 卷积是一种特殊的线性运算, 由它来代替一般矩阵计算可以达到多倍的运算效果[15]. 随着CNN的发展, 出现了许多卷积网络结构的变体, 但它们的基本结构大多相似, 包括输入层、卷积层、池化层、全连接层和输出层[16]. 由于本文实验数据是以时间序列为主, 所以本文采用的是一维的卷积神经网络结构, 如图2所示, 这样的选择避免了前期输入和后期输出数据维度的转换. 一维卷积核以时间步长单一方向的滑动为主, 这样的设置更有利于对时间序列数据的卷积处理.
Figure2. One dimensional convolutional neural network structure.
2
3.2.长短记忆神经网络(LSTM)
LSTM网络是一种递归神经网络[17](RNN). 与所有的递归神经网络一样, LSTM可以计算传统计算机在具有足够网络元素情况下的数据, 特别对时序数据能够体现更好的优势. 它的大体结构如图3所示.
Figure3. LSTM neural network structure.
图中三个模块框部分可以看成三个细胞结构, 前后两个细胞A代表前一个时刻和后一个时刻的细胞状态, 中间的细胞是当前时刻的状态, 它可以分为三个门控部分, 分别表示遗忘门、输入门、输出门[18]. 三个门接收前一个时间状态的LSTM输出值ht-1和当前时间的输入数据xt作为输入[19]. 遗忘门部分的ft可以看成是由输入的xt和ht–1得到, 用来控制ct–1中的信息的遗忘程度, ft中的每个值都是属于[0, 1]的范围, 下界值0代表完全遗忘, 上界值1代表完全不变, 可以保留下来[20]. 遗忘门决定了前一个时期状态信息的遗忘程度, 之后输入门的作用就是往当前状态信息中添加新的内容[21]. 同样, 输入门部分由输入的xt和ht–1得到当前的it用以控制当前状态信息的更新程度. 这里当前状态信息cg也是通过输入的xt和ht–1计算得出. 那么当前新的状态信息ct就很显然可以通过下面的公式计算得出, 通俗地说就是遗忘一些旧信息, 更新一些新信息进去[22]. 最后就是输出门部分, 类似地, 根据xt和ht–1计算得出ot用以控制哪些信息需要作为输出. 具体计算公式为:
2
3.3.遗传算法(GA)
遗传算法(GA)是模拟生物进化进行个体的选择、交叉和变异的一种算法, 它的主要核心是参数编码、初始群的设定和适应函数的确定, 然后通过最终的搜索得到最优解[23]. 本论文采用GA优化LSTM神经网络训练时权值以及偏置的确定计算, 优化改进模型流程如图4所示.
Figure4. Optimization process of genetic algorithm.


实验对本文提出的GA-CNN-LSTM算法模型进行测试, 同时与CNN, LSTM两个单一神经网络模型和未经优化的CNN-LSTM混合神经网络模型的预测结果进行比较. 本实验不仅考量模型的预测误差性能指标, 还考量整个模型的训练和测试运行时间.
2
5.1.多种模型实验误差性能对比结果
实验对LSTM, CNN两个单神经网络模型和CNN-LSTM混合神经网络算法模型, 以及一种经过GA优化过的CNN-LSTM混合神经网络算法模型进行性能测试. 实验测试结果如图5—图8所示, 分别为四种模型截取一周预测数据的时间与发电功率的关系图, 选取每15 min为一个间隔的发电输出功率值, 其中红线代表实际发电输出功率, 绿线代表预测发电输出功率. 单方面从图的预测线和实际线重合程度来看, 经GA优化的CNN-LSTM混合神经网络模型明显优于其他三种模型, 特别是在夜晚时间呈现的拟合情况, 预测值更贴近于实际值.
Figure5. Power diagram of CNN model prediction.

Figure6. Power diagram of LSTM model prediction.

Figure7. Power diagram of CNN-LSTM model prediction.

Figure8. Power diagram of GA-CNN-LSTM model prediction.
进一步通过具体的预测误差指标分析, 如表2所列, 在MAE和MAPE指标下, LSTM预测值呈现性能最差, CNN模型次之, GA-CNN-LSTM预测最好. 特别是在MAPE指标下, GA-CNN-LSTM比单一神经网络模型最好的结果减少了1.537%的误差, 比未经优化的CNN-LSTM混合神经网络算法模型减少了0.873%的误差. 在MSE和RMSE指标下, CNN模型预测值呈现性能最差, LSTM模型次之, GA-CNN-LSTM预测效果依然是最好的. 尤其是在RMSE指标下, GA-CNN-LSTM比CNN-LSTM减少了8.108%的误差, 体现了GA训练超参数的优势, 不仅避免了模型训练过拟合, 同时防止了梯度消失和爆炸的情况发生, 提高模型结果预测精度. 综合图像和图表结果, 本文提出的GA-CNN-LSTM模型在各种误差指标下都呈现最优效果, 而且相对于单一神经网络模型, 混合的神经网络模型的预测性能更好, 充分表现了CNN-LSTM混合模型既保留了CNN在空间特征提取的优势也发挥了LSTM在时间特征提取的优势.
模型 | CNN | LSTM | CNN-LSTM | GA-CNN-LSTM |
MAE | 0.34765 | 0.36681 | 0.28763 | 0.21424 |
MSE | 0.65034 | 0.63447 | 0.60437 | 0.58529 |
RMSE | 0.80643 | 0.77431 | 0.69321 | 0.61213 |
MAPE | 0.06013 | 0.06233 | 0.05439 | 0.04476 |
表2模型预测误差指标
Table2.Error index of model prediction.
2
5.2.多种算法模型运行时间对比结果
从运行时间方面来看, 具体训练与测试时间值如表3所列. 首先在训练时, CNN和LSTM两个单神经网络模型所耗时间分别是456.434和51.576 s, 而混合神经网络模型CNN-LSTM和GA-CNN-LSTM所耗时间分别为611.88和503.74 s. 其次在测试时, CNN, LSTM, CNN-LSTM和GA-CNN-LSTM四个模型所耗时间分别是1.13, 1.22, 3.69和2.77 s. 单一神经网络模型消耗训练时间和测试时间都相对较少, 但是综合误差性能, 混合神经网络模型更具性价比, 尤其是经过GA优化后的混合算法模型更具优势.模型 | CNN | LSTM | CNN-LSTM | GA-CNN-LSTM |
训练时间/s | 456.434 | 51.576 | 611.880 | 503.740 |
测试时间/s | 1.130 | 1.220 | 3.690 | 2.770 |
表3模型运行时间
Table3.Model running time.
1)采用归一化处理和灰色关联度分析, 降低了数据的维度, 减少了计算成本, 同时通过保留相关性较高的数据特征有助于为后期提高模型精度作准备;
2)通过将CNN和LSTM混合, 等同于将两种神经网络在空间特征与时间特征提取的优势相结合. 在MAPE误差指标下, CNN-LSTM混合模型比单一神经网络模型最好的结果减少了0.574%误差, 能够进一步提高模型精度;
3)经GA优化LSTM训练后所得的GA-CNN-LSTM混合神经网络模型, 改进了传统梯度下降法的训练缺点. 在MAPE误差指标下, 比未经优化的CNN-LSTM混合神经网络算法模型减少了0.873%的误差, 表现出更高的预测精度;
4)从训练与测试运行时间来看, GA-CNN-LSTM模型所花费时间略高于单个神经网络模型, 但劣势不是太明显.
综合预测性能和运行时间比较结果, GA-CNN-LSTM模型在光伏预测系统以及整个光伏发电站运维工作中, 具有一定的应用价值.