常用的OFDM系统信道估计算法有最小二乘(Least Squares,LS)算法[1]、最小均方误差(Minimum Mean Square Error,MMSE)[2]、线性最小均方误差(Linear Minimum Mean Square Error, LMMSE)[3]等。LS复杂度最低,但因其未考虑噪声的影响,误码率偏大;MMSE和LMMSE利用了信道统计特性且考虑了噪声的影响,性能较为理想,但是这种性能优势是以事先知道信道先验信息为前提的,而事实上得到这种信息很难。近年来将深度学习运用到无线传输物理层的浪潮开始兴起,其中不乏有信道估计与信号检测[4-7]、信道/信源编码译码[8-10]、调制与解调[11-13]等。Ye等首次利用深度神经网络(Deep Neural Network, DNN)代替OFDM系统接收端信道估计与均衡、信号检测等多个模块,实验表明在导频数目少的情况下,明显优于传统LS、MMSE算法[4]。文献[14]在瑞利衰落信道下进行基于深度学习的信道估计,仿真结果表明,相对于LMMSE算法有2 dB性能增益。然而,此类基于深度学习的通信接收方法存在DNN结构复杂、运算量大、收敛速度慢的问题,且未考虑非线性和多径同时存在的复杂情况。
本文针对多径效应和功放非线性的影响,简化DNN结构、优化DNN运用方式,提出一种基于模型驱动的全连接神经OFDM接收机,其主要作用是促进通信系统中的信道估计、均衡、信号检测模块,取名“LSZF-Net”。结构为:在接收端利用LS信道估计和迫零(Zero Forcing, ZF)算法信道均衡[15]对接收端信号进行预处理,再经过一层全连接神经网络进一步补偿多径效应和非线性失真,从而获得更小的系统复杂度和更优的性能。
1 基于DNN的OFDM系统模型 1.1 非线性和多径影响下的OFDM系统 图 1为非线性和多径影响下的OFDM系统框图。HPA的输出信号表现为调幅-调幅(AM-AM)和调幅-调相(AM-PM)效应,采用无记忆非线性放大的Saleh模型[16]的幅度和相位分别为
图 1 非线性和多径影响下的OFDM系统 Fig. 1 OFDM system under influence of nonlinearity and multi-path |
图选项 |
(1) |
(2) |
式中:r(m)为信号的幅度,m为时间序列;A(·)为失真后信号的幅度;?(·)为失真后信号的相位;a1、b1、a2、b2为Saleh模型参数。
设一个OFDM符号含有N个子载波数,则第k个子载波上的多径信道频域响应和一个OFDM符号离散化后的信道冲激响应分别为
(3) |
(4) |
式中:αl为第l条路径上的信道增益;nl为第l条信道的时延;fc为中心采样频率;L为总的路径数;σ(n-nl)为第l条路径信号的冲激响应。
1.2 基于神经网络的OFDM系统神经网络接收机 不同于传统OFDM接收机和文献[4]的DNN接收机(在接收端FFT解调直接输入到DNN中进行信号恢复),本文设计的接收机如图 2所示。首先,在接收端将接收信号循环前缀移除,并进行FFT解调。其次,利用LS算法和ZF算法对即将输入到神经网络的数据进行预处理。选择LS信道估计和ZF信道均衡做预处理的原因是:这2种算法计算复杂度较低,且能减轻神经网络信道补偿的工作量,从而减少网络神经元个数和隐含层的层数(神经网络是复杂函数逼近器[11],系统函数越复杂,越需要更多的神经元和网络层去拟合此复杂函数)。最后,将预处理后的信号取实部和虚部串联输入到全连接神经网络进行回归预测,判决之后就是恢复出的比特流。此全连接网络只含有输入层和输出层,没有隐藏层。文献[4]的网络只是基于数据驱动的网络模型[17-18],而本文提出的LSZF-Net综合了数据驱动和模型驱动2种方式的优点,同时发挥了机器学习和传统先验知识的作用。
图 2 神经网络接收机结构 Fig. 2 Neural network receiver architecture |
图选项 |
1.3 LSZF-Net模型训练和数据产生 每一次仿真首先随机生成0、1序列作为OFDM系统的输入数据流,根据文献[4]和文献[14]的OFDM的帧结构设计方案,即帧结构为2个符号(数据(Data)符号和导频(Pilot)符号),如图 3所示。神经网络为一层全连接层结构,输入层和输出层神经元个数为2个OFDM符号的实部和虚部串联个数的总和,数据的产生流程如图 4所示。数据流首先经过QPSK映射;然后插入预设好的导频序列,导频结构为块状类型排列;最后将插入导频后的符号实部和虚部串联形成神经网络的标签。在接收端首先对接收信号进行去循环前缀和FFT解调操作;然后利用LS算法和ZF算法对信号进行预处理;最后,将预处理后的信号取实部和虚部串联,得到神经网络的输入样本。
图 3 发送端OFDM帧结构 Fig. 3 OFDM frame structure at transmitter |
图选项 |
图 4 数据产生流程 Fig. 4 Flowchart of data generation |
图选项 |
文献[4]已经证明在导频数量不足的情况下,采用DNN做信道估计明显优于传统算法。因此为了展现LSZF-Net性能的优越性,本文设置导频插入的间隔为1,这样便能保证足够多的导频数量、传统信道估计方法性能较优情况下与LSZF-Net做BER性能对比。OFDM参数设置和LSZF-Net训练参数设置如表 1所示。
表 1 训练参数设置 Table 1 Training parameter setting
OFDM参数 | 数值 |
CP长度 | 16 |
导频长度 | 64 |
信噪比/dB | 0:5:25 |
epoch | 3 000 |
初始学习率 | 0.001 |
注:OFDM帧结构为导频+数据;调制方式为QPSK; LSZF-Net无隐藏层;激活函数为tanh;优化器为rmsprop;损失函数为L2。 |
表选项
2 不同信道条件仿真分析 2.1 多径信道和非线性仿真 本文采用的多径信道为平均功率随着信道时延按指数递减的信道模型[19],用有限脉冲响应滤波器的输出表示信道的脉冲响应,每一个抽头的时间设为采样周期Ts的整数倍,其功率服从指数分布,其功率延时函数(Power Delay Profile, PDP)为
(5) |
式中:τ为信道时延;τrms为均方根时延扩展,最大路径数取决于Ts和τrms,即10τrms/Ts,本文τrms设为0.3、0.5、0.7个采样周期,所以信道最大路径时延为3、5、7个采样周期[20]。最终得到信道信道条件(脉冲响应h的取值)见表 2。非线性放大的参数为:
表 2 多径信道条件 Table 2 Multi-path channel conditions
τrms | 信道条件 |
0.3Ts | h=0.544 6+1.097 5i, 0.102 9+0.207 3i, 0.019 4+0.039 2i, 0.003 7+0.007 4i |
0.5Ts | h=0.821 8+0.542 5i, 0.302 3+0.199 6i, 0.111 2+0.073 4i, 0.040 9+0.027 0i, 0.015 1+0.009 9i, 0.005 5+0.003 7i |
0.7Ts | h=0.525 6-0.577 8i, 0.257 3-0.282 9i, 0.126 0-0.138 5i, 0.061 7-0.067 8i, 0.030 2+0.033 2i, 0.014 8-0.016 2i, 0.007 2-008 0i, 0.003 5-0.003 9i |
表选项
1) 第1组非线性参数[21]:a1=2, b1=1, a2=π/6, b2=1。
2) 第2组非线性参数[16]:a1=2.158 7, b1=1.151 7, a2=4.003 3, b2=9.104 0。
3) 第3组非线性系数[16]:a1=1.963 8, b1=0.994 5, a2=2.529 3, b2=2.816 8。
3组非线性参数的AM-AM转换(最大值归一化)曲线和AM-PM转换曲线如图 5所示。仿真结果表明,3组非线性参数AM-AM幅度变换接近,而AM-PM相位变换不同,其中第1组非线性参数相位变换范围最小,最大值为15°;第2组非线性参数下相位变换最大值为22°;第3组非线性参数下相位变换最大值34°。
图 5 AM-AM和AM-PM非线性放大 Fig. 5 AM-AM and AM-PM nonlinear amplification |
图选项 |
2.2 性能分析 仿真对比采用的信道均衡方法均为ZF算法,信道估计方法分别为LS、MMSE、LMMSE。消除非线性干扰的方法是在信号进入放大器之前先对信号进行输入功率回退(Input Back-Off, IBO)[22],使放大器工作在线性区,IBO将导致输入信号功率损失,影响射频发射。
图 6为当传统方法没有进行IBO的情况下,相同的均方误差时延扩展多径信道、相同非线性放大参数,和LSZF-Net进行信号恢复比特率性能对比,SNR为信噪比。仿真结果表明,LSZF-Net接收机明显优于LS、MMSE、LMMSE算法估计。以τrms=0.3Ts为例,从图 6(a)~图 6 (c)可看出,在信噪比为15 dB时,用LS算法进行信道估计BER性能在10-3量级,LMMSE和MMSE因为考虑了噪声且利用了信道统计特性,BER性能比LS估计性能提升,在10-4量级,而LSZF-Net的BER在10-5量级。因此可以得出,LSZF-Net起到了进一步信道补偿与信号检测的作用,不仅比LMMSE和MMSE算法信道估计的性能更好,还避免了事先获取信道自相关特性的操作。
图 6 LSZF-Net与无非线性补偿的传统方法比较 Fig. 6 Comparison between LSZF-Net and traditional methods without non-linear compensation |
图选项 |
图 7为当传统方法进行功率回退情况下,相同的均方误差时延扩展多径信道、相同非线性放大参数,传统方法和LSZF-Net进行信号恢复的误比特率性能对比。LMMSE和MMSE算法信道估计时采用的IBO系数为-2 dB,LS算法做信道估计时采用的IBO系数为-4 dB。图 7(a)~图 7(c)为在第1组非线性参数下3种时延扩展信道的仿真图,图 7(d)~图 7(f)在第2组非线性参数下3种时延扩展信道的仿真图,图 7(g)~图 7(i)在第3组非线性参数下3种时延扩展信道的仿真图。
图 7 LSZF-Net与进行IBO的传统方法比较 Fig. 7 Comparison between LSZF-Net and traditional method after IBO |
图选项 |
图 7仿真结果表明,不同非线性参数下,LSZF-Net与传统算法性能优势不同。其中图 7(a)~图 7(c)为第1组非线性参数下,3种均方误差时延扩展下的多径信道,LSZF-Net性能都稍逊与功率回退2 dB后再进行LMMSE和MMSE估计,但都明显强于功率回退4 dB后再进行LS算法估计;图 7(d)~图 7(f)为第2组非线性参数下,3种均方误差时延扩展下的多径信道,LSZF-Net性能跟功率回退2 dB后的LMMSE和MMSE性能不分上下;而图 7(g)~图 7(i)为第3组非线性参数下,3种多径时延扩展都表明,LSZF-Net性能优于功率回退2 dB后的LMMSE和MMSE算法,且在大于15 dB的高信噪比下LSZF-Net性能优势更明显。由此可以得出,第1组非线性相位变换较小,回退2 dB之后在进行LMMSE或者MMSE信道估计已经能达到较为理想的结果,所以此时LSZF-Net性能优势不那么明显。而非线性变换程度越大,就必须要更大的IBO回退系数才能达到较为理想的误比特率,同时也代表着要承担更大的功率损失,与利用MMSE或者LMMSE做信道估计相比,LSZF-Net能避免2 dB甚至更多的功率损失。
图 8为同一组非线性参数、不同均方误差时延扩展的多径信道下LSZF-Net的BER性能比较。图 8(a)~图 8(c)均表明随着多径信道复杂度加大,LSZF-Net性能逐渐减弱,同样的网络结构已经无法满足神经网络对复杂信道的拟合能力,需要更多的网络层数和神经元个数对LSZF-Net这种结构进行微调。
图 8 不同时延扩展的多径信道LSZF-Net性能对比 Fig. 8 Performance comparison of LSZF-Net in different delay spread multi-path channel |
图选项 |
图 9为τrms=0.7Ts,3组非线性参数下,LSZF-Net与文献[4]网络结构的性能对比。仿真结果表明,同一信道条件下,无论是否存在非线性放大,无论非线性程度有多大,LSZF-Net接收机的BER性能都比较接近,且优于文献[4]网络结构的接收机。可以得出,LSZF-Net这种基于模型驱动和数据驱动结合的网络结构比单纯利用数据驱动进行信道补偿与信号检测的结构一定程度上性能更优,且需要的网络层数相对较少。
图 9 不同网络结构性能对比 Fig. 9 Performance comparison of different network structures |
图选项 |
3 复杂度分析 表 3列出不同方法恢复一帧数据,即2个OFDM符号所需要的复杂度,对传统方法和LSZF-Net复杂度进行对比,此时复杂度为所需乘积运算的次数。对传统方法和LSZF-Net复杂度进行对比,此时复杂度为所需乘积运算的次数。设N代表子载波个数,以1个OFDM符号进行64个子载波调制为例,N=64。完成一个符号的时间估计计算复杂度,LS估计、ZF均衡为N次复数乘法,LMMSE复杂度为N2[14],因为LMMSE在MMSE基础上降低计算复杂度,所以MMSE复杂度大于N2。由于LSZF-Net是离线训练好1个网络结构再进行在线部署,计算复杂度选为在线测试阶段,此时每层的权重和偏置训练已知,单个神经网络节点的运算表示为
表 3 不同方法计算复杂度比较 Table 3 Comparison of computational complexity among different methods
方法 | 所需乘积的次数 |
LS | 2N |
MMSE | >2N2 |
LMMSE | 2N2 |
LSZF-Net | (4N)2 |
表选项
(6) |
式中:φ(·)为激活函数;W为权重矩阵;X为神经元的输入;b为偏置。
LSZF-Net神经元个数分别为256、256,2个OFDM符号一共256个数据,那么LSZF-Net计算复杂度表示为(4N)2。由表 3可知,LSZF-Net的复杂度与LMMSE、MMSE是一个数量级,但是LSZF-Net首先要通过离线阶段大量的迭代训练使得网络能学习到信道分布特征。
文献[4]神经元为256、500、250、120、16,输入比特流为256,输出16 bit则需要8个DNN并列才能恢复数据128 bit,其计算复杂度远远大于LSZF-Net。且在训练网络阶段,型号为NVIDIA GeForce RTX 2080Ti的GPU下运行,epoch=4 000时,文献[4]网络用时约2 h 50 min,而LSZF-Net用时约40 min,文献[4]网络占用GPU的内存大于LSZF-Net。
4 结论 本文在OFDM系统中考虑非线性功率放大和多径效应对接收端信号恢复造成的影响,构造了一种新的网络结构:在进行神经网络回归预测之前,利用LS、ZF算法对输入信号进行预处理,再经过一层全连接神经网络对信号进行恢复。
1) LSZF-Net起到了进一步的信道补偿与信号检测的作用。本文通过LSZF-Net与无非线性补偿下的经典信道估计与均衡算法比较,LSZF-Net比基于LS信道估计、ZF信道均衡下信号恢复的BER性能提高了2个数量级,比基于LMMSE、MMSE算法信道估计ZF信道均衡下信号恢复的BER性能提升了一个数量级。
2) 在无线信道复杂且存在严重非线性失真的情况下,LSZF-Net具有一定的优越性。通过与输入信号功率回退下的经典算法比较,在复杂多径信道和严重非线性失真下,如果用LMMSE或者MMSE算法进行信道估计,LSZF-Net能避免至少2 dB的功率损失,如果用LS算法做信道估计,LSZF-Net能避免至少4 dB的功率损失。
3) LSZF-Net随着多径信道复杂度加大,性能逐渐减低。通过相同非线性参数、不同多径信道下LSZF-Net的BER性能比较,信道时延扩展越大,LSZF-Net性能优势逐渐减弱,简单的一层全连接神经网络无法准确学习到复杂多径信道的特性,后续会进行加大LSZF-Net网络结构以适应更复杂的信道的探究。
综上,LSZF-Net结合了通信的先验知识更能提高数据传输的准确率,此外为了实际的应用,可以收集真实的无线信道产生的样本,对模型进行再培训或者调整,以获得更好的性能。
参考文献
[1] | FANG X, XU Y C, CHEN Z Y, et al. Time-domain least square channel estimation for polarization-division-multiplexed CO-OFDM/OQAM systems[J]. Journal of Lightwave Technology, 2015, 34(3): 891-900. |
[2] | WANG J, WEN O Y, LI S Q. Soft-output MMSE MIMO detector under ML channel estimation and channel correlation[J]. IEEE Signal Processing Letters, 2009, 16(8): 667-670. |
[3] | NOH M, LEE Y, PARK H. Low complexity LMMSE channel estimation for OFDM[J]. IEE Proceedings-Communications, 2006, 153(5): 645-650. |
[4] | YE H, LI G Y, JUANG B H. Power of deep learning for channel estimation and signal detection in OFDM systems[J]. IEEE Wireless Communications Letters, 2017, 7(1): 114-117. |
[5] | NEUMANN D, WIESE T, UTSCHICK W. Learning the MMSE channel estimator[J]. IEEE Transactions on Signal Processing, 2018, 66(11): 2905-2917. |
[6] | SAMUEL N, DISKIN T, WIESEL A.Deep MIMO detection[C]//IEEE International Workshop on Signal Processing Advances in Wireless Communications.Piscataway: IEEE Press, 2017: 1-5. |
[7] | HE H T, WEN C K, JIN S, et al.A model-driven deep learning network for MIMO detection[C]//The 6th IEEE Global Conference on Signal and Information Processing.Piscataway, IEEE Press, 2018: 584-588. |
[8] | NACHMANI E, BEERY Y, BURSHTEIN D.Learning to decode linear codes using deep learning[C]//2016 54th Annual Allerton Conference on Communication, Control, and Computing.Piscataway: IEEE Press, 2016: 341-346. |
[9] | NACHMANI E, MARCIANO E, LUGOSCH L, et al. Deep learning methods for improved decoding of linear codes[J]. IEEE Journal of Selected Topics in Signal Processing, 2018, 12(1): 119-131. |
[10] | GRUBER T, CAMMERER S, HOYDIS J, et al. On deep learning-based channel decoding[C]//201751st Annual Conference on Information Sciences and Systems(CISS).Piscataway: IEEE Press, 2017: 1-6. |
[11] | FEHSKE A, GAEDDERT J, REED J.A new approach to signal classification using spectral correlation and neural networks[C]//1st IEEE International Symposium on New Frontiers in Dynamic Spectrum Access Networks.Piscataway: IEEE Press, 2005: 144-150. |
[12] | PENG S, JIANG H, WANG H, et al. Modulation classification based on signal constellation diagrams and deep learning[J]. IEEE Transactions on Neural Networks and Learning Systems, 2019, 30(3): 718-727. |
[13] | O-SHEA T J, CORGAN J, CLANCY T C. Convolutional radio modulation recognition networks[C]//International Conference on Engineering Applications of Neural Networks. Berlin: Springer, 2016: 213-226. |
[14] | 廖勇, 花远肖, 姚海梅. 基于深度学习的OFDM信道估计[J]. 重庆邮电大学学报, 2019, 31(3): 348-353. LIAO Y, HUA Y X, YAO H M. Channel estimation based on deep learning for OFDM systems[J]. Journal of Chongqing University of Posts and Telecommunications, 2019, 31(3): 348-353. (in Chinese) |
[15] | SPENCER Q H, SWINDLEHURST A L, HAARDT M. Zero-forcing methods for downlink spatial multiplexing in multiuser MIMO channels[J]. IEEE Transactions on Signal Processing, 2004, 52(2): 461-471. |
[16] | SALEH A A M. Frequency-independent and frequency-dependent nonlinear models of TWT amplifiers[J]. IEEE Transactions on Communications, 1981, 29(11): 1715-1720. |
[17] | WANG T, WEN C, WANG H, et al. Deep learning for wireless physical layer:Opportunities and challenges[J]. China Communications, 2017, 14(11): 92-111. |
[18] | 张静, 金石, 温朝凯, 等. 基于人工智能的无线传输技术最新研究进展[J]. 电信科学, 2018(8): 46-55. ZHANG J, JIN S, WEN C K, et al. An overview of wireless transmission technology utilizing artificial intelligence[J]. Telecommunications Science, 2018(8): 46-55. (in Chinese) |
[19] | CHO Y S, KIM J, YANG W Y. MIMO-OFDM wireless communication with MATLAB[M]. Hoboken: John Wiley & Sons, 2010: 25-35. |
[20] | JIANG P W, WANG T Q, HAN B, et al. Artificial intelligence-aided OFDM receiver: Design and experimental results[EB/OL].(2018-12-17)[2019-08-11].https: //arxiv.org/abs/1812.06638. |
[21] | HAN D S, HWANG T. An adaptive pre-distorter for the compensation of HPA nonlinearity[J]. IEEE Transactions on Broadcasting, 2000, 6(2): 152-157. |
[22] | 杨霖, 宋坤. OFDM系统中基于压缩感知恢复由限幅和HPA产生的非线性失真研究[J]. 电子学报, 2018, 46(5): 1078-1083. YANG L, SONG K. Research on recovery of clipping and HPA nonlinear distortion based on compressive sensing in OFDM systems[J]. Acta Electronica Sinica, 2018, 46(5): 1078-1083. (in Chinese) |