全文HTML
--> --> -->为了充分利用目标前向散射引起的声场扰动现象来实现双基地盲区中的目标探测, 国内外****提出了多种方法. 例如, Song等[7]利用时间反转镜技术构建了水声绊网, 将声能量聚焦于源阵列的探针声源处, 并通过观察焦区周围旁瓣的能量变化来检测目标, 该研究结果引起了对时反目标探测的关注. 由于时反镜处理物理上的需求, 该方法需要有复杂的硬件系统支持[8], 此后水声工作者又进一步提出了基于虚拟时反的处理方法[9]. 雷波等[10]基于多个接收点前向散射声扰动现象的时间差和几何关系, 提出了运动目标定位方法. Folegot等[11]提出了基于声射线的定位方法, 采用双波束形成来分辨携带主要能量的声线, 利用目标对声线的“遮挡”效应, 对强度衰减的特征声线进行加权求和, 加权系数为声线能量的衰减程度, 将所有处理后的特征声线绘制在一起, 得到的模糊图上的“亮点”即为目标位置. Marandet等[12]提出了敏感核定位方法, 将目标定位问题转化为线性反演问题, 利用声场模型计算出每条特征声线在不同位置处的敏感核, 然后从实际接收数据中提取出每条特征声线的实际声压幅度变化量, 结合敏感核矩阵构建出以目标位置权值向量为解的线性方程组, 通过求解欠定方程组实现对目标的定位, 并在超声波导条件下完成了验证实验. Yildiz等[13]进一步研究了多基地配置下敏感核定位方法, 并开展了水池实验验证. 本质上说, 敏感核方法属于基于模型的匹配场处理, 对环境信息敏感, 因而易受到环境失配的影响.
近期, 机器学习已经越来越多地被用于解决水下声源的定位问题. 牛海强等[14,15]使用机器学习进行声源距离的估计, 获得了比传统匹配场处理更佳的性能, 并使用残差神经网络估计了声源的距离深度[16]. 徐及等[17]使用了两种神经网络在没有精确环境信息的复杂水体下对水下目标距离进行估计. 李整林等[18]提出了一种在深海直达区的卷积神经网络声源测距方法. 杨益新等[19]使用仿真与实际数据训练卷积神经网络, 对深海目标进行距离和深度估计.
迁移学习作为机器学习的一种典型方法[20], 可以通过小样本的更新学习, 提高学习方法的适应性. 本文提出一种基于迁移学习的水下目标定位方法, 从目标前向散射引起声场扰动的角度出发, 利用卷积神经网络建立起声场扰动信息与目标位置的映射关系, 从而把目标定位问题转化为分类问题. 进一步考虑环境失配带来的稳健性问题, 利用基于先验信息的仿真数据对卷积神经网络进行训练以构建预训练模型, 而后基于迁移学习思想, 结合少量实际数据对预训练模型进行微调, 有效降低环境失配对定位性能的影响.

Figure1. Schematic diagram of sound barrier with transmitter and receiver arrays.







在收发连线之间存在目标的情况下, 散射声场可以近似认为是声源S发射的源信号经多径传播后到达目标处并发生散射, 而后散射波经多径传播后到达接收点R, 如图1所示. 声波在目标上的散射与目标的散射函数

假设位于





















Marandet等[12]对敏感核定位方法的研究表明, 由入侵目标引起的接收端声场扰动与目标位置存在着映射关系. 而由本文的(2)式—(4)式也可以看出, 收发连线间存在目标时的接收信号




Figure2. Flow chart of positioning method.
2
3.1.数据预处理
对数据进行合理的预处理可以降低数据维度, 加快神经网络收敛, 本文提取声场扰动的部分特征信息, 构建与目标位置相关的三维特征数据作为输入数据.由(1)式—(6)式得到脉冲压缩输出包络











2
3.2.预训练模型
一般情况下, 为了保证较好的学习性能, 神经网络通常需要大量的训练数据, 但实际水声目标数据获取较为困难. 因此, 先使用基于先验水文环境信息和声场模型的仿真数据对神经网络进行训练, 建立预训练模型. 对距离深度二维平面定位区域进行网格划分, 使用独热编码对划分的网格区域进行标记. 目标位于不同网格内时, 将其对应的数据矩阵H作为神经网络的输入, 对应的独热编码作为神经网络的预期输出.采用的卷积神经网络的结构主要由2层卷积池化层和2层全连接层构成, 如图3所示, 其他参数见表1. 将预处理后的仿真数据输入卷积神经网络, 通过梯度下降算法调整卷积神经网络各层的参数以极小化损失函数, 本文采用常用的交叉熵损失函数, 表示如下:

Figure3. Structure diagram of convolution neural network.
结构参数 | 具体设置 |
池化方法 | 最大池化 |
优化器 | Adam |
损失函数 | 交叉熵 |
学习率 | 0.001 |
b随机失活层丢弃率 | 0.5 |
表1卷积神经网络参数设置
Table1.Parameter setting of convolutional neural network


实际水文环境与仿真环境往往存在环境失配, 这会严重降低预测模型的定位性能, 故而此时的预训练模型并非最终模型, 需要对预训练模型进行参数迁移以降低环境失配对模型的影响.
2
3.3.迁移学习调整
目标位置与信道特征以声场扰动的形式给出, 卷积神经网络的卷积池化层可以提取基础和抽象特征, 而全连接层根据特征建立声场扰动与目标位置的映射关系进行分类, 因此可以认为基于仿真数据的预训练模型和基于实际数据的预测模型共享卷积池化层参数. 参数失配使原有映射在实际环境中产生误差, 通过参数迁移方法冻结预训练模型的卷积池化层参数, 并利用少量实际数据对全连接层参数进行修正, 建立新的映射以实现目标学习任务, 如图2中的处理流程所示. 全连接层可以表示为




将实际数据经过预处理后输入预训练模型, 冻结卷积池化层的参数, 仅调整全连接层的参数以极小化损失函数. 这样将基于仿真数据的预训练模型迁移到存在环境失配时的定位问题中, 经过学习后建立基于实测数据修正后的水下目标定位预测模型, 从而根据接收信号数据预测获得目标的位置.



Figure4. Simulation experiment: (a) Diagram of simulation experiment; (b) received signal waveforms; (c) sound field aberration

发射阵和接收阵最上方阵元记为1号阵元, 按深度向下依次排序. 令1号发射阵元发射脉冲信号, 在各接收阵元完成信号采集后, 其他发射阵元依次发射同样的脉冲信号并在接收端完成信号采集. 对于1号发射阵元和11号接收阵元组成的收发对, 在没有入侵目标时接收到的直达波信号如图4(b)中点线所示. 若目标位于水平距离1900 m、深度50 m的位置, 则散射波信号波形如图4(b)中实线所示. 可以看出目标的散射信号强度远低于直达波, 在前向散射探测中被严重淹没. 将该接收信号代入(5)式和(7)式中, 可以计算出声场扰动量A随时间t的变化, 波形如图4(c)所示. 可以看出, 散射信号在多个时段对声场的相对扰动量较大, 这种扰动可以作为目标位置的定位依据.
2
4.1.无失配时的仿真结果
使用独热编码对划分的网格区域进行标记, 然后使用BELLHOP声场模型[26]对目标位于不同网格区域时的接收数据进行仿真, 生成30000组接收信号数据, 并将预处理后的仿真数据按5∶1的比例随机划分为训练集和测试集.对卷积神经网络进行训练, 训练过程中测试集预测准确率和交叉熵损失函数变化分别如图5(a)和图5(b)所示, 可以看出随着迭代次数的增加, 卷积神经网络对测试集的预测准确率逐渐提高, 当迭代次数为850时基本达到收敛, 此时得到预训练模型参数, 这将作为存在失配时进行迁移学习的基础模型参数.

Figure5. Training process and prediction results of the pre-training model: (a) Variation of accuracy; (b) variation of loss function; (c) prediction results of the pre-training model without mismatch
在测试集中随机选取500个样本, 预训练模型对这些样本的预测结果如图5(c)所示, 统计准确率达到了98.8%, 可以看出在没有环境失配的情况下预训练模型能够对目标进行准确定位.
2
4.2.声速剖面失配时的仿真结果
假设实际环境与仿真环境间存在声速剖面失配, 实际声速剖面为图4(a)中的虚线声速剖面. 对于存在失配的实际声速剖面, 仿真生成500组接收信号数据并进行预处理, 作为实际数据. 使用预训练模型对这500组数据进行预测, 预测结果如图6(a)所示, 准确率降低为22.4%, 这表明声速剖面失配严重降低了预测模型的定位性能, 但预训练模型和理想预测模型仍具有一定的相关性. 此时需要利用这些实际数据对预训练模型进行迁移学习, 以降低声速剖面失配对定位性能的影响.
Figure6. Prediction results of neural network model with environment mismatch: (a) Prediction results of pre-training model; (b) prediction results after transfer learning
将实际数据按3∶1的比例随机划分为训练集和测试集, 按照图2所示参数迁移方法流程, 保持卷积池化层的权值参数不变, 仅调整全连接层的权值参数, 对神经网络模型进行重新训练. 使用经过迁移学习的神经网络预测模型对实际数据集进行预测, 预测结果如图6(b)所示, 统计准确率为96.8%. 通过比较图6(a)和图6(b)的预测结果可以看出, 迁移学习方法在声速剖面存在失配时仍保持着较高的定位精度.
在相同的声速剖面失配的情况下, 使用敏感核函数[12]定位结果进行对比. 仿真生成同样数量的接收信号数据并进行预处理, 作为实际数据. 使用仿真生成的理论敏感核模型对这500组数据进行预测, 预测结果如图7所示. 当实际声速剖面与仿真声速剖面失配, 导致拷贝场向量的计算产生较大误差, 使敏感核函数方法的定位性能严重降低, 几乎不能准确对目标位置进行预测.

Figure7. Prediction results of sensitive kernel function with environmental mismatch: (a) Location results of single sample; (b) results of multiple samples
2
4.3.目标散射函数敏感性分析
目标散射函数通过影响入射声场和散射声场的耦合, 改变散射过程中能量的重新分配, 进而影响到接收声场. 实际情况下目标的散射函数是未知的, 预训练过程中所采用的模拟目标只是对实际目标近似, 两者存在目标散射函数失配, 因此有必要分析定位方法对目标散射函数的敏感性.假设模拟目标为长半轴40 m、短半轴3 m的刚性长旋转椭球体, 实际目标为刚性圆柱体, 长度分别为35, 40和45 m, 圆柱半径分别为2.5, 3.0和3.5 m. 保持其他仿真参数不变, 除目标散射函数失配外无其他失配存在. 此时用仿真数据训练得到的预训练模型并不发生变化, 在预训练模型的基础上通过参数迁移进行微调, 对于不同尺寸的实际目标, 仿真结果如表2所列.
实际目标 长度/m | 实际目标圆柱半径/m | 目标失配时预测准确率/% | 迁移学习后预测准确率/% |
35 | 2.5 | 77.2 | 95.2 |
40 | 3 | 79.4 | 96.0 |
45 | 3.5 | 74.8 | 93.6 |
表2目标散射函数失配时的仿真结果
Table2.Simulation results of target scattering function mismatch
可以看出, 当实际目标的长度为40 m、圆柱半径为3 m时, 目标失配的程度较小, 预训练模型对实际数据的预测准确率为79.4%, 经过迁移学习后神经网络模型的预测准确率达到96.0%, 有效降低了目标散射函数失配对定位性能的影响; 当目标失配程度增大时, 预训练模型的预测准确率出现下降, 经过迁移学习后神经网络模型出现了定位性能的略微降低, 但仍可以满足目标定位的精度需求. 以上分析表明定位方法对目标散射函数具有较好的稳健性.
2
4.4.海底底质敏感性分析
仿真环境的海底参数往往与实际海底参数存在失配, 会影响预训练模型的定位性能. 假设水体参数不变, 当实际环境的海底底质分别为泥砂、细砂、粗砂时, 仿真结果如表3所列.实际海底 底质类型 | 密度/ (g·cm–3) | 声速/ (m·s–1) | 海底底质失配时 预测准确率/% | 迁移学习后 预测准确率/% |
泥砂 | 1.806 | 1668 | 78.4 | 96.0 |
细砂 | 1.957 | 1753 | 74.6 | 93.6 |
粗砂 | 2.034 | 1836 | 71.0 | 92.0 |
表3海底底质失配时的仿真结果
Table3.Simulation results of sediment properties mismatch
可以看出, 当实际海底底质与仿真海底底质存在失配时, 预训练模型的预测准确率下降了20%左右, 定位方法的性能受到较大影响, 且失配程度越大, 预训练模型的预测准确率越低. 经过迁移学习后神经网络模型的预测准确率得到提升, 尽管随着失配程度的增大, 预测准确率会出现小幅下降, 但在实际海底底质为粗砂的情况下仍能达到92%, 这表明定位方法对海底底质具有较好的稳健性.
2
4.5.阵元数量和布设深度敏感性分析
发射和接收点的位置决定了特征声线的传播路径, 只有目标位于声线附近时, 才能对声场产生影响. 假设模拟目标和实际目标均为刚性长旋转椭球体, 模拟目标的长半轴为40 m、短半轴为3 m, 实际目标的长半轴为60 m、短半轴为5.6 m, 无其他失配存在. 令接收阵元数为25, 发射阵元数分别取3—6, 保持其他仿真参数不变, 仿真结果如表4所示; 令发射阵元数为5, 接收阵元数分别取17—23, 保持其他仿真参数不变, 仿真结果如表5所列; 改变发射阵元的布设深度, 令5个发射阵元的布设深度分别为20—32 m, 20—80 m, 68—80 m, 保持其他仿真参数不变, 仿真结果如表6所列.发射阵元数 | 无失配时预测准确率/% | 目标失配时预测准确率/% | 迁移学习后预测准确率/% |
3 | 95.8 | 77.6 | 89.4 |
4 | 97.3 | 81.2 | 92.6 |
5 | 98.7 | 83.4 | 95.0 |
6 | 99.0 | 85.4 | 95.8 |
表4不同发射阵元数时的仿真结果
Table4.Simulation results of different number of transmitting array elements
接收阵元数 | 无失配时预测准确率/% | 目标失配时预测准确率/% | 迁移学习后预测准确率/% |
17 | 92.6 | 71.4 | 90.8 |
19 | 94.6 | 77.2 | 92.2 |
21 | 98.7 | 83.4 | 95.0 |
23 | 98.9 | 86.8 | 96.6 |
表5不同接收阵元数时的仿真结果
Table5.Simulation results with different number of receiving array elements
发射阵元布设深度/m | 无失配时预测准确率/% | 目标失配时预测准确率/% | 迁移学习后预测准确率/% |
20—32 | 96.2 | 81.4 | 90.8 |
20—80 | 98.7 | 83.4 | 95.0 |
68—80 | 96.8 | 84.0 | 91.2 |
表6不同布设深度时的仿真结果
Table6.Simulation results of different layout depths
由表4和表5可以看出, 当提高发射、接收阵元数量时, 可以得到准确率更高的预训练模型, 且预训练模型的定位性能受目标尺寸失配的影响更小, 经过参数迁移后, 与较少阵元数的情况相比模型的预测准确率更高. 这是因为发射、接收阵元数量的增多会使得收发连线的数量增多, 可以从波导空间结构的维度上得到更多与目标位置相关的信号数据, 故而输入神经网络的数据矩阵隐含着更多的目标位置特征信息, 有助于神经网络训练过程中对特征更加高效的提取, 能够更好地训练和构建神经网络模型, 提高模型的预测准确率.
表6的结果表明, 发射阵元布设深度为20—80 m时, 与布设深度为20—32 m, 68—80 m的情况相比可以得到准确率更高的预测模型. 这是因为当发射阵元布设在较小的深度覆盖范围时, 对于不同的发射阵元, 其对应接收信号数据的信道响应函数差异较小, 包含的目标位置信息有限; 而当发射阵元布设在较宽的深度覆盖范围时, 接收信号数据的信道响应函数差异增大, 此时接收数据中隐含着更多目标位置信息, 有助于神经网络更准确地提取数据的特征, 提高模型的定位性能. 同时也可以看出, 在仿真环境下改变发射阵元数、接收阵元数、发射阵元布设深度的取值, 经过迁移学习后模型的预测准确率仍能达到90%以上, 这表明定位方法对阵元数、布设深度均具有较好的稳健性.
2
4.6.对信道起伏的敏感性分析
海洋环境的起伏会导致声信道的幅度和相位起伏, 从而引起接收信号起伏. 为了便于研究本文方法对信道起伏的稳健性, 这里分别对信道冲激响应的幅度和相位添加扰动, 分析不同扰动强度下的定位效果.根据信道多途冲激响应, 对信道加入幅度扰动, 可以表示为







对时域内各收发对间的幅度最大的前10条声线添加幅度扰动






Figure8. Position accuracy with fluctuation variation: (a) Position accuracy with magnitude fluctuation; (b) position accuracy with phase fluctuation
根据信道多途冲激响应, 对信道加入相位扰动, 可以表示为:





以上仿真表明, 本文方法对海洋环境起伏导致的信道扰动具有一定的稳健性, 在较为稳定的信道环境下可以保持较好的定位准确率.
在无目标信道中存在起伏时, 分别考虑幅度和相位起伏. 计算起伏环境下的定位预测结果, 如图9所示, 环境随机扰动使得无目标定位结果具有较强的随机性, 无法判定目标的存在与位置. 这是由于无目标时, 由(7)式得到的扰动量变化只由噪声和信道扰动决定, 因此具有较强的随机性.



Figure9. Position result without target in fluctuated channel: (a) Position results without target in magnitude fluctuated channel


由仿真结果可以看出, 方法的定位预测结果在起伏信道中有无目标的情况下有显著差别, 相比于有目标情况, 无目标时定位预测结果的分布呈现很强的随机性, 因此不能作为目标定位依据.
该方法由模型和数据共同驱动, 可以较好地解决环境失配问题, 但值得注意的是迁移学习的前提是源域和目标域具有一定相似性, 这意味着预训练模型不能和理想预测模型在结构上相差过大, 选取先验水文环境信息构建预训练模型时应尽可能考虑多种水文情况, 使得预训练模型具有较好的泛化能力, 这也有助于避免迁移学习时出现过拟合的问题.