删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于优化字典学习算法的压缩数据收集*

本站小编 Free考研考试/2021-12-25

无线传感器网络(Wireless Sensor Networks,WSNs)由多个具有无线通信能力的传感器节点组成,部署在特定的监测环境中,对物理环境信息的收集是其主要应用之一[1]。典型的WSNs数据收集过程是:传感器节点周期性地感知物理环境信息,并将采集到的传感器数据通过多跳转发的方式汇聚到基站节点。传感器节点不仅要传输自己采集到的数据,还要转发其他节点的数据。越靠近基站的节点参与转发的次数越多,越容易因能量耗尽而失效,成了影响WSNs网络生命周期的一个瓶颈问题。
压缩感知(Compressive Sensing,CS)[2-4]作为一种新兴的信息处理理论,为解决WSNs数据收集中的能量瓶颈问题提供了一个新的思路。文献[5]在CS理论的基础上提出了一种压缩数据收集模型。基于压缩数据收集模型的WSNs数据收集方法[5-9]能够减少传感数据的传输量,并让通信代价平均分配到每个节点上,从而有效地缓解了WSNs数据收集中的能量瓶颈问题。这些方法[5-9]使用的都是固定的稀疏字典,然而WSNs的应用场景是多样化的,不同的应用场景下传感数据的稀疏特性是不同的。固定的稀疏字典缺乏对多样化场景的适应能力,局限了压缩数据收集的应用范围。此外,WSNs通常部署在复杂的环境中,其中大量存在的环境噪声会不可避免地影响到数据收集的精度。如何优化压缩数据收集系统的设计来减小环境噪声所造成的影响是一个值得考虑的问题。
为此,本文提出了一种优化字典学习算法来自适应地构造压缩数据收集中的稀疏字典。从训练数据中学习得到稀疏字典,提升对不同应用场景下的传感数据的稀疏表示能力。考虑到环境噪声的存在,对字典学习的算法进行优化设计,减小了环境噪声对数据收集精度的干扰。
1 问题描述 1.1 压缩数据收集模型 典型的压缩数据收集过程如图 1所示。假设在一条多跳传输路径上有N个节点。每个节点分别感知客观环境以获得传感数据,用xj表示节点Sj采集的传感数据。在压缩数据收集模型中,每个节点不再直接传输自己采集的传感数据,也不直接转发其他节点的传感数据,而是传输多个传感数据的加权和[5]。例如,节点S1向其父节点S2发送M个加权数据{11x1,21x1,…,M1x1},其中:{11,21,…,M1}为节点S1的随机测量系数。节点S2接收到这些数据后,再在其中加上自己采集的传感数据,得到新的加权数据{11x1+12x2,21x1+22x2,…,M1x1+M2x2},并将其发送给父节点S3。如此反复进行,则基站将接收到M个加权数据,用M维列向量y来表示,有
图 1 多跳路径上的压缩数据收集过程 Fig. 1 Compressive data gathering process in a multi-hop route
图选项




(1)

用矩阵形式表示,有
(2)

式中:Φ∈RM×N为测量矩阵;x∈RN为传感数据向量。
如果x在某个稀疏字典D∈RN×K上是稀疏的(其中:K为字典原子数,K≥N)
(3)

式中:系数向量θ=[θ1 θ2 … θK]T的非零元素的个数远小于K;而且测量矩阵Φ是高斯随机矩阵,那么求解
(4)

得到唯一解θ,式中L为训练数据的数量。再通过计算x=便可恢复出原始的传感数据。
1.2 字典学习 现有的基于压缩数据收集模型的WSNs数据收集方法所使用的稀疏字典都是固定的正交矩阵,如离散余弦变化矩阵(Discrete Cosine Transform,DCT)等。然而WSNs的部署环境是复杂多变的,不同应用场景下的传感数据具有不同的稀疏特性,很难用固定的字典来描述。为此,有必要采用字典学习的方法,从不同类型的传感数据中学习得到相应的稀疏字典,以提升压缩感知数据收集对多样化应用场景的适应能力。
用一组传感数据{xi}Li=1作为字典学习的训练数据,其中xi∈RN表示一个N维传感数据向量。用矩阵X∈RN×L来表示这些训练数据:
(5)

字典学习的一般形式为
(6)

式中:为矩阵Frobenius范数;C∈RK×L为稀疏表示矩阵;S为稀疏度,矩阵C中的每一列都是S-稀疏向量。
通过求解优化问题式(6)就可以得到稀疏字典D。对问题式(6)的求解有K-SVD[10]等经典的字典学习方法。
2 环境噪声对压缩数据收集的影响 在实际情况中,环境背景噪声会对压缩数据收集产生干扰,使得测量数据中包含了噪声分量,
(7)

式中:e∈RN为独立同分布的随机向量,服从正态分布Ν(0,σ2)。由于x能由字典D稀疏表示,将式(3)代入式(7)中,得到
(8)

用均方误差(Mean Squared Error,MSE)来衡量压缩数据收集的误差:
(9)

式中:θθ的估计值;Eθ,e[·]为随机向量θ和e联合分布下的数学期望。
为了便于理论分析,在这里使用oracle假设[11],即假设系数向量θ中非零元素的位置是已知的,并用一个集合Γ?{1,2,…,K}来表示。那么式(8)变形为如下形式:
(10)

式中:IΓ∈RK×S为删除了单位矩阵I∈RK×K中不在集合Γ中的一些列后得到的矩阵;θΓ∈RS为删除了θ中的零元素后的向量,S为θ中非零元素的个数。对式(10)求得θΓ的最小二乘估计量:
(11)

因此有
(12)

把式(12)代入式(9)中,得到
(13)

式中:Tr[·]表示矩阵的迹;EΓ[·]为随机集合Γ的数学期望。
文献[12]指出EΓ2Tr[(ITΓDTΦTΦDIΓ)-1]]与是正相关的。因此为了减小环境噪声对数据收集精度的影响,在字典学习的过程中要让的取值尽量地小。但是,为了避免字典学习与非确定性的测量矩阵Φ耦合,不能直接把作为字典学习的惩罚项。由文献[13]可知,在Φ是高斯随机矩阵的情况下,如果的取值较小则的取值也较小。为此,本文选择将作为自相干惩罚项加入到式(6)中,得到一个优化的字典学习模型:
(14)

式中:λ>0为权衡因子;ci为矩阵C中的第i个列向量。
3 优化字典学习算法 将问题式(14)称为优化字典学习(Optimized Dictionary Learning,ODL)。本文提出一种ODL算法来求解式(14)。ODL算法采用交替迭代的求解方法,在每次迭代过程中包含了2个步骤:①稀疏逼进;②字典更新。
3.1 稀疏逼进 在稀疏逼进阶段,固定字典D,求解训练数据X在字典D上的稀疏表示矩阵C,即
(15)

问题式(15)可以用正交匹配追踪算法[14]求解。
3.2 字典更新 在字典更新阶段,固定矩阵C,根据下面的优化问题求解出新的字典D:
(16)

显然,式(16)是一个凸问题,其必有全局最优解。令F ,则有
(17)

由于F(D)是凸函数,所以当F(D)取到最小值时,必有ΔF(D)=0,即
(18)

由式(18)可得到
(19)

用式(19)作为优化问题式(16)的最优解的近似估计,即在迭代过程中使用以下公式对字典进行更新:
(20)

式中:Dk+1为第k+1轮迭代中更新的字典;Dk为第k轮迭代中更新的字典。得到新的字典Dk+1后,还要将Dk+1的各列依次进行归一化。综上所述,ODL算法的具体执行步骤如下:
1) 初始化D0为随机矩阵,令k=0。
2) 主循环:重复运行步骤3)~5),直到迭代达到收敛。
3) 稀疏逼进:

4) 字典更新:

5) 将Dk+1的各列归一化,令k=k+1。
4 实验分析 4.1 实验方案 为了验证本文提出的ODL算法的有效性,在北京航空航天大学传感网络与仪器实验室自主研发的无线传感器网络实验平台[15]上进行模拟实验。实验平台由50个无线传感器节点组成,具体部署情况如图 2所示。
图 2 无线传感器网络实验平台 Fig. 2 Wireless sensor networks testbed
图选项




本次模拟实验使用的实验数据为50个传感器节点在2014-11-05—2014-12-03期间所记录的温度与湿度数据。记录间隔为10 min,每个节点分别记录了4 000个温度数据和4 000个湿度数据。
按照时间顺序,将前400个数据划分为训练数据集,将后3 600个数据划分为测试数据集。实验过程分为3个步骤:
1) 在训练数据集上用ODL算法进行字典学习得到稀疏字典D。
2) 评估字典D在测试数据集上的稀疏表示能力。
3) 在测试数据集上运行压缩数据收集算法,并评估在不同环境噪声强度下的数据收集精度。
为了充分验证通过ODL算法学习得到的字典(记作ODL字典)在压缩数据收集中的效用,选择固定的离散余弦变换矩阵(记作DCT字典)和通过K-SVD[10]算法学习得到的字典(记作K-SVD字典)作为比较对象。实验过程中使用的具体参数如表 1所示。在压缩数据收集中使用的测量矩阵是高斯随机矩阵,环境噪声是人为模拟的高斯随机噪声。为了减少实验的随机性带来的影响,每组实验重复50次,取平均值作为最终的实验结果。
表 1 实验参数 Table 1 Experimental parameters
参数名称 N M L K
取值5020400100


表选项






4.2 实验结果
4.2.1 对不同字典的稀疏表示能力的比较 从训练数据集上学习得到字典D后,评估其在测试数据集上的稀疏表示能力。通过式(21)求解某个测试数据x在字典D上的稀疏表示:
(21)

用均方根误差(Root Mean Square Error,RMSE)来衡量字典的稀疏表示误差。通过式(22)计算某个测试数据的RMSE:
(22)

由于测试数据集有多个测试数据,所以对各个测试数据分别求得稀疏表示误差后再统一求均值,作为测试数据集的稀疏表示误差。
图 3显示了ODL字典、DCT字典以及K-SVD字典在温度数据集和湿度数据集上的稀疏表示能力。
图 3 不同字典的稀疏表示能力 Fig. 3 Sparse representation performance of different dictionaries
图选项




图 3可知,在同样的稀疏度下,ODL字典的稀疏表示误差最小,其次是K-SVD字典,DCT字典的稀疏表示误差最大;在同样的稀疏表示误差下,ODL字典需要的稀疏度最小,其次是K-SVD字典,DCT字典需要的稀疏度最大。由此可知,ODL字典对测试数据的稀疏表示能力最强,而固定的DCT字典对测试数据的稀疏表示能力最差。
和预期的一致,通过字典学习算法得到的字典的稀疏表示能力要好于固定的DCT字典。而在字典学习得到的字典中,ODL字典的稀疏表示能力比K-SVD字典要好,这是因为ODL算法中加入的自相干惩罚项减少了字典学习过程中对训练数据的过拟合。

4.2.2 环境噪声对收集精度的影响 在测试数据中添加高斯随机噪声以模拟环境噪声对压缩数据收集的影响。环境噪声的信噪比(Signal Noise Ratio,SNR)定义如下:
(23)

在压缩数据收集中分别使用ODL字典、DCT字典以及K-SVD字典作为稀疏字典,然后测试其在不同环境噪声信噪比下的数据收集精度。
实验结果如图 4所示。当环境噪声的信噪比很大时,使用ODL字典的数据收集误差最小,其次是K-SVD字典,固定字典的误差最大。这和4.2.1节中的实验结果是一致的,因为ODL字典的稀疏表示能力最好,固定字典的稀疏表示能力最差。随着信噪比的减小,使用K-SVD字典的数据收集误差将超过使用固定字典的误差,而使用ODL字典的数据收集误差始终是最小的。这是因为ODL算法在设计时就考虑到了如何抑制环境噪声的影响。通过引入了一个自相干惩罚项,ODL算法使得在字典学习中得到的稀疏字典具有低自相干结构,从而能够抑制环境噪声对数据收集精度的影响。
图 4 环境噪声对收集精度的影响 Fig. 4 Impact of environmental noise on accuracy of compressive data gathering
图选项





4.2.3 权衡因子λ对ODL算法性能的影响 注意到ODL算法中包含了一个可变的参数,即权衡因子λ,该参数的取值势必会影响到ODL算法的性能。为此,通过仿真实验来分析λ的取值对ODL算法性能的影响。4.2.1节与4.2.2节中的实验结果表明,ODL算法在温度数据集上的性能和在湿度数据集上的性能十分类似。所以只在温度数据集上测试λ对ODL算法性能的影响。
首先通过仿真实验来分析λ对ODL算法稀疏表示能力的影响。在仿真中,将稀疏度S固定为10,从0~0.4逐渐改变λ的取值,然后测试由ODL算法训练得到的字典在温度数据集上的稀疏表示误差。仿真结果如图 5所示。
图 5 权衡因子对温度稀疏表示误差的影响 Fig. 5 Impact of tradeoff factor on temperature sparse representation error
图选项




首先,随着λ从0开始逐渐增长,稀疏表示误差也逐渐降低。这是因为自相干惩罚项随着λ从0增长而开始发挥作用,减少了对训练数据的过拟合。然而,当λ于一定值时(例如λ>0.1),稀疏表示误差将随着 λ的增加而增加。这是因为当λ取值过大时,自相干惩罚项的惩罚作用过于强烈,反而抑制了字典对传感数据的稀疏表示能力。
通过仿真实验来分析λ对ODL算法数据收集误差的影响。在仿真中,信噪比η固定为10,从0~0.4逐渐改变λ的取值,然后测试基于ODL算法的压缩数据收集在温度数据集上的数据收集误差。仿真结果如图 6所示。
图 6 权衡因子对温度数据收集误差的影响 Fig. 6 Impact of tradeoff factor on temperature data gathering error
图选项




图 5中的结果十分类似,随着λ从0开始增长,数据收集误差也逐渐降低。但和图 5相比,图 6中的曲线下降幅度更大。这是因为随着λ从0开始增长,ODL算法训练得到的字典的稀疏表示能力将逐渐提高;更重要的是,ODL算法中的自相干惩罚项开始发挥作用,字典对环境噪声的抑制能力将逐渐提升。因此,在这2种因素的叠加作用下,数据收集误差的下降幅度大于稀疏表示误差的下降幅度。当λ大于一定值时,数据收集误差将随着λ的增加而增长。这是因为当λ取值过大时,ODL算法的稀疏表示能力变差。
综上所述,在具体应用中需要权衡考虑λ的取值:既不能因取值过小而牺牲了字典对环境噪声的抑制能力,也不能因取值过大而损害了字典的稀疏表示性能。
5 结 论 本文在压缩数据收集中引入了一种优化字典学习(ODL)算法,实验结果表明:
1) ODL算法引入的自相干惩罚项能减少在字典学习过程中对训练数据的过拟合,提高了稀疏表示能力。
2) ODL算法通过引入自相干惩罚项,使学习得到的稀疏字典具有低自相干结构,能有效地抑制环境噪声对数据收集精度的影响。

参考文献
[1] RAJAGOPALAN R, VARSHNEY P K. Data-aggregation techniques in sensor networks:A survey[J]. IEEE Communications Surveys and Tutorials,2006, 8(4): 48–63.
Click to display the text
[2] CANDES E J, WAKIN M B. An introduction to compressive sampling[J]. IEEE Signal Processing Magazine,2008, 25(2): 21–30.
Click to display the text
[3] DONOHO D L. Compressed sensing[J]. IEEE Transactions on Information Theory,2006, 52(4): 1289–1306.
Click to display the text
[4] BARANIUK R G. Compressive sensing[J]. IEEE Signal Processing Magazine,2007, 24(4): 118–121.
Click to display the text
[5] LUO C,WU F,SUN J,et al.Compressive data gathering for large-scale wireless sensor networks[C]//Proceedings of the 15th Annual International Conference on Mobile Computing and Networking.Washington,D.C.:ACM,2009:145-156.
Click to display the text
[6] LUO C, WU F, SUN J, et al. Efficient measurement generation and pervasive sparsity for compressive data gathering[J]. IEEE Transactions on Wireless Communications,2010, 9(12): 3728–3738.
Click to display the text
[7] 陈正宇, 杨庚, 陈蕾, 等. 基于压缩感知的WSNs长生命周期数据收集方法[J]. 电子与信息学报,2014, 36(10): 2343–2349.CHEN Z Y, YANG G, CHEN L, et al. Data gathering for long network lifetime in WSNs based on compressed sensing[J]. Journal of Electronics & Information Technology,2014, 36(10): 2343–2349.(in Chinese).
Cited By in Cnki (0) | Click to display the text
[8] WU X P, WANG Q S, LIU M Y. In-situ soil moisture sensing:Measurement scheduling and estimation using sparse sampling[J]. ACM Transactions on Sensor Networks,2015, 11(2): 1-26–29.
Click to display the text
[9] TANG Y, ZHANG B, JING T, et al. Robust compressive data gathering in wireless sensor networks[J]. IEEE Transactions on Wireless Communications,2013, 12(6): 2754–2761.
Click to display the text
[10] AHARON M, ELAD M, BRUCKSTEIN A. K-SVD:An algorithm for designing overcomplete dictionaries for sparse representation[J]. IEEE Transactions on Signal Processing,2006, 54(11): 4311–4322.
Click to display the text
[11] CANDES E, TAO T. The Dantzig selector: Statistical estimation when p is much larger than n[J]. The Annals of Statistics,2007, 35(6): 2313–2351.
Click to display the text
[12] LI G, ZHU Z, YANG D, et al. On projection matrix optimization for compressive sensing systems[J]. IEEE Transactions on Signal Processing,2013, 61(11): 2887–2898.
Click to display the text
[13] RAUHUT H, SCHNASS K, VANDERGHEYNST P. Compressed sensing and redundant dictionaries[J]. IEEE Transactions on Information Theory,2008, 54(5): 2210–2219.
Click to display the text
[14] TROPP J A, GILBERT A C. Signal recovery from random measurements via orthogonal matching pursuit[J]. IEEE Transactions on Information Theory,2007, 53(12): 4655–4666.
Click to display the text
[15] YI K,FENG R,YU N,et al.PARED:A testbed with parallel reprogramming and multi-channel debugging for WSNs[C]//IEEE Wireless Communications and Networking Conference,WCNC.Piscataway,NJ:IEEE Press,2013:4630-4635.
Click to display the text


相关话题/数据 环境 实验 传感器 优化

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 蜻蜓爬升过程飞行特征实验研究*
    微型飞行器(MicroAirVehicle,MAV)的发展和应用使昆虫飞行机理的研究越来越受到相关人员的关注[1]。昆虫在不同飞行状态下身体和翅膀运动参数的准确描述和飞行特征的探究为昆虫飞行机理研究和仿生流体力学的探索提供重要的数据依据。在众多飞行能力出众的昆虫界,蜻蜓又被称为“飞行之王”,有着其独 ...
    本站小编 Free考研考试 2021-12-25
  • 基于混沌的改进粒子群优化粒子滤波算法*
    粒子滤波(ParticleFilter,PF)是由粒子及其权重组成的离散随机测度近似概率分布[1]。由于其在处理非线性非高斯系统的状态滤波问题的优势[2-3],在目标跟踪、卫星导航和故障检测等方面得到了广泛的应用[4-7]。PF的主要问题是随着迭代次数增加,存在粒子退化现象。Gordon等[8]提出 ...
    本站小编 Free考研考试 2021-12-25
  • 基于多目标的高速列车隔热结构拓扑优化*
    车体的隔热结构不仅是采暖、空调等设备选型和车体优化设计的重要依据,而且,其特性是评价高速列车车体质量的一个重要性能参数和综合经济性指标[1-2]。一方面,若隔热效果欠佳,不仅会消耗更多的加热(或制冷)设备的能量,增加运行成本,也会影响列车的舒适性。另一方面,隔热结构也承受载荷,不仅要符合刚度、强度指 ...
    本站小编 Free考研考试 2021-12-25
  • 信息缺失的航空发动机传感器数据重构*
    航空发动机是航空飞行器的重要系统,航空发动机状态监视是健康管理的第一步,根据状态监视结果进行故障诊断、故障隔离和剩余寿命周期预测等。状态监视离不开状态参数数据,目前主要使用的有气路数据、滑油数据和孔探数据等,将这些信息融合能够进一步提高健康管理效率和质量。随着传感器技术的发展,面临着传感器数据维度增 ...
    本站小编 Free考研考试 2021-12-25
  • 多级导流诱导轮与叶轮一体型线优化*
    燃油离心泵是航空发动机的重要附件,对高性能燃油离心泵的研究是一项重要课题[1-2]。影响离心泵性能的最关键部件是叶轮,而叶轮型线是必须考虑的因素之一[3-4],因此对叶轮的复杂型线进行优化,从而提高离心泵的整体性能,是有必要且很有意义的。近年来,国内外许多****对诱导轮、叶轮的叶片型线或者从离心式 ...
    本站小编 Free考研考试 2021-12-25
  • 亚临界雷诺数圆柱绕流远场气动噪声实验研究*
    圆柱绕流是一个典型的流动问题,广泛存在于航空航天、船舶以及风工程[1-2]等实际工程问题中。其流动尾流区域存在卡门涡街、流动分离和层流湍流的转捩等复杂的流动现象[3-4]。长久以来围绕圆柱绕流的流动、减阻等难题进行了深入细致的研究,而对于圆柱绕流噪声的研究却是从1878年Strouhal[5]开始的 ...
    本站小编 Free考研考试 2021-12-25
  • 考虑passivation的备件库存时变凸优化*
    从20世纪60年代对备件保障进行研究开始,所有的研究都是在计算一段时间内备件的平均需求率。Sherbrooke[1]开创了METRIC模型,该模型采用期望缺货数来计算完好率,将问题归结为在总费用约束下,对所有库存数量可能的排列组合分析计算相应的期望缺货值,并采用边际效益分析法[2]寻找约束下使系统使 ...
    本站小编 Free考研考试 2021-12-25
  • 基于约束优化的舰艇区域防空作战能力需求生成*
    作战能力需求生成是以作战任务需求分析中确定的任务为依据,在给定的条件和标准下,通过任务-能力的映射关系,根据一定规则确定完成作战任务的能力需求。目前围绕作战能力需求生成的研究中,提出了作战元活动的概念,利用元活动-能力指标实现元活动执行水平向能力需求列表的转换[1];提出了“面向威胁、基于能力”的联 ...
    本站小编 Free考研考试 2021-12-25
  • 引入多Agent协商的协同优化在卫星设计中的应用*
    卫星总体参数设计涉及结构、轨道控制、姿态控制和电源分系统等,是典型的多学科优化问题,各学科的数学模型各不相同,难以统一并转化为一个模型,必须各分系统独立操作,各分系统间存在由于变量共享产生的相互制约,所以,卫星总体设计是典型的多学科优化问题[1]。工程实际中卫星总体设计可以分成总体设计层和分系统设计 ...
    本站小编 Free考研考试 2021-12-25
  • 基于梯度分割区间优化算法的双脉冲交会优化*
    航天器脉冲交会对接,是空间交会重要制导控制技术之一,为节省燃料,提高航天器载荷,其优化问题一直是人们研究的热点。众多****对双脉冲[1-3]或多脉冲的圆轨道或椭圆轨道[4]的交会对接问题,利用遗传算法[1,5-6]、差异演化(DifferentialEvolution,DE)算法[2]、粒子群算法 ...
    本站小编 Free考研考试 2021-12-25