删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于空-时近邻与似然比检验的传感器网络异常点检测

本站小编 Free考研考试/2020-04-15

刘一民 1 , 文俊杰 1 , 王岚君 2
1. 清华大学 电子工程系, 北京 100084, 中国;
2. 滑铁卢大学 大卫·切瑞顿计算机科学学院, 滑铁卢 N2L 3G1, 加拿大

收稿日期:2017-01-18
基金项目:国家自然科学基金资助项目(61571260)
作者简介:刘一民(1983-), 男, 副教授。E-mail:yiminliu@tsinghua.edu.cn


摘要:针对传感器网络中由于传感器故障造成的异常点检测问题,该文提出一种基于传感器与其空-时近邻点在测量数据之间的差异,采用似然比检验来判断传感器是否故障的异常点检测方法。在空间维,该方法基于最大后验概率选取待检测传感器当前时刻的空间近邻点;在时间维,该方法选取待检测传感器在之前若干个时刻的测量值作为其时间近邻点。然后根据待检传感器与其空-时近邻点测量数据之间的差异对其异常程度进行量化,并采用似然比检验判断待检测传感器是否故障。结果表明:该方法与已有的异常点检测方法相比,在相同的虚警率下取得了更高的检测率。例如在虚警率为10%时,该方法将检测率提升了10%~30%。
关键词:传感器网络异常点检测空-时近邻似然比检验
Outlier detection based on spatio-temporal nearest neighbors and a likelihood ratio test for sensor networks
LIU Yimin1, WEN Junjie1, WANG Lanjun2
1.Department of Electronic Engineering, Tsinghua University, Beijing 100084, China;
2.David R. Cheriton School of Computer Science, University of Waterloo, Waterloo N2L 3G1, Canada


Abstract: A spatio-temporal nearest neighbors and likelihood ratio test method was developed to detect outliers caused by sensor failures in sensor networks. In the space dimension, a sensor's spatially nearest neighbors were selected using a maximum posterior probability criterion while in the time dimension, the temporal nearest neighbors were previous observations from the same sensor. Each sensor's reading was evaluated based on differences between its earlier measurements and those of its neighbors with a sensor failure model and likelihood ratio test used to detect whether the sensor had failed. Tests show that this approach gives a higher detection rate for the same false alarm rate than existing outlier detection approaches. For example, for a 10% false alarm rate, the detection rate was increased by 10%-30%.
Key words: sensor networkoutlier detectionspatial-temporal nearest neighborslikelihood ratio test
传感器网络通常由分布在广泛区域内的大量传感器组成,在生态、医疗、军事等众多领域有着广泛的应用[1-3]。这些传感器观测特定的物理量,并将测量的数据返回给处理中心[4]。及时地检测传感器网络中的各个传感器是否出现故障对于传感器网络的故障修复和质量监督十分重要[5]。人们往往通过检测传感器测量数据是否异常进而判断该传感器是否出现故障[6]。本文将传感器视为实体,并将传感器在一个时刻的测量值视作一个节点。
****们对异常点检测问题的研究目前已经取得一些成果[5-8]。文[9]针对传感器网络在生态领域的应用,提出了一种基于节点空-时相关性的异常点检测方法,本文称其为Bettencourt方法。该方法首先选取与待检测传感器在正常工作时测量值最接近的若干个传感器,并将这些传感器当前时刻的测量值视为待检测节点的空间近邻点,在此基础上假设传感器的测量数据具有空-时平稳性,并基于统计模型来检测异常点。但该方法的检测性能依赖于事先给定的检测门限。对于传感器网络的实际使用者来说,如何确定最优的检测门限是应用该方法时需要面临的问题。文[10]提出了一种本地相关积分(local correlation integral, LOCI),首先量化节点异常程度,然后基于所有传感器在当前时刻的异常程度值来计算异常点的检测门限。与Bettencourt方法相比,该方法无需事先确定检测门限。但该方法仅仅基于节点的空间近邻关系,而不考虑传感器测量数据在时间上的变化情况。因此,如果在传感器网络中待检测节点与其空间近邻点均为异常点,那么该方法的检测性能会受到影响。文[11]针对异常点检测方法在实际应用中计算时间的消耗问题,提出了一种高效的检测方法。然而该方法假设异常点的数目是事先已知的。这在实际传感器网络中往往不一定满足。
针对上述问题,本文提出一种基于空-时近邻和似然比检验的异常点检测方法。该方法首先选取待检测节点的空-时近邻点,在此基础上量化待检节点的异常程度,然后结合传感器的故障模型,采用似然比检验对该传感器当前时刻是否异常做出判决。该算法由于充分利用了节点之间的空-时相关性以及传感器测量数据在正常工作和故障情况下的统计特性,取得了很好的检测性能。仿真结果表明:与Bettencourt方法和LOCI方法相比,该方法在相同的虚警率下取得了更高的检测率,具有更好的检测性能。
1 问题描述考虑一个实际传感器网络。网络中传感器n在第t个时刻的空-时近邻拓扑图如图 1所示。图中待检测的目标为传感器n在第t时刻的工作状态。其空间维的k个近邻点为传感器{m1, m2, …, mk}在第t时刻的测量值对应节点,时间维的l个近邻点为传感器n自身前l个时刻的测量值对应节点。需要注意的是,此处的近邻关系是指它们的测量数据关联性大。本文用符号V表示网络中所有传感器组成的集合,并设传感器数目为N。任意传感器n在第t时刻对应的节点用符号vn(t)表示,其测量值表示为符号sn(t)。假设传感器网络的维护人员在发现故障传感器后,会及时替换或修复该传感器。因此本文假设传感器网络的历史数据为正确的测量数据。在此基础上,本文研究的问题是:如何对当前时刻(第t时刻)的传感器网络进行检测,并准确地判断各个传感器是否出现故障。
图 1 传感器的空-时近邻拓扑图示例
图选项





本文假设:1)传感器网络中各传感器测量的物理量相同。2)当传感器正常工作时,传感器的测量值在时间上平稳变化。这个假设对于气温、土壤、水源质量检测等很多应用场景都成立[9]。3)当传感器正常工作时,传感器之间的相似性随着时间平稳变化。此处传感器的相似性由传感器正常工作时测量数据差值的绝对值决定。2个传感器在正常工作时测量数据之间差值的绝对值越小,它们的相似性越大。
2 异常点检测方法2.1 总体思路本文提出了一种基于空-时近邻和似然比检验的异常点检测方法。该方法分为3个步骤:1)基于历史数据选取待检测节点的空-时近邻点;2)基于待检测节点与其近邻点测量数据之间的差异,量化待检节点的异常程度;3)基于异常程度值来建立假设检验模型,通过似然比检验来判断待检测节点是否为异常点。
2.2 空-时近邻点选取不妨考虑待检测节点为vn(t),其空-时近邻点的选取过程由以下3步组成:
1) 确定时间近邻点数目l、空间近邻点数目k
2) 对于节点vn(t)时间近邻节点的选取,根据传感器测量数据平稳性的假设,选取传感器n在前l个时刻的对应节点作为其在时间上的l近邻节点。
3) 对于节点vn(t)空间k个近邻节点的选取,首先利用节点vn(t)在前l个时刻与网络中其他节点的测量数据的差值,统计出该传感器在对应时刻的空间近邻节点。然后基于最大后验概率估计节点vn(t)的空间k个近邻点:
假设传感器网络中至少包含l个长度的历史测量数据。在第(t-i)个时刻(1≤il, t>l),计算节点vn(ti)与网络中其他节点测量数据之差的绝对值,组成向量dn(ti),其中第m个元素dn, m(ti)
$d_{n,m}^{\left( {t - i} \right)} = \left| {s_n^{\left( {t - i} \right)} - s_m^{\left( {t - i} \right)}} \right|,m \in V,m \ne n.$ (1)
由于假设在第t时刻以前传感器均正常工作,向量dn(ti)中最小的k个元素所对应的节点组成节点vn(ti)的空间k近邻集合,用Nn, k(ti)表示。
在此基础上,本文定义指示变量ym, n(ti)如下:
$\begin{array}{*{20}{c}}{y_{m,n}^{\left( {t - i} \right)} = \left\{ \begin{array}{l}1,\;\;\;\;\;v_m^{\left( {t - i} \right)} \in N_{n,k}^{\left( {t - i} \right)};\\0,\;\;\;\;\;其他;\end{array} \right.}\\{m \in V,m \ne n.}\end{array}$ (2)
ym, n(t)=1表示节点vm(t)是节点vn(t)的空间k近邻,其后验概率为P(ym, n(t)=1|{ym, n(ti)}1≤il)。根据对测量数据平稳性的假设,可得:
$\begin{array}{l}P\left( {y_{m,n}^{\left( t \right)} = 1\left| {{{\left\{ {y_{m,n}^{\left( {t - i} \right)}} \right\}}_{1 \le i \le l}}} \right.} \right) = \\P\left( {y_{m,n}^{\left( {t - 1} \right)} = 1\left| {{{\left\{ {y_{m,n}^{\left( {t - i - 1} \right)}} \right\}}_{1 \le i \le l}}} \right.} \right).\end{array}$ (3)
根据Bayes公式,有
$\begin{array}{l}P\left( {y_{m,n}^{\left( {t - 1} \right)} = 1\left| {{{\left\{ {y_{m,n}^{\left( {t - i - 1} \right)}} \right\}}_{1 \le i \le l}}} \right.} \right) = \\\frac{{P\left( {y_{m,n}^{\left( {t - 1} \right)} = 1,{{\left\{ {y_{m,n}^{\left( {t - i - 1} \right)}} \right\}}_{1 \le i \le l}}} \right)}}{{P\left( {{{\left\{ {y_{m,n}^{\left( {t - i - 1} \right)}} \right\}}_{1 \le i \le l}}} \right)}}.\end{array}$ (4)
在式(4)中可以采用频数估计的方法计算右侧的概率比值。由此即可得到
$P\left( {y_{m,n}^{\left( t \right)} = 1\left| {{{\left\{ {y_{m,n}^{\left( {t - i} \right)}} \right\}}_{1 \le i \le l}}} \right.} \right).$
重复上述过程,分别计算网络中各传感器当前时刻对应节点为节点vn(t)空间k近邻点的后验概率,并对所得的后验概率值进行排序。然后,选取其中后验概率值最大的k个节点,作为其空间k个近邻点。
2.3 异常程度量化在节2.2的空-时近邻点的选取过程中,本文基于最大后验概率和对传感器测量数据的平稳性假设,选取了在正常工作时与待检节点测量数据最接近的若干个节点作为其空-时近邻点。当待检节点对应传感器出现故障时,该节点的测量数据出现偏差,那么节点与其空-时近邻点在测量数据上的差异会出现明显的变化[9]
依据节1对传感器相似性的阐述,传感器测量数据之间差值的绝对值越小,它们的相似性越大。本文将待检测节点vn(t)与其空-时近邻点在测量数据上的差值进行加权求和,作为对传感器n当前时刻异常程度的度量,并通过在正常工作时传感器之间的相似程度计算加权系数。异常程度的计算方法如下:
$\begin{array}{l}x_n^{\left( t \right)} = \sum\limits_{\Delta t = 1}^l {{A_{n,\Delta t}}\left( {s_n^{\left( t \right)} - s_n^{\left( {t - \Delta t} \right)}} \right)} + \\\;\;\;\;\;\;\sum\limits_{v_m^{\left( t \right)} \in N_{n,k}^{\left( t \right)}} {{A_{n,m}}\left( {s_n^{\left( t \right)} - s_m^{\left( t \right)}} \right)} .\end{array}$ (5)
其中:An, Δt为待检测节点vn(t)与其时间近邻点vn(t-Δt)之间测量值之差的加权系数,An, m为待检测节点vn(t)与其空间近邻点vm(t)之间测量值之差的加权系数。根据对传感器测量数据的平稳性假设,与文[12]对节点与其近邻点之间加权系数的计算方法类似,本文基于传感器网络前一时刻的历史测量数据并用Gauss函数计算式(5)中的加权系数:
${A_{n,\Delta t}} = \frac{{{{\rm{e}}^{ - {{\left( {s_n^{\left( {t - 1} \right)} - s_n^{\left( {t - 1 - \Delta t} \right)}} \right)}^2}}}}}{{\sum\limits_{\Delta p = 1}^1 {{{\rm{e}}^{ - {{\left( {s_n^{\left( {t - 1} \right)} - s_n^{\left( {t - 1 - \Delta p} \right)}} \right)}^2}}}} }},$ (6)
${A_{n,m}} = \frac{{{{\rm{e}}^{ - {{\left( {s_n^{\left( {t - 1} \right)} - s_m^{\left( {t - 1} \right)}} \right)}^2}}}}}{{\sum\limits_{v_q^{\left( t \right)} \in N_{n,k}^{\left( t \right)}} {{{\rm{e}}^{ - {{\left( {s_n^{\left( {t - 1} \right)} - s_q^{\left( {t - 1} \right)}} \right)}^2}}}} }}.$ (7)
将式(6)、(7)代入式(5),即可计算得到待检测节点vn(t)的异常程度值。因为当传感器出现故障后,其对应节点与其空-时近邻点之间测量值之差会出现明显的变化[9, 13-14],所以上述的异常程度量化方法可以反映传感器在当前时刻的异常情况。
2.4 似然比检验对于待检测节点vn(t),原假设H0为传感器nt时刻正常工作,备择假设H1为传感器nt时刻为故障点,节点的测量值sn(t)为真实值与测量偏差的线性叠加。不妨用Δs表示故障传感器的测量偏差,则备择假设H1下,节点vn(t)的测量值满足:
$s_n^{\left( t \right)}\left| {{H_1} = s_n^{\left( t \right)}} \right|{H_0} + \Delta s.$ (8)
本文采用似然比检验的方法进行判决:
$\left\{ \begin{array}{l}{H_1}\;成立,\;\;\;L\left( {x_n^{\left( t \right)}} \right) > \gamma \left( {\lambda ,t} \right);\\{H_0}\;成立,\;\;\;L\left( {x_n^{\left( t \right)}} \right) \le \gamma \left( {\lambda ,t} \right).\end{array} \right.$ (9)
式(9)中L(xn(t))表示异常程度值xn(t)对应的似然比,γ(λ, t)表示似然比的判决门限。具体的检测步骤,以及似然比和判决门限的计算过程如下:
步骤1 ?计算在H0假设下异常程度值xn(t)的分布。与文[5]对传感器测量数据的统计假设类似,本文假定在传感器正常工作时,其测量数据服从Gauss分布。由于异常程度值为不同传感器节点测量值的线性组合,因此在H0假设下xn(t)服从Gauss分布:
$x_n^{\left( t \right)}\left| {{H_0} \sim N\left( {\mu _n^{\left( t \right)},\sigma _n^{\left( t \right)}} \right).} \right.$ (10)
式(10)中期望μn(t)和方差σn(t)可以结合历史数据,用极大似然无偏估计器得到:
$\mu _n^{\left( t \right)} = \frac{{\sum\limits_{i = 1}^{t - 1} {x_n^{\left( i \right)}} }}{{t - 1}},$ (11)
$\sigma _n^{\left( t \right)} = \sqrt {\frac{{\sum\limits_{i = 1}^{t - 1} {{{\left( {x_n^{\left( i \right)} - \mu _n^{\left( i \right)}} \right)}^2}} }}{{t - 2}}} .$ (12)
步骤2 ?计算异常程度值xn(t)H1假设下的分布。如式(8)所示,在H1假设下,故障传感器的测量值是真实值与测量偏差的叠加。其中故障传感器的测量偏差Δs服从均值为μe,方差为σe的Gauss分布,该分布的均值和方差由传感器器件的实际情况决定。即式(8)中测量偏差Δs的分布为
$\Delta s \sim N\left( {{\mu _{\rm{e}}},{\sigma _{\rm{e}}}} \right).$ (13)
结合式(8)、(10)和(13),即可得到:
$x_n^{\left( t \right)}\left| {{H_1} \sim N\left( {\mu _n^{\left( t \right)} + 2{\mu _{\rm{e}}},\sqrt {{{\left( {\sigma _n^{\left( t \right)}} \right)}^2} + 4\sigma _{\rm{e}}^2} } \right)} \right..$ (14)
步骤3 ?结合式(10)和式(14)计算异常程度值xn(t)的似然比:
$\begin{array}{l}L\left( {x_n^{\left( t \right)}} \right) = \frac{{P\left( {x_n^{\left( t \right)}\left| {{H_1}} \right.} \right)}}{{P\left( {x_n^{\left( t \right)}\left| {{H_0}} \right.} \right)}} = \frac{{\sigma _n^{\left( t \right)}}}{{\sqrt {{{\left( {\sigma _n^{\left( t \right)}} \right)}^2} + 4\sigma _{\rm{e}}^2} }} \cdot \\\exp \left[ {\frac{{{{\left( {x_n^{\left( t \right)} - \mu _n^{\left( t \right)}} \right)}^2}}}{{2{{\left( {\sigma _n^{\left( t \right)}} \right)}^2}}} - \frac{{\left( {x_n^{\left( t \right)} - \mu _n^{\left( t \right)} - 2{\mu _{\rm{e}}}} \right)}}{{2{{\left( {\sigma _n^{\left( t \right)}} \right)}^2} + 8\sigma _{\rm{e}}^2}}} \right].\end{array}$ (15)
步骤4 ?确定判决门限。不妨假设传感器故障到达时间服从负指数分布,那么根据传感器单位时间内平均故障次数λ[15-16],可得传感器在t时刻出现故障的概率为λeλt。随着传感器工作时间的增加,传感器出现故障的概率增大。由此,对异常点的判决门限将随着传感器的使用时间而调整。给定检测结果的置信区间为α,选取的判决门限γ(λ, t)应服从如下约束:
$P\left( {L\left( {x_n^{\left( t \right)}} \right) > \gamma \left( {\lambda ,t} \right)\left| {{H_0};t} \right.} \right) = 1 - \alpha .$ (16)
根据式(16),结合故障参数和历史测量数据即可确定虚警率为(1-α)时的判决门限。
由此,整个传感器网络当前时刻的异常点检测结果为
$D\left( {V;t} \right) = \left\{ {v_n^{\left( t \right)}\left| {L\left( {x_n^{\left( t \right)}} \right) > \gamma \left( {\lambda ,t} \right)} \right.} \right\}.$ (17)
3 仿真实验3.1 实验配置本文采用MATLAB?软件进行仿真实验,在合成数据集、城市气温数据集[17]和地磁台网数据集[18]上对该方法的检测性能进行考察,并与Bettencourt方法和LOCI方法进行对比。在仿真中采用受试者工作特征(receiver operating characteristic, ROC)[19]曲线来反映各方法的检测率随着虚警率变化的情况。在相同的虚警率下检测率越高,表明对应方法的性能越好[4]
3.2 实验结果3.2.1 合成数据集本文首先在合成的随机数据集上进行仿真。设计一个由210个传感器组成的网络。假设依据传感器相互的近邻关系可将传感器数据分为3类,每类包含70个传感器实体。通过对不同的Gauss分布进行采样,生成各类观测数据。每类数据的分布期望为μ1=5, μ2=35, μ3=65, 分布方差为σ1=σ2=σ3=5。设平均故障间隔时间1/λ=30,并在各时刻从网络中随机选择节点作为故障节点。根据传感器故障模型,传感器网络在第t时刻的故障点数目为210×(λeλt)。在每个故障节点对(μe, σe)的Gauss分布进行采样,生成测量偏差。图 2显示了在虚警率为0.1时,各方法的检测率随μe的变化曲线。仿真中其他参数设置为σe=10, k=6, l=3。该结果表明,本文方法与其他2种方法相比,在测量偏差期望值不同时,始终具有更好的检测性能。图 3μe=30时本文方法检测性能随参数kl的变化情况。其中图 3a为虚警率为0.1,l=3时,本文方法在参数k取不同值时的检测率;图 3b为虚警率为0.1,k=6时,本文方法在参数l取不同值时的检测率。该仿真结果表明在虚警率为0.1,参数kl发生变化时,本文方法检测性能的变化幅度不超过0.02。图 4显示了在μe=30时,本文方法与其他2种方法的ROC曲线。在合成数据集上的仿真结果表明:本文方法在相同的虚警率下具有更高的检测率。
图 2 虚警率为0.1时,检测率随测量偏差分布期望的变化
图选项





图 3 本文方法的检测性能分别随参数kl的变化
图选项





图 4 合成数据集上的ROC曲线对比图
图选项





3.2.2 真实数据集1) 城市气温数据集。
城市气温数据集来源于美国气象网站公布的该国各城市气温的历史测量数据。本文随机选取了其中206个城市站点在2个月的每日平均气温数据。与文[12]对该数据集的处理方式类似,本文认为真实的测量数据都是正确的,通过人为地加入测量偏差来制造故障点,对μe=20℉, σe=5℉的Gauss分布进行采样生成测量偏差数据。仿真中其他参数设置与合成数据集上仿真参数设置相同。实验中共进行了2 000次仿真实验。图 5显示了各方法在温度数据集上的ROC曲线。该结果表明:本文方法在相同的虚警率下取得了更高的检测率,具有更好的检测性能。
图 5 温度数据集上的ROC曲线对比图
图选项





2) 地磁台网数据集。
本文通过中国地磁台网公布的地磁强度测量数据进行了进一步的仿真实验。该台网由分布在中国12个城市的地磁台站组成。选取所有台站在2012年全年的每日测量数据进行实验。与城市气温数据集上的仿真类似,本文通过人为加入测量偏差生成异常数据, 对μe=5×104 nT, σe=100 nT的Gauss分布进行采样来生成测量偏差数据。其余仿真参数的设置与气温数据集仿真中的设置相同。实验中共进行了15 000次仿真实验。图 6显示了地磁数据集上的ROC曲线。该仿真结果表明本文方法在该数据集上仍然具有更好的检测性能。
图 6 地磁数据集上的ROC曲线对比图
图选项





以上3组实验表明:与现有方法相比,本文方法充分利用节点之间的空-时相关性,并且引入传感器在正常工作和故障情况下测量数据的统计模型,取得了更好的检测性能。
在实时计算过程中,本文提出的异常点检测方法可以分为2个环节。第1个环节为线下计算部分:基于传感器网络的历史数据统计传感器异常程度值的分布参数,并计算似然比检验的判决门限。第2个环节为线上计算环节:判断每个传感器当前时刻是否出现故障,此环节可以并行处理。采用的硬件平台为Intel Xeon CPU E3(频率为3.40 GHz),8 GB RAM;软件平台为MATLAB。分别统计该算法的线下运行时间和对每个节点的线上检测时间,结果如表 1所示。其中数据规模为传感器数目与时间序列长度之积。
表 1 本文方法在仿真实验中运行时间的统计结果
数据集 数据规模 线下运行时间/s 线上运行时间/s
合成数据集 210×30 2.64 7.81×10-2
气温数据集 206×30 2.53 6.25×10-2
地磁数据集 12×30 0.16 3.13×10-2


表选项






上述仿真结果表明,本文方法在该平台上的线上计算环节用时不超过0.1 s。在后续的工作中,将进一步研究该方法在GPU或FPGA平台上的快速计算方法。
4 结论本文针对传感器网络的异常点检测问题,基于空-时近邻关系和似然比检验技术,提出了有效的异常点检测方法。基于最大后验概率选取待检测传感器在当前时刻的空间近邻点,同时选取待检传感器在之前若干个时刻的对应节点作为其时间近邻点。然后基于待检节点与其空-时近邻点测量数据之间的差异量化其异常程度,并引入传感器的故障模型,采用似然比检验对传感器是否出现故障做出判决。仿真结果表明,该方法在相同的虚警率下具有更高的检测率,具有更好的检测性能。

参考文献
[1] 蔡劼, 顾明. 基于IEEE 802.15.4的星形拓扑传感器网络性能分析[J]. 清华大学学报(自然科学版), 2015, 55(5): 565–571.CAI Jie, GU Ming. Performance analysis of star topology wireless sensor networks based on IEEE 802.15.4[J]. Journal of Tsinghua University (Science and Technology), 2015, 55(5): 565–571. (in Chinese)
[2] Liu Y, He Y, Li M, et al. Does wireless sensor network scale? A measurement study on GreenOrbs[J]. IEEE Transactions on Parallel and Distributed Systems, 2013, 24(10): 1983–1993. DOI:10.1109/TPDS.2012.216
[3] Mainwaring A, Culler D, Polastre J, et al. Wireless sensor networks for habitat monitoring[C]//Proceedings of the 1st ACM International Workshop on Wireless Sensor Networks and Applications. New York, NY, USA:ACM Press, 2002:88-97. https://people.eecs.berkeley.edu/~culler/papers/wsna02.pdf
[4] Zhang Y, Meratnia N, Havinga P. Outlier detection techniques for wireless sensor networks:A survey[J]. IEEE Communications Surveys & Tutorials, 2010, 12(2): 159–170.
[5] 蒋晓隆, 刘培, 李政. 数据协调方法在传感器故障监测中的应用[J]. 清华大学学报(自然科学版), 2014, 54(6): 763–768.JIANG Xiaolong, LIU Pei, LI Zheng. Data reconciliation for sensor fault monitoring[J]. Journal of Tsinghua University (Science and Technology), 2014, 54(6): 763–768. (in Chinese)
[6] Han J, Kamber M, Pei J. Data Mining:Concepts and Techniques[M]. Burlington, VT, USA: Morgan Kaufmann Press, 2012.
[7] Knox E M, Ng R T. Algorithms for mining distance-based outliers in large datasets[C]//Proceedings of the International Conference on Very Large Data Bases. Burlington, VT, USA:Morgan Kaufmann Press, 1998:392-403. http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.55.8026&or=7
[8] Rajasegarar S, Leckie C, Palaniswami M, et al. Distributed anomaly detection in wireless sensor networks[C]//IEEE Singapore International Conference on Communication Systems. Singapore, Singapore:IEEE Press, 2006:1-5. http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=4085803
[9] Bettencourt L M A, Hagberg A A, Larkey L B. Separating the wheat from the chaff:Practical anomaly detection schemes in ecological applications of distributed sensor networks[C]//International Conference on Distributed Computing in Sensor Systems. Berlin, German:Springer Press, 2007:223-239. http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.109.3091
[10] Papadimitriou S, Kitagawa H, Gibbons P B, et al. Loci:Fast outlier detection using the local correlation integral[C]//19th International Conference on Data Engineering (ICDE). Bangalore, India:IEEE Press, 315-326. http://ieeexplore.ieee.org/document/1260802/
[11] Ramaswamy S, Rastogi R, Shim K. Efficient algorithms for mining outliers from large data sets[J]. ACM Sigmod Record, 2000, 29(2): 427–438. DOI:10.1145/335191
[12] Sandryhaila A, Moura J M F. Discrete signal processing on graphs:Frequency analysis[J]. IEEE Transactions on Signal Processing, 2014, 62(12): 3042–3054. DOI:10.1109/TSP.2014.2321121
[13] Chandola V, Banerjee A, Kumar V. Anomaly detection:A survey[J]. ACM Computing Surveys, 2009, 41(3): 75–79.
[14] Zhang K, Hutter M, Jin H. A new local distance-based outlier detection approach for scattered real-world data[C]//Pacific-Asia Conference on Knowledge Discovery and Data Mining. Berlin, German:Springer Press, 2009:813-822. https://openresearch-repository.anu.edu.au/bitstream/1885/14967/1/Zhang et al A New Local Distance Based Outlier 2009.pdf
[15] Bruwer F J, Viljoen J, Swanepoel N J. Sensor Structure:World Intellectual Property Organization, WO/2008/052229[P]. 2008-05-02.
[16] Paik B G, Cho S R, Park B J, et al. Characteristics of wireless sensor network for full-scale ship application[J]. Journal of Marine Science and Technology, 2009, 14(1): 115–126. DOI:10.1007/s00773-008-0038-x
[17] NOAA. Global summary of the day[Z/OL].[2017-01-15]. ftp://ftp.ncdc.noaa.gov/pub/data/gsod
[18] 国家地磁台网中心. 数据服务: 观测数据[Z/OL]. [2017-01-15]. http://oa.global183.com/. Geomagnetic Network of China. Data service:Observation data[Z/OL].[2017-01-15]. http://oa.global183.com/. (in Chinese)
[19] Lazarevic A, Ert?z L, Kumar V, et al. A comparative study of anomaly detection schemes in network intrusion detection[C]//Siam International Conference on Data Mining. San Francisco, CA, USA:SIAM Press, 2003:25-36. https://link.springer.com/content/pdf/10.1007/978-3-540-87403-4_19.pdf

相关话题/传感器 数据

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 跨云存储环境下协同的动态数据持有方案
    曹来成,何文文,刘宇飞,郭显,冯涛兰州理工大学计算机与通信学院,兰州730050收稿日期:2016-12-18基金项目:国家自然科学基金资助项目(61562059,61461027,61462060)作者简介:曹来成(1965-),男,副教授。E-mail:caolch@lut.cn摘要:为了认证跨 ...
    本站小编 Free考研考试 2020-04-15
  • 基于联合模型的商品口碑数据情感挖掘
    王素格1,2,李大宇1,李旸11.山西大学计算机与信息技术学院,太原030006;2.山西大学计算智能与中文信息处理教育部重点实验室,太原030006收稿日期:2016-12-06基金项目:国家自然科学基金资助项目(61573231,61632011,61672331,61432011,U14352 ...
    本站小编 Free考研考试 2020-04-15
  • 利用自识别的供水管网监测数据质量控制
    刘书明,吴以朋,车晗清华大学环境学院,北京100084收稿日期:2014-11-14基金项目:国家水体污染与治理重大专项(2014ZX07406003)作者简介:刘书明(1976-),男,副教授。E-mail:shumingliu@tsinghua.edu.cn摘要:复杂庞大的供水管网系统拥有众多监 ...
    本站小编 Free考研考试 2020-04-15
  • 基于密度的不确定数据流聚类算法
    韩东红,宋明,张宏亮,王佳茜,王嘉兴,王国仁东北大学计算机科学与工程学院,沈阳110819收稿日期:2016-09-27基金项目:国家自然科学基金面上项目(61173029,61672144)作者简介:韩东红(1968-),女,副教授。E-mail:handonghong@cse.neu.edu.c ...
    本站小编 Free考研考试 2020-04-15
  • 分布式环境下业务模型的数据存储及访问框架
    蔡鸿明,姜祖海,姜丽红上海交通大学软件学院,上海200240收稿日期:2016-10-28基金项目:国家自然科学基金面上项目(61373030,71171132)作者简介:蔡鸿明(1975-),男,教授。E-mail:hmcai@sjtu.edu.cn摘要:构造业务模型以支持应用系统开发是基于模型驱 ...
    本站小编 Free考研考试 2020-04-15
  • 适用于海量数据应用的多维Hash表结构
    吴泉源,彭灿,郑毅,卜俊丽国防科技大学计算机学院,长沙410073收稿日期:2016-06-28作者简介:吴泉源(1942-),男,教授。E-mail:wuquanyuan@126.com摘要:传统的Hash表通过对目标数据进行Hash计算,可以实现数据的快速存取与检索。为了保持较好的存储性能,需要 ...
    本站小编 Free考研考试 2020-04-15
  • 基于大数据的社会治理数据集成及决策分析方法
    洪之旭1,陈浩2,程亮31.泰华智慧产业集团股份有限公司,济南250101;2.济南市市中区发展和改革委员会,济南250001;3.九三学社济南市委员会,济南250012收稿日期:2016-06-30作者简介:洪之旭(1977-),男,高级工程师。E-mail:hongzhixu@126.com摘要 ...
    本站小编 Free考研考试 2020-04-15
  • THUYG-20:免费的维吾尔语语音数据库
    艾斯卡尔·肉孜1,殷实1,张之勇1,王东1,艾斯卡尔·艾木都拉2,郑方11.清华大学计算机科学与技术系,清华信息科学技术国家实验室,信息技术研究院,北京100084;2.新疆大学信息科学与工程学院,乌鲁木齐830046收稿日期:2016-06-24基金项目:国家自然科学基金项目(61271389,6 ...
    本站小编 Free考研考试 2020-04-15
  • 低能耗的无线传感器网络隐私数据融合方法
    苘大鹏1,王臣业2,杨武1,王巍1,玄世昌1,靳小鹏11.哈尔滨工程大学信息安全研究中心,哈尔滨150001;2.哈尔滨工程大学国家大学科技园,哈尔滨150001收稿日期:2016-06-29基金项目:国家自然科学基金资助项目(61272537,61472098);中央高校基本科研业务费专项资金资助 ...
    本站小编 Free考研考试 2020-04-15
  • 基于海量车牌识别数据的相似轨迹查询方法
    赵卓峰,卢帅,韩燕波北方工业大学大规模流数据集成与分析技术北京市重点实验室,北京100144收稿日期:2016-06-28基金项目:国家自然科学基金重点项目(61033006);北京市自然科学基金项目(4162021)作者简介:赵卓峰(1977-),男,副研究员。E-mail:edzhao@ncut ...
    本站小编 Free考研考试 2020-04-15