黄廷磊2,3,,,
任文娟2,3,,
许光銮2,3,
①.中国科学院大学 ??北京 ??100049
②.中国科学院电子学研究所 ??北京 ??100190
③.中国科学院空间信息处理与应用系统技术重点实验室 ??北京 ??100190
基金项目:国家自然科学基金(61725105, 61331017)
详细信息
作者简介:韩昭蓉(1992–),女,山西运城人,2015年在西安电子科技大学获得工学学士学位,现为中国科学院大学、中国科学院电子学研究所硕士研究生,研究方向为轨迹数据异常点检测、机器学习。E-mail: hanzhaorong15@mails.ucas.ac.cn
黄廷磊(1971–),男,安徽肥东人,博士后,研究员,博士生导师,入选中国科学院“****”并获择优支持。2000年在上海理工大学获得博士学位,现为中国科学院电子学研究所研究员,中国科学院电子所空间智能处理系统研究室主任,主要研究方向为数据挖掘、空间大数据组织管理与可视化。E-mail: tlhuang@mail.ie.ac.cn
任文娟(1982–),女,河南焦作人,副研究员,博士,2011年在中国科学院电子学研究所获得博士学位,现为中国科学院电子学研究所中国科学院空间信息处理与应用系统技术重点实验室副研究员,主要研究方向为多源遥感信息融合处理与应用技术。E-mail: wjren@mail.ie.ac.cn
许光銮(1978–),男,浙江天台人,研究员,博士生导师,2005年在中国科学院电子学研究所获得博士学位,现为中国科学院电子学研究所研究员,中国科学院空间信息处理与应用系统技术重点实验室主任,主要研究方向为地理空间信息挖掘与应用技术。E-mail: gluanxu@mail.ie.ac.cn
通讯作者:黄廷磊 ?tlhuang@mail.ie.ac.cn
中图分类号:TP391计量
文章访问数:3017
HTML全文浏览量:1425
PDF下载量:369
被引次数:0
出版历程
收稿日期:2018-05-14
修回日期:2018-05-30
网络出版日期:2018-07-09
Trajectory Outlier Detection Algorithm Based on Bi-LSTM Model
HAN Zhaorong1,2,3,,HUANG Tinglei2,3,,,
REN Wenjuan2,3,,
XU Guangluan2,3,
①. University of Chinese Academy of Sciences, Beijing 100049, China
②. Institute of Electronics, Chinese Academy of Sciences, Beijing 100190, China
③. Key Laboratory of Technology in Geo-Spatial Information Processing and Application System, Chinese Academy of Sciences, Beijing 100190, China
Funds:The National Natural Science Foundation of China (61725105, 61331017)
More Information
Corresponding author:HUANG Tinglei, tlhuang@mail.ie.ac.cn
摘要
摘要:定位技术的飞速发展催生了时空轨迹大数据,轨迹数据中往往存在着明显偏离轨迹的异常点。检测出轨迹中的异常点对提高数据质量和后续轨迹数据挖掘精度至关重要。该文提出了一种基于双向长短时记忆网络(Bidirectional Long Short-Term Memory, Bi-LSTM)模型的轨迹异常点检测算法。首先对每个轨迹点提取一个6维的运动特征向量,然后构建了一个Bi-LSTM模型,模型输入为一定序列长度的轨迹数据特征向量,输出为轨迹点的类型结果。同时,算法采用了欠采样和过采样的组合方法缓解类别不平衡对检测性能的影响。融合了长短时记忆网络单元和双向网络,Bi-LSTM模型能够自动学习正常点和邻近异常点在运动特征上的差异。基于真实船舶轨迹标注数据的实验结果表明,该文算法的检测性能显著优于恒定速度阈值法、不考虑数据时序性的经典机器学习分类算法和卷积神经网络模型,尤其是召回率达到了0.902,验证了该文算法的有效性。
关键词:轨迹数据/
异常检测/
特征提取/
双向长短时记忆网络
Abstract:The rapid advances in positioning technology have created huge spatio-temporal trajectory data, and there are always obvious aberrant outliers in trajectory data. Detecting outliers in the trajectory is critical to improving data quality and the accuracy of subsequent trajectory data mining tasks. In this paper, we propose a trajectory outlier detection algorithm based on a Bidirectional Long Short-Term Memory (Bi-LSTM) model. First, a six-dimensional motion feature vector is extracted for each trajectory point, and then we construct a Bi-LSTM model. The model input is the trajectory data feature vector of a certain sequence length, and its output is the class type of the current track point. In addition, a combination method of undersampling and oversampling is applied to mitigate the effect of data distribution imbalance on detection performance. The Bi-LSTM model can automatically learn the difference between the normal points and adjacent abnormal points in the motion characteristics by combining the LSTM unit and the bidirectional network. Experimental results based on a real ship trajectory annotation data show that the detection performance of our proposed algorithm significantly exceeds those of the constant velocity threshold algorithm, non-sequential classical machine learning classification algorithms, and convolutional neural network model. Especially, the recall value of the proposed algorithm reaches 0.902, which verifies its effectiveness.
Key words:Trajectory data/
Outlier detection/
Feature extraction/
Bidirectional Long Short-Term Memory (Bi-LSTM) networks
PDF全文下载地址:
https://plugin.sowise.cn/viewpdf/198_55d0d108-4bf0-4b4e-bc32-4e82292ef277_R18039