1(延边大学计算机科学与技术系 吉林延吉 133002); 2(南开大学计算机学院 天津 300350); 3(南开大学网络空间安全学院 天津 300350) (zhangzhenguo@dbis.nankai.edu.cn)
出版日期:
2019-03-01基金资助:
国家自然科学基金项目(61772289);吉林省教育厅“十三五”科学技术项目(JJKH20191125KJ)Time Series Shapelets Extraction via Similarity Join
Zhang Zhenguo1,2, Wang Chao2, Wen Yanlong2, Yuan Xiaojie31(Department of Computer Science and Technology, Yanbian University, Yanji, Jilin 133002); 2(College of Computer Science, Nankai University, Tianjin 300350); 3(College of Cyber Science, Nankai University, Tianjin 300350)
Online:
2019-03-01摘要/Abstract
摘要: 在时间序列分类问题中,以Shapelets特征为基础的分类算法具有很高的分类准确率和良好的可解释性,因此,高辨别能力Shapelets的提取已成为时间序列研究领域重要的研究热点之一.对于Shapelets提取的研究已取得了很多优秀的成果,但仍存在一些问题,主要是由于通过遍历所有子序列来获取Shapelets的方式非常耗时.尽管可以采取剪枝策略优化该过程,但往往会损失分类准确率.为此,提出一种基于相似性连接的Shapelets提取方法,该方法舍弃逐一判断子序列分类能力的策略,而是以子序列为单位,通过相似性连接的思想构建时序数据间的相似性向量.对于不同类别的时序数据,计算每一对时序数据间的差异向量,进而得到表示时序数据集中不同类别间差异的候选矩阵,然后根据候选矩阵的数值差异,快速筛选出具有高分类能力的Shapelets集合.在真实数据集上的大量实验表明:相比于现有的Shapelets提取方法,这种相似性连接方法所得到的Shapelets在分类任务中不仅具有很好的时间效率,而且能保证高分类准确率.
参考文献
相关文章 15
[1] | 徐坤浩, 聂铁铮, 申德荣, 寇月, 于戈. 基于CPU-GPU异构体系结构的并行字符串相似性连接方法[J]. 计算机研究与发展, 2021, 58(3): 598-608. |
[2] | 赵洪科,吴李康,李徵,张兮,刘淇,陈恩红. 基于深度神经网络结构的互联网金融市场动态预测[J]. 计算机研究与发展, 2019, 56(8): 1621-1631. |
[3] | 刘颉羲,陈松灿. 基于混合门单元的非平稳时间序列预测[J]. 计算机研究与发展, 2019, 56(8): 1642-1651. |
[4] | 高腾飞,刘勇琰,汤云波,张垒,陈丹. 面向时间序列大数据海量并行贝叶斯因子化分析方法[J]. 计算机研究与发展, 2019, 56(7): 1567-1577. |
[5] | 彭成维,云晓春,张永铮,李书豪. 一种基于域名请求伴随关系的恶意域名检测方法[J]. 计算机研究与发展, 2019, 56(6): 1263-1274. |
[6] | 庄连生, 吕扬, 杨健, 李厚强. 时频联合长时循环神经网络[J]. 计算机研究与发展, 2019, 56(12): 2641-2648. |
[7] | 朝鲁,彭晓晖,徐志伟. 变熵画像:一种数量级压缩物端数据的多粒度信息模型[J]. 计算机研究与发展, 2018, 55(8): 1653-1666. |
[8] | 郭帅,郭忠文,仇志金. HSMA:面向物联网异构数据的模式分层匹配算法[J]. 计算机研究与发展, 2018, 55(11): 2522-2531. |
[9] | 秦俊平,邓庆绪,孙诗文,仁庆道尔吉,佟海滨,苏宪利. 基于时间序列启发式信息的室内轨迹跟踪算法[J]. 计算机研究与发展, 2017, 54(12): 2698-2710. |
[10] | 苑卫国,刘云. 微博用户特征量增长规律研究[J]. 计算机研究与发展, 2015, 52(2): 522-532. |
[11] | 吴红花,刘国华,王 伟. 不确定时间序列的相似性匹配问题[J]. 计算机研究与发展, 2014, 51(8): 1802-1810. |
[12] | 苏卫星, 朱云龙, 刘 芳, 胡琨元,. 时间序列异常点及突变点的检测算法[J]. 计算机研究与发展, 2014, 51(4): 781-788. |
[13] | 郑黎明, 邹 鹏, 韩伟红, 李爱平, 贾 焰,. 基于多维熵值分类的骨干网流量异常检测研究[J]. , 2012, 49(9): 1972-1981. |
[14] | 王 权 陈松灿. 基于l1-正则化的ELM回归集成学习[J]. , 2012, 49(12): 2631-2637. |
[15] | 林子雨, 江 弋, 赖永炫, 林 琛,. 一种新的时间序列延迟相关性分析算法——三点预测探查法[J]. , 2012, 49(12): 2645-2655. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3890