文献详情
基于动态时间规整的时序数据相似连接
外文标题:Similarity Join on Time Series under Dynamic Time Warping
文献类型:期刊
期刊名称:计算机学报
年:2018
卷:41
期:8
页码:1798-1813
ISSN:0254-4164
关键词:动态时间规整;时序数据;相似连接;划分剪枝;分布剪枝
链接地址:http://d.oldg.wanfangdata.com.cn/Periodical_jsjxb201808007.aspx
摘要:由于蕴含事物发展规律,时序数据上的数据挖掘正成为大数据决策的重要组成部分.作为时序数据挖掘的一种基本操作,时序数据相似连接可以找出给定相似度度量下的所有相似时序数据对.研究表明,动态时间规整(Dynamic Time Warping,DTW)正在文本挖掘、趋势预测等越来越多的科学与社会应用领域中成为时序数据上目前最佳的相似性度量方法.该文首次提出采用DTW作为相似性度量方法的时序数据相似连接问题.特别地,该文首次提出了基于阈值和基于Top-k的两种DTW度量上的时间序列相似连接任务.除了服务于进一步的时序数据挖掘算法,这两个任务还具有机器翻译、关联检测等广泛的直接应用.但是,直接的相似连接方法因为时序数据的规模大、DTW计算复杂性高而不能在实际中工作.尽管存在很多基于DTW的索引和上下界计算方法,这些工作主要关注DTW度量上的快速检索而非相似连接.因此,这些方法都假设存在一个固定的时序数据作为查询,并根据查询使用时间和空间复杂度很高的方法构建索引或进行预计算.但在文中的相似连接问题中,所有时序数据都是查询,因此这些方法的构建索引和预计算的时间比直接的相似连接方法需要的处理时间还长.为此 ...More
由于蕴含事物发展规律,时序数据上的数据挖掘正成为大数据决策的重要组成部分.作为时序数据挖掘的一种基本操作,时序数据相似连接可以找出给定相似度度量下的所有相似时序数据对.研究表明,动态时间规整(Dynamic Time Warping,DTW)正在文本挖掘、趋势预测等越来越多的科学与社会应用领域中成为时序数据上目前最佳的相似性度量方法.该文首次提出采用DTW作为相似性度量方法的时序数据相似连接问题.特别地,该文首次提出了基于阈值和基于Top-k的两种DTW度量上的时间序列相似连接任务.除了服务于进一步的时序数据挖掘算法,这两个任务还具有机器翻译、关联检测等广泛的直接应用.但是,直接的相似连接方法因为时序数据的规模大、DTW计算复杂性高而不能在实际中工作.尽管存在很多基于DTW的索引和上下界计算方法,这些工作主要关注DTW度量上的快速检索而非相似连接.因此,这些方法都假设存在一个固定的时序数据作为查询,并根据查询使用时间和空间复杂度很高的方法构建索引或进行预计算.但在文中的相似连接问题中,所有时序数据都是查询,因此这些方法的构建索引和预计算的时间比直接的相似连接方法需要的处理时间还长.为此,该文针对两种相似连接任务提出了两个基于DTW上下界的剪裁框架用于减少准确DTW相似性的计算次数.基于划分,该文为DTW度量设计了新颖的上下界计算方案.由于细粒度的划分带来上下界接近准确的DTW相似性但需要更长的计算时间,而粗粒度的划分需要更短的计算时间和与准确DTW相似性有较大差距的上下界,该文设计了基于二分查找的机制来自动找到合适的划分粒度,实现了整体的高处理性能.面对单机不能容纳全部时序数据和运行时间长的情况,该文将提出的两种相似连接处理框架利用MapReduce并行计算框架扩展到了分布式环境.该文在两个真实数据集上验证了文中提出的DTW相似连接在实际应用中的效果,并在真实与合成数据集上进行了充分的实验,验证了文中方法的高效性. ...Hide
DOI:10.11897/SP.J.1016.2018.01798
百度学术:基于动态时间规整的时序数据相似连接
语言:中文
人气指数:43
浏览次数:43
基金:国家重点研发计划项目; 国家自然科学基金重点项目
作者其他论文
暂无数据...
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
基于动态时间规整的时序数据相似连接
本站小编 Free考研/2020-04-17
相关话题/数据 计算
基于DMSP/OLS数据的区域碳排放时空动态研究
文献详情基于DMSP/OLS数据的区域碳排放时空动态研究外文标题:Spatial-temporaldynamicsofcarbondioxideemissionsinChinabasedonDMSP/OLSnighttimestablelightdata文献类型:期刊作者:李海萍[1]龙宓[2]李光 ...中国人民大学科研学术 本站小编 Free考研 2020-04-17可信数据概念构建及其实现路径——基于文献研究与ISO文件管理国际标准的协同应用
文献详情可信数据概念构建及其实现路径——基于文献研究与ISO文件管理国际标准的协同应用外文标题:ConceptualConstructionandImplementationofTrustedData:BasedonLiteratureResearchandCollaborativeApplicat ...中国人民大学科研学术 本站小编 Free考研 2020-04-17私人部门信贷约束与资本流动——基于跨国面板的数据分析
文献详情私人部门信贷约束与资本流动——基于跨国面板的数据分析文献类型:期刊期刊名称:投资研究年:2018期:03页码:66-77ISSN:1003-7624关键词:私人部门信贷约束;资本流动;金融体制改革摘要:本文在文献分析和理论分析的基础上,利用159个国家和地区1970-2015年面板数据来研究 ...中国人民大学科研学术 本站小编 Free考研 2020-04-17大数据侦查给证据法带来的挑战
文献详情大数据侦查给证据法带来的挑战文献类型:期刊期刊名称:人民检察年:2018期:01页码:54-57ISSN:1004-4043关键词:司法鉴定;何家弘;关联性判断;证据材料;证据法;摘要:何家弘:本次沙龙邀请到邓昌智高级工程师、张桂勇副巡视员、张建伟教授和刘广三教授等几位嘉宾。沙龙的主题是"大 ...中国人民大学科研学术 本站小编 Free考研 2020-04-17数据库中不等式查询语句的resilience计量
文献详情数据库中不等式查询语句的resilience计量外文标题:Resiliencecomputationforquerieswithinequalitiesindatabases文献类型:期刊期刊名称:计算机应用年:2018卷:38期:7页码:1893-1897,1915ISSN:1001-90 ...中国人民大学科研学术 本站小编 Free考研 2020-04-17数据可视化传播效果的眼动实验研究
文献详情数据可视化传播效果的眼动实验研究文献类型:期刊期刊名称:国际新闻界年:2018期:04页码:162-176ISSN:1002-5685关键词:数据可视化;传播效果;眼动实验摘要:近些年,学界对数据新闻的各项研究如火如荼,作为数据新闻较为直接和直观的体现——数据可视化也随之日渐盛行。目前,数据 ...中国人民大学科研学术 本站小编 Free考研 2020-04-17宗教信仰与普遍信任:促进还是抑制?——基于CGSS2012的数据分析
文献详情宗教信仰与普遍信任:促进还是抑制?——基于CGSS2012的数据分析文献类型:期刊期刊名称:世界经济文汇年:2018期:3页码:78-98ISSN:0488-6364关键词:宗教信仰;普遍信任;社会互动链接地址:http://d.oldg.wanfangdata.com.cn/Periodi ...中国人民大学科研学术 本站小编 Free考研 2020-04-17调控维护短期平稳增长 改革激发长期发展动力——中国宏观经济论坛月度数据分析报告(2018年5月)
文献详情调控维护短期平稳增长改革激发长期发展动力——中国宏观经济论坛月度数据分析报告(2018年5月)文献类型:期刊期刊名称:宏观经济管理年:2018期:06页码:29-35ISSN:1004-907X关键词:全面深化改革;内生动力;高质量发展摘要:2018年1-4月数据显示,我国宏观经济在中高位平 ...中国人民大学科研学术 本站小编 Free考研 2020-04-17贫困村互助资金降低农户脆弱性了吗——来自5省1213户三期面板数据的证据
文献详情贫困村互助资金降低农户脆弱性了吗——来自5省1213户三期面板数据的证据文献类型:期刊期刊名称:农业技术经济年:2018期:06页码:57-70ISSN:1000-6370关键词:贫困村互助资金;农户脆弱性;广义倾向得分匹配;面板数据摘要:贫困村互助资金是解决贫困地区农户信贷问题的重要探索。 ...中国人民大学科研学术 本站小编 Free考研 2020-04-17政府职责体系建设视角中的数字政府和数据治理
文献详情政府职责体系建设视角中的数字政府和数据治理外文标题:DigitalGovernmentandDataGovernanceinthePerspectiveofGovernmentResponsibilitySystemConstruction文献类型:期刊期刊名称:中国行政管理年:2018期: ...中国人民大学科研学术 本站小编 Free考研 2020-04-17