面向时间序列大数据海量并行贝叶斯因子化分析方法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-01

高腾飞,刘勇琰,汤云波,张垒,陈丹

(武汉大学计算机学院武汉 430072) (gaotengfei@whu.edu.cn)

出版日期: 2019-07-01

基金资助:国家自然科学基金项目(61772380);湖北省自然科学基金创新群体项目(2017CFA007)

A Massively Parallel Bayesian Approach to Factorization-Based Analysis of Big Time Series Data

Gao Tengfei, Liu Yongyan, Tang Yunbo, Zhang Lei, Chen Dan

(School of Computer Science, Wuhan University, Wuhan 430072)

Online: 2019-07-01

摘要/Abstract

摘要： 时间序列大数据记录着复杂系统在时间和空间上大尺度的演化过程,详细描述了系统不同部分之间的相互作用和相互联系.提取时间序列大数据中潜在的低维因子对研究复杂系统的整体机制有着至关重要的作用.大数据的超高维和大尺度导致许多传统因子分析方法难以适应,先验知识缺乏更增加了研究难度.针对这一巨大挑战,提出了一种面向时间序列大数据的海量并行贝叶斯因子化分析方法(the massively parallel Bayesian factorization approach, G-BF).在缺失先验知识的情况下,通过贝叶斯算法导出因子矩阵,将算法映射至CUDA(compute unified device architecture)模型,以大规模并行的方式更新因子矩阵.该方法支持对任意维度张量的因子分解.实验结果表明：1)与通过GPU加速化的因子分解算法G-HALS(GPU-hierarchical alternative least square)相比,G-BF具有更好的运行性能,且随着数据规模的增加,其性能优越性更加明显;2)G-BF在数据处理规模、秩及维度方面都具有良好的可扩展性;3)将G-BF应用于现有子因子融合框架(hierarchical-parallel factor analysis, H-PARAFAC),可将“巨型”张量作为一个整体进行因子化分解(在2个节点上处理10\+{11}个数据元素),其能力较常规方法高出2个数量级.

参考文献

相关文章 5

[1]	廖国琼,姜珊,周志恒,万常选. 基于位置社会网络的双重细粒度兴趣点推荐[J]. 计算机研究与发展, 2017, 54(11): 2600-2610.
[2]	王俊华,左万利,闫昭. 基于朴素贝叶斯模型的单词语义相似度度量[J]. 计算机研究与发展, 2015, 52(7): 1499-1509.
[3]	张挺,杜奕,黄涛,李雪. 一种基于并行SNESIM的空间数据重建方法[J]. 计算机研究与发展, 2015, 52(6): 1431-1442.
[4]	唐亮骆祖莹赵国兴杨旭. 利于GPU计算具有线性并行度的P/G网SOR求解算法[J]. , 2013, 50(7): 1491-1500.
[5]	楼俊钢, 江建慧, 沈张果, 蒋云良, . 软件可靠性预测的相关向量机模型[J]. , 2013, 50(7): 1542-1550.

PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3975

相关话题/数据 计算机 系统 序列 知识

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
基于强化学习的Lustre文件系统的性能调优
张文韬1,2,汪璐1,程耀东1出版日期:2019-07-01基金资助:国家重点研发计划项目(2017YFB0203203);国家自然科学基金项目(11575223)PerformanceOptimizationofLustreFileSystemBasedonReinforcementLearnin ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
2019面向人工智能的计算机体系结构专题前言
刘志勇1，窦勇21（中国科学院计算技术研究所北京100190）；2（国防科技大学长沙410073)收稿日期:2019-06-04修回日期:2019-06-04出版日期:2019-06-01Received:2019-06-04Revised:2019-06-04Online:2019-06-01摘要 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
基于细粒度数据流架构的稀疏神经网络全连接层加速
向陶然1,2，叶笑春1，李文明1，冯煜晶1,2，谭旭1,2，张浩1，范东睿1,21（计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190）；2（中国科学院大学北京100049)(xiangtaoran@ict.ac.cn)出版日期:2019-06-01基金资助:国家重点研发计划项 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
软件定义数据中心网络多约束节能路由算法
何荣希，雷田颖，林子薇(大连海事大学信息科学技术学院辽宁大连116026)(hrx@dlmu.edu.cn)出版日期:2019-06-01基金资助:国家自然科学基金项目(61371091)；大连海事大学“十三五”重点科研项目(3132016318)Multi-ConstrainedEnergy-Sa ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
基于分类型矩阵对象数据的MD fuzzy k-modes聚类算法
李顺勇1，张苗苗1，曹付元21（山西大学数学科学学院太原030006）；2（山西大学计算机与信息技术学院太原030006)(lisy75@sxu.edu.cn)出版日期:2019-06-01基金资助:国家自然科学基金项目(61573229)；山西省基础研究计划项目(201701D121004)；山西 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
一种面向大规模序列数据的交互特征并行挖掘算法
赵宇海,印莹,李源,汪嗣尧,王国仁(东北大学计算机科学与工程学院沈阳110819)(zhaoyuhai@mail.neu.edu.cn)出版日期:2019-05-01基金资助:国家重点研发计划项目(2018YFB1004402)；国家自然科学基金面上项目(61772124)AParallelAlgo ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
障碍空间中基于Voronoi图的不确定数据聚类算法
万静,崔美玉,何云斌,李松(哈尔滨理工大学计算机科学与技术学院哈尔滨150080)(wanjha@163.com)出版日期:2019-05-01基金资助:国家自然科学基金项目(61872105)；黑龙江省教育厅科技研究项目(1253lz004)；黑龙江省留学归国人员科学基金(LC2018030)Un ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
数据驱动的数学试题难度预测
佟威,汪飞,刘淇,陈恩红(中国科学技术大学计算机学院合肥230027)(tongw@mail.neea.edu.cn)出版日期:2019-05-01基金资助:全国教育科学规划基金项目(FCB160610)；国家自然科学基金项目(61672483，U1605251)；中国科协青年人才托举工程&CCF青 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
一种面向多源异构数据的协同过滤推荐算法
吴宾,娄铮铮,叶阳东(郑州大学信息工程学院郑州450001)(wubin@gs.zzu.edu.cn)出版日期:2019-05-01基金资助:国家重点研发计划项目(2018YFB1201403)；国家自然科学基金项目(61772475,61502434)ACollaborativeFiltering ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
轻量级窄带物联网应用系统中高效可验证加密方案
钱涵佳1,王宜怀1,2,彭涛1,陈成1,罗喜召11(苏州大学计算机科学与技术学院江苏苏州215006);2(苏州市嵌入式技术及应用重点实验室(苏州大学)江苏苏州215006)(20164227026@stu.suda.edu.cn)出版日期:2019-05-01基金资助:国家自然科学基金项目(616 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01