删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

一种面向大规模序列数据的交互特征并行挖掘算法

本站小编 Free考研考试/2022-01-01

赵宇海,印莹,李源,汪嗣尧,王国仁
(东北大学计算机科学与工程学院 沈阳 110819) (zhaoyuhai@mail.neu.edu.cn)
出版日期: 2019-05-01


基金资助:国家重点研发计划项目(2018YFB1004402);国家自然科学基金面上项目(61772124)

A Parallel Algorithm for Mining Interactive Features from Large Scale Sequences

Zhao Yuhai, Yin Ying, Li Yuan, Wang Siyao, Wang Guoren
(School of Computer Science and Engineering, Northeastern University, Shenyang 110819)
Online: 2019-05-01







摘要/Abstract


摘要: 序列是一种重要的数据类型,在诸多应用领域广泛存在.基于序列的特征选择具有广阔的现实应用场景.交互特征是指一组整体具有显著强于单独个体与目标相关性的特征集合.从大规模序列中挖掘交互特征面临着位点的“组合爆炸”问题,计算挑战性极大.针对该问题,以生物领域高通量测序数据为背景,提出了一种新的基于并行处理和演化计算的高阶交互特征挖掘算法.位点数是制约交互作用挖掘效率的根本因素.摈弃了现有方法基于序列分块的并行策略,采用基于位点分块的并行思想,具有天然的效率优势.进一步,提出了极大等位公共子序列(maximal allelic common subsequence, MACS)的概念并设计了基于MACS的特征区域划分策略.该策略能将交互特征的查找范围缩小至许多“碎片”空间,并保证不同“碎片”间不存在交互特征,避免计算耦合引起的高额通信代价.利用基于置换搜索的并行蚁群算法,执行交互特征选择.大量真实数据集和合成数据集上的实验结果,证实提出的PACOIFS算法在有效性和效率上优于同类其他算法.






[1]吴宗友, 白昆龙, 杨林蕊, 王仪琦, 田英杰. 电子病历文本挖掘研究综述[J]. 计算机研究与发展, 2021, 58(3): 513-527.
[2]陶涛, 孙玉娥, 陈冬梅, 杨文建, 黄河, 罗永龙. 一种基于智能手机传感器数据的地图轮廓生成方法[J]. 计算机研究与发展, 2020, 57(7): 1490-1507.
[3]陈叶旺, 申莲莲, 钟才明, 王田, 陈谊, 杜吉祥. 密度峰值聚类算法综述[J]. 计算机研究与发展, 2020, 57(2): 378-394.
[4]田继伟,王劲松,石凯. 基于PU与生成对抗网络的POI定位算法[J]. 计算机研究与发展, 2019, 56(9): 1843-1850.
[5]刘芳,李戈,胡星,金芝. 基于深度学习的程序理解研究进展[J]. 计算机研究与发展, 2019, 56(8): 1605-1620.
[6]洪敏,贾彩燕,李亚芳,于剑. 样本加权的多视图聚类算法[J]. 计算机研究与发展, 2019, 56(8): 1677-1685.
[7]高腾飞,刘勇琰,汤云波,张垒,陈丹. 面向时间序列大数据海量并行贝叶斯因子化分析方法[J]. 计算机研究与发展, 2019, 56(7): 1567-1577.
[8]韩东明,郭方舟,潘嘉铖,郑文庭,陈为. 面向时序数据异常检测的可视分析综述[J]. 计算机研究与发展, 2018, 55(9): 1843-1852.
[9]王一舒,袁野,刘萌,王国仁. 大规模时序图数据的查询处理与挖掘技术综述[J]. 计算机研究与发展, 2018, 55(9): 1889-1902.
[10]朝鲁,彭晓晖,徐志伟. 变熵画像:一种数量级压缩物端数据的多粒度信息模型[J]. 计算机研究与发展, 2018, 55(8): 1653-1666.
[11]段琼,田博,陈征,王洁,何增有. CUDA-TP:基于GPU的自顶向下完整蛋白质鉴定并行算法[J]. 计算机研究与发展, 2018, 55(7): 1525-1538.
[12]李建江,陈玮,李明,张凯,刘雅俊. 基于网格热度值的船舶规律路径提取算法[J]. 计算机研究与发展, 2018, 55(5): 908-919.
[13]苏华友, 温文, 李东升. 面向GPU的单颗粒冷冻电镜软件RELION并行与优化[J]. 计算机研究与发展, 2018, 55(2): 409-417.
[14]刘旭, 杨章, 杨扬. 针对天河2号的一种嵌套剖分负载平衡算法[J]. 计算机研究与发展, 2018, 55(2): 418-425.
[15]张恒山,高宇坤,陈彦萍,王忠民. 基于群体智慧的簇连接聚类集成算法[J]. 计算机研究与发展, 2018, 55(12): 2611-2619.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3926
相关话题/计算机 数据 序列 计算 实验

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 数据驱动的数学试题难度预测
    佟威,汪飞,刘淇,陈恩红(中国科学技术大学计算机学院合肥230027)(tongw@mail.neea.edu.cn)出版日期:2019-05-01基金资助:全国教育科学规划基金项目(FCB160610);国家自然科学基金项目(61672483,U1605251);中国科协青年人才托举工程&CCF青 ...
    本站小编 Free考研考试 2022-01-01
  • 基于CNN噪声分离模型的噪声水平估计算法
    徐少平,刘婷云,李崇禧,唐祎玲,胡凌燕(南昌大学信息工程学院南昌330031)(xushaoping@ncu.edu.cn)出版日期:2019-05-01基金资助:国家自然科学基金项目(61662044,61163023,51765042);江西省自然科学基金项目(20171BAB202017)No ...
    本站小编 Free考研考试 2022-01-01
  • 一种面向多源异构数据的协同过滤推荐算法
    吴宾,娄铮铮,叶阳东(郑州大学信息工程学院郑州450001)(wubin@gs.zzu.edu.cn)出版日期:2019-05-01基金资助:国家重点研发计划项目(2018YFB1201403);国家自然科学基金项目(61772475,61502434)ACollaborativeFiltering ...
    本站小编 Free考研考试 2022-01-01
  • 基于历史数据的虚拟机资源分配方法
    王海涛,李战怀,张晓,卜海龙,孔兰昕,赵晓南(西北工业大学计算机学院西安710129)(工信部大数据存储与管理重点实验室(西北工业大学)西安710129)(wanght@mail.nwpu.edu.cn)出版日期:2019-04-01基金资助:国家自然科学基金项目(61520106005,61761 ...
    本站小编 Free考研考试 2022-01-01
  • 纠删码存储系统中基于网络计算的高效故障重建方法
    唐英杰,王芳,谢燕文(武汉光电国家研究中心(华中科技大学)武汉430074)(信息存储系统教育部重点实验室(华中科技大学)武汉430074)(深圳华中科技大学研究院广东深圳518000)(tangyingjie@mail.hust.edu.cn)出版日期:2019-04-01基金资助:国家自然科学基 ...
    本站小编 Free考研考试 2022-01-01
  • 一种基于斯格明子介质的高效存内计算框架
    刘必成,顾海峰,陈铭松,谷守珍,陈闻杰(上海市高可信计算重点实验室(华东师范大学)上海200062)(51151500030@stu.ecnu.edu.cn)出版日期:2019-04-01基金资助:国家自然科学基金项目(61520106005,61761136014);国家重点研发计划项目(2017 ...
    本站小编 Free考研考试 2022-01-01
  • 划分序乘积空间:基于划分的粒计算模型
    徐怡1,2,姚一豫31(计算智能与信号处理教育部重点实验室(安徽大学)合肥230039);2(安徽大学计算机科学与技术学院合肥230601);3(里贾纳大学计算机科学系加拿大里贾纳S4S0A2)(xuyi1023@126.com)出版日期:2019-04-01基金资助:国家自然科学基金项目(6152 ...
    本站小编 Free考研考试 2022-01-01
  • 基于双线性映射的支持全操作的公共可验证外包数据库模型
    王强,周福才,玄鹏开,吴淇毓(东北大学软件学院沈阳110169)(wangq3635@126.com)出版日期:2019-03-01基金资助:国家自然科学基金项目(61772127,61472184,61321491);国家自然科学基金青年科学基金项目(61703088);中央高校基本科研业务费专项 ...
    本站小编 Free考研考试 2022-01-01
  • 点差分隐私下图数据的度直方图发布方法
    张宇轩1,魏江宏1,李霁1,刘文芬2,胡学先11(数学工程与先进计算国家重点实验室(中国人民解放军战略支援部队信息工程大学)郑州450001);2(广西密码学与信息安全重点实验室(桂林电子科技大学)广西桂林541004)(bigzhangq@163.com)出版日期:2019-03-01基金资助:国 ...
    本站小编 Free考研考试 2022-01-01
  • 基于相似性连接的时间序列Shapelets提取
    张振国1,2,王超2,温延龙2,袁晓洁31(延边大学计算机科学与技术系吉林延吉133002);2(南开大学计算机学院天津300350);3(南开大学网络空间安全学院天津300350)(zhangzhenguo@dbis.nankai.edu.cn)出版日期:2019-03-01基金资助:国家自然科学 ...
    本站小编 Free考研考试 2022-01-01