(国防科技大学系统工程学院 长沙 410073) (yang_ma_cn@163.com)
出版日期:
2021-08-01基金资助:
国家自然科学基金项目(62073333);湖南省研究生科研创新项目(CX20200069)Gene Sequence Representation Learning Based on Virus Transmission Network
Ma Yang, Liu Zeyi, Liang Xingxing, Cheng Guangquan, Yang Fangjie, Cheng Qing, Liu Zhong(College of System Engineering, National University of Defense Technology, Changsha 410073)
Online:
2021-08-01Supported by:
This work was supported by the National Natural Science Foundation of China (62073333) and Graduate Research and Innovation Project of Hunan Province (CX20200069).摘要/Abstract
摘要: 基因序列数据中往往存在大量的非编码和缺失序列,现有的基因序列表示大多通过人工方法对高维的基因序列进行特征提取,不仅非常耗时且成功的预测很大程度依赖于生物学知识的正确利用.基于病毒传播网络构建了一种基于图上下文信息的基因序列表示方法,对目标节点病毒序列进行编码后,使用注意力机制对其邻居节点的序列信息进行聚合,从而得到目标节点病毒序列的新的低维表示.进而依据病毒传播网络中相邻节点的基因序列相似性高于不相邻节点的特征,对基因序列表示模型进行优化,训练后得到的新的表示不仅可以有效表达基因序列的特征,同时极大地降低了序列的维度,提高了计算效率.分别在仿真病毒传播网络、新型冠状病毒和艾滋病毒传播网络数据上训练基因序列表示模型,并在相应的网络上进行未采样感染者发现任务.实验结果充分验证了模型的有效性,与其他方法的比较证明了模型的高效性,模型可以有效地在病毒传播网络上发现未采样感染者,这在流行病调查领域也具有一定的实际意义.
参考文献
相关文章 15
[1] | 肖添明,管剑波,蹇松雷,任怡,张建锋,李宝. 基于代码属性图和Bi-GRU的软件脆弱性检测方法[J]. 计算机研究与发展, 2021, 58(8): 1668-1685. |
[2] | 孙学良, 黄安欣, 罗夏朴, 谢怡. 针对Tor的网页指纹识别研究综述[J]. 计算机研究与发展, 2021, 58(8): 1773-1788. |
[3] | 陈波冯,李靖东,卢兴见,沙朝锋,王晓玲,张吉. 基于深度学习的图异常检测技术综述[J]. 计算机研究与发展, 2021, 58(7): 1436-1455. |
[4] | 李涵, 严明玉, 吕征阳, 李文明, 叶笑春, 范东睿, 唐志敏. 图神经网络加速结构综述[J]. 计算机研究与发展, 2021, 58(6): 1204-1229. |
[5] | 邵天竺, 王晓亮, 陈文龙, 唐晓岚, 徐敏. 一种减少网络振动的智能路由选择算法设计[J]. 计算机研究与发展, 2021, 58(6): 1261-1274. |
[6] | 陈晋音, 黄国瀚, 张敦杰, 张旭鸿, 纪守领. 一种面向图神经网络的图重构防御方法[J]. 计算机研究与发展, 2021, 58(5): 1075-1091. |
[7] | 孙聪, 李占魁, 陈亮, 马建峰, 乔新博. 面向数字货币特征的细粒度代码注入攻击检测[J]. 计算机研究与发展, 2021, 58(5): 1035-1044. |
[8] | 汪嘉来, 张超, 戚旭衍, 荣易. Windows平台恶意软件智能检测综述[J]. 计算机研究与发展, 2021, 58(5): 977-994. |
[9] | 任泽众, 郑晗, 张嘉元, 王文杰, 冯涛, 王鹤, 张玉清. 模糊测试技术综述[J]. 计算机研究与发展, 2021, 58(5): 944-963. |
[10] | 汪烨, 陈骏武, 夏鑫, 姜波. 智能需求获取与建模研究综述[J]. 计算机研究与发展, 2021, 58(4): 683-705. |
[11] | 严明玉, 李涵, 邓磊, 胡杏, 叶笑春, 张志敏, 范东睿, 谢源. 图计算加速架构综述[J]. 计算机研究与发展, 2021, 58(4): 862-887. |
[12] | 吴宗友, 白昆龙, 杨林蕊, 王仪琦, 田英杰. 电子病历文本挖掘研究综述[J]. 计算机研究与发展, 2021, 58(3): 513-527. |
[13] | 陈晋音, 陈奕芃, 陈一鸣, 郑海斌, 纪守领, 时杰, 程瑶. 面向深度学习的公平性研究综述[J]. 计算机研究与发展, 2021, 58(2): 264-280. |
[14] | 于畅, 王雅文, 林欢, 宫云战. 基于故障检测上下文的等价变异体识别算法[J]. 计算机研究与发展, 2021, 58(1): 83-97. |
[15] | 李双峰. TensorFlow Lite:端侧机器学习框架[J]. 计算机研究与发展, 2020, 57(9): 1839-1853. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4471