1(哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001);2(Rutgers大学数学系 美国新泽西洲皮斯卡特维 08854);3(建筑大数据智能处理方法研究北京市重点实验室(北京建筑大学) 北京 100044) (yjguo0625@gmail.com)
出版日期:
2018-08-01基金资助:
国家自然科学基金项目(61571163,61532014,61671189);国家重点研发计划项目(2016YFC0901902) This work was supported by the National Natural Science Foundation of China (61571163, 61532014, 61671189) and the National Key Research and Development Plan of China (2016YFC0901902).U-Statistics and Ensemble Learning Based Method for Gene-Gene Interaction Detection
Guo Yingjie1, Liu Xiaoyan1, Wu Chenxi2, Guo Maozu1,3,Li Ao11(School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001);2(Department of Mathematics, Rutgers University, Piscataway, NJ, USA 08854);3(Beijing Key Laboratory of Intelligent Processing for Building Big Data (Beijing University of Civil Engineering and Architecture), Beijing 100044)
Online:
2018-08-01摘要/Abstract
摘要: 在全基因组关联研究GWAS中,多数方法对疾病与单核苷酸多态性位点之间的互作关系形式给出了强假设,这降低了相关方法的挖掘能力.近几年,以基因作为研究单位的基因-基因相互作用检测方法,因其在统计效力与生物可解释性方面的优势受到重视.针对已有方法检测相互作用类型时存在的局限性,提出一种基于U统计值与集成学习器的假设检验方法GBUtrees,通过构造统计量用于表征疾病性状与2个基因之间关系偏离加性模型的程度,检测以基因为单位的基因-基因相互作用.该统计量在不同子样例集下结果的平均值满足U统计量理论,从而可以利用U统计量的渐进正态分布性质获得所构造统计量的分布信息.GBUtrees对相互作用的形式不作假设,增强该方法对不同形式相互作用的挖掘能力.仿真与真实实验结果表明:该方法能够有效地进行不同类型相互作用的挖掘,可以应用于全基因组关联研究.
参考文献
相关文章 15
[1] | 贺一笑, 庞明, 姜远. 蒙德里安深度森林[J]. 计算机研究与发展, 2020, 57(8): 1594-1604. |
[2] | 程光, 钱德鑫, 郭建伟, 史海滨, 吴桦, 赵玉宇. 基于散度的网络流概念漂移分类方法[J]. 计算机研究与发展, 2020, 57(12): 2673-2682. |
[3] | 艾科,马国帅,杨凯凯,钱宇华. 一种基于集成学习的科研合作者潜力预测分类方法[J]. 计算机研究与发展, 2019, 56(7): 1383-1395. |
[4] | 许行,王文剑,任丽芳. 一种基于决策森林的单调分类方法[J]. 计算机研究与发展, 2017, 54(7): 1477-1487. |
[5] | 傅艺绮,董威,尹良泽,杜雨晴. 基于组合机器学习算法的软件缺陷预测模型[J]. 计算机研究与发展, 2017, 54(3): 633-641. |
[6] | 熊冰妍,王国胤,邓维斌. 基于样本权重的不平衡数据欠抽样方法[J]. 计算机研究与发展, 2016, 53(11): 2613-2622. |
[7] | 张虎,谭红叶,钱宇华,李茹,陈千. 基于集成学习的中文文本欺骗检测研究[J]. 计算机研究与发展, 2015, 52(5): 1005-1013. |
[8] | 周全强 张付志. 基于仿生模式识别的用户概貌攻击集成检测方法[J]. 计算机研究与发展, 2014, 51(4): 789-801. |
[9] | 付忠良. 通用集成学习算法的构造[J]. , 2013, 50(4): 861-872. |
[10] | 刘伍颖, 王 挺,. 结构化集成学习垃圾邮件过滤[J]. , 2012, 49(3): 628-635. |
[11] | 刘 明, 袁保宗, 苗振江, 唐晓芳, 李昆仑,. 从局部分类精度到分类置信度的变换[J]. , 2008, 45(9): 1612-1619. |
[12] | 黎 铭 周志华 . 基于多核集成的在线半监督学习方法[J]. , 2008, 45(12): 2060-2068. |
[13] | 眭俊明 姜 远 周志华. 基于频繁项集挖掘的贝叶斯分类算法[J]. , 2007, 44(8): 1293-1300. |
[14] | 姜 远 周志华. 基于词频分类器集成的文本分类方法[J]. , 2006, 43(10): 1681-1687. |
[15] | 詹德川 周志华. 基于集成的流形学习可视化[J]. , 2005, 42(9): 1533-1537. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3747