(大连理工大学计算机科学与技术学院 辽宁大连 116023) (mengjun@dlut.edu.cn)
出版日期:
2018-05-01基金资助:
国家自然科学基金项目(61472061,61672126)Selective Ensemble Classification Integrated with Affinity Propagation Clustering
Meng Jun, Zhang Jing, Jiang Dingling, He Xinyu,Li Lishuang(School of Computer Science and Technology, Dalian University of Technology, Dalian, Liaoning 116023)
Online:
2018-05-01摘要/Abstract
摘要: 从海量的基因微阵列数据中提取出有价值的信息是生物信息学的研究热点.基因微阵列数据具有高维度、小样本和高冗余的特性.因此,提出一种基于相交邻域粗糙集的基因选择方法,挑选出关键基因用于对微阵列数据进行分类.首先利用pathway知识进行基因初步选择,每个pathway单元对应一个基因子集,然后采用基于粗糙集的属性约简方法筛选出无冗余的关键基因.由于pathway知识单元的数量较多,对应生成大量的基分类器,为了进一步提高基分类器之间的差异性和集成的效率,对基分类器进行选择是十分必要的.近邻传播聚类不需要提前设定聚簇数量和起始点并且可以更快速、精确地进行聚类.因此,使用近邻传播聚类方法对基分类器进行分组,产生差异性较大的聚簇,再从每个簇中选择一个分类器构建集成分类器.在拟南芥的生物和非生物胁迫响应相关的微阵列数据集上的实验结果表明:在准确率方面,提出的方法与现有的集成方法相比最多可以提高12%.
参考文献
相关文章 7
[1] | 朱 平. HPC海量存储系统Pass-Through访问策略研究[J]. , 2013, 50(8): 1667-1673. |
[2] | 鲁伟明 杜晨阳 魏宝刚 沈春辉 叶振超. 基于MapReduce的分布式近邻传播聚类算法[J]. , 2012, 49(8): 1762-1772. |
[3] | 冯 奇 周雪忠 黄厚宽 张小平. SHP-VI: 一种基于最短哈密顿通路的POMDP值迭代算法[J]. , 2011, 48(12): 2343-2351. |
[4] | 杨 志, 马光胜, 张 曙,. 基于多项式符号代数方法的高层次数据通路的等价验证[J]. , 2009, 46(3): 513-520. |
[5] | 谢元澄 杨静宇. 删除最差基学习器来层次修剪Bagging集成[J]. , 2009, 46(2): 261-267. |
[6] | 陈书明 李振涛 万江华 胡定磊 郭 阳 汪 东 扈 啸 孙书为. “银河飞腾”高性能数字信号处理器研究进展[J]. , 2006, 43(6): 993-1000. |
[7] | 文中华, 姜云飞,. 用分层关联方法求有向图中所有Hamilton回路的算法[J]. , 2005, 42(10): 1809-1814. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3688