1(云南师范大学信息学院 昆明 650500); 2(民族教育信息化教育部重点实验室(云南师范大学) 昆明 650500); 3(云南师范大学校长办公室 昆明 650500); 4(云南大学国家示范性软件学院 昆明 650091) (liulinrachel@163.com)
出版日期:
2019-05-01基金资助:
国家自然科学基金项目(61862067,61762089);云南师范大学博士启动项目(2016zb009);云南大学数据驱动的软件工程省科技创新团队项目(2017HC012)The Framework of Protein Function Prediction Based on Boolean Matrix Decomposition
Liu Lin1, Tang Lin2, Tang Mingjing3, Zhou Wei41(School of Information, Yunnan Normal University, Kunming 650500); 2(Key Laboratory of Educational Informatization for Nationalities(Yunnan Normal University ), Ministry of Education, Kunming 650500); 3(President Office, Yunnan Normal University, Kunming 650500); 4(National Pilot School of Software, Yunnan University, Kunming 650091)
Online:
2019-05-01摘要/Abstract
摘要: 蛋白质是细胞生命活动中最重要和最多样的一种大分子物质.因此,研究蛋白质功能对于破解生命密码具有重要的意义.以往的研究表明蛋白质功能预测问题本质上是一个多标签分类问题,但庞大的功能标签数量使得各种多标签分类器在蛋白质功能预测中的应用面临巨大挑战.针对蛋白质功能标签数量庞大且标签关联性较高的特点,提出了一种基于布尔矩阵分解的蛋白质功能预测框架(protein function prediction based on Boolean matrix decomposition, PFP-BMD).同时,针对目前布尔矩阵分解算法中精确分解和列利用条件难以同时满足的问题,提出一种基于标签簇的精确布尔矩阵分解算法,使其通过标签关联矩阵实现标签的层次扩展聚簇,并通过相关推论证明了该算法可实现最优的精确布尔矩阵分解.实验结果表明:提出的布尔矩阵分解算法在计算复杂度上具有较大优势,且应用了该算法的蛋白质功能预测框架可有效提升蛋白质功能预测的准确率,为各种多标签分类器在蛋白质功能预测中的高效应用奠定了基础.
参考文献
相关文章 5
[1] | 王继娜, 陈军华, 高建华. 基于排序损失的ECC多标签代码异味检测方法[J]. 计算机研究与发展, 2021, 58(1): 178-188. |
[2] | 杨晓慧,万睿,张海滨,曾义夫,刘峤. 基于符号语义映射的知识图谱表示学习算法[J]. 计算机研究与发展, 2018, 55(8): 1773-1784. |
[3] | 余国先,王可尧,傅广垣,王峻,曾安. 基于多网络数据协同矩阵分解预测蛋白质功能[J]. 计算机研究与发展, 2017, 54(12): 2660-2673. |
[4] | 傅广垣,余国先,王峻,郭茂祖. 基于正负样例的蛋白质功能预测[J]. 计算机研究与发展, 2016, 53(8): 1753-1765. |
[5] | 张振海 李士宁 李志刚 陈 昊. 一类基于信息熵的多标签特征选择算法[J]. 计算机研究与发展, 2013, 50(6): 1177-1184. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3928