基于Laplacian支持向量机和序列信息的microRNA-结合残基预测
马昕1(),王雪21. 南京审计大学统计与数学学院, 江苏 南京 211815
2. 南京审计大学实验中心, 江苏 南京 211815
收稿日期:
2019-06-06出版日期:
2020-04-20发布日期:
2020-04-16作者简介:
马昕(1982—),女,江苏镇江人,副教授,博士,硕士生导师,主要研究方向为生物信息学,机器学习. E-mail:Prediction of microRNA-binding residues based on Laplacian support vector machine and sequence information
Xin MA1(),Xue WANG21. School of Statistics and Mathematics, Nanjing Audit University, Nanjing 211815, Jiangsu, China
2. Experimental Center, Nanjing Audit University, Nanjing 211815, Jiangsu, China
Received:
2019-06-06Online:
2020-04-20Published:
2020-04-16摘要/Abstract
摘要: 提出一种半监督学习算法预测蛋白质序列中microRNA-结合残基的新式的方法。通过Laplacian支持向量机(Laplacian support vector machine,LapSVM)算法结合新提出的混合特征构建预测模型。混合特征是由三类信息组合获得:二级结构信息、HKM特征和新提出的氨基酸理化特性和进化信息结合的特征。比较各种特征的预测性能,新提出的这一特征对预测性能的提高贡献最大。结果表明,通过特征选择,本研究构建的预测模型准确性达到88.72%,敏感性达到54.18%,特异性达到91.15%,明显优于其他方法。
PDF全文下载地址:
http://gxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=1912