删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

Deep Learning Deciphers Protein–RNA Interaction

本站小编 Free考研考试/2022-01-03

蛋白质-RNA相互作用在细胞中普遍存在,是转录后调控的主要机制。RNA结合蛋白(RBPs)通过控制多层次的基因调控,不仅控制着哪些转录物被翻译,还决定着mRNA翻译的速度、位置和浓度。碱基为主的相互作用和骨架为主的相互作用是RBPs与RNA相互作用的两种主要方式。获得蛋白质与RNA相互作用的方法主要有两种:实验技术和计算方法。实验方法主要包括基于高通量测序的方法以及结构生物学方法,而这两种方法均具有明显的劣势。至于计算的方法,仍旧处于不成熟的阶段。现存基于深度学习的计算方法大都采取二项式预测,即仅仅预测RBP的一个亚基是否为一个结合域。这样的方法通常具有高假阳性率。由Gao Lab开发的NucleicNet,是一种通过深度学习方法在RNA水平上预测蛋白质-RNA互作的工具。该工具把蛋白质-RNA互作问题归结为七类分类问题,其标签集合包括非位点、核糖、磷酸盐和四种不同的碱基。对于任何一种深度学习方法,训练数据都是最关键的组成部分。Lam等人使用了包含蛋白质数据库(PDB)中所有已解决的蛋白质-RNA复合结构的数据集,并小心地去除多余结构和多余链,从而形成一个包含175个与RNA-蛋白质结合的数据集。针对已知RBPs的情况,NucleicNet可用于对任何给定的RNA结合序列进行评分,设计最优结合序列,并绘制序列标识。而对于具有未知RNA结合功能的蛋白质,NucleicNet可用于检查蛋白质是否具有合适的RNA结合位点,如果有,则进一步检测首选的RNA结合区域。同时,开发者还提供了一个方便公众使用NucleicNet的网站。






PDF全文下载地址:

http://gpb.big.ac.cn/articles/download/728
相关话题/gen