删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

Deep Learning Deepens the Analysis of Alternative Splicing

本站小编 Free考研考试/2022-01-03


基因组学数据在数据量和数据维度上的日益增长,给传统的数据分析方法带来了挑战,同时也为开发新的分析方法提供了机会。近年来,深度学习推动了人工智能和机器学习领域新一波的浪潮。最近,美国加利福尼亚大学洛杉矶分校的邢毅教授(现为费城儿童医院教授)实验室开发了一个全新的计算框架:DARTS[1]。DARTS通过一个贝叶斯框架系统性地整合了人工智能方法和实验数据的优势。其中基于海量序列数据以及RNA结合蛋白mRNA表达水平数据训练出的深度神经网络模型为贝叶斯模型提供一个先验概率,而贝叶斯模型进一步整合RNA-seq实验数据的信息,从而达到对样本间差异可变剪接的准确预测。作者将DARTS应用于上皮-间充质转移(EMT)样本的RNA-seq数据集上发现,DARTS不仅能预测EMT过程中显著差异的可变剪接事件,而且能发现低丰度基因中的差异剪接事件。相比于之前的方法,DARTS有两个方面的重要创新:其一,DARTS模型不仅考虑基因组序列特征,同时考虑RNA结合蛋白的表达水平;其二,DARTS巧妙地结合了统计学习模型的预测能力和实验数据所含的丰富信息,使得最终的模型在高丰度和低丰度基因上都达到准确的预测。DARTS在上述两个方面的重要创新,一方面提高了样本间差异可变剪接事件的预测准确性,另一方面,通过在模型训练时利用公共的RNA-seq数据,提高了DARTS对于低丰度基因中差异可变剪接事件的预测能力,使得先前因为测序深度偏低而无法用于差异可变剪接分析的RNA-seq数据集的应用成为可能。这一突破扩展了DARTS的应用范围,并为今后类似问题的方法研发提供了可借鉴的思路。





PDF全文下载地址:

http://gpb.big.ac.cn/articles/download/703
相关话题/gen