清华新闻网11月22日电 RNA结构是RNA发挥功能的基础。传统解析RNA结构的方法包括X射线、核磁共振和冷冻电子显微镜。这些方法无法做到高通量,更不能解析出细胞内高度动态的RNA结构。近年来,研究者们开发出了许多细胞内高通量探测RNA结构的技术,极大推动了RNA结构和功能的研究。但是这些技术探测到的RNA结构信号经常包含大量的缺失值,影响了后续对RNA功能的深入研究。人工智能方法在科学、技术多个领域都取得了成功应用,如果将其用于恢复由于实验和技术限制而缺失的RNA结构信号,很有可能解决上述问题。
11月16日,清华大学张强锋课题组在《自然·机器智能》(Nature Machine Intelligence)期刊上发表了题为 “一种恢复从探测实验得到的全转录组RNA结构图谱中缺失信号的深度学习方法”(A deep learning method for recovering missing signals in transcriptome-wide RNA structure profiles from probing experiments)的研究文章。该工作受自动驾驶领域中稀疏雷达信号恢复算法的启发,将RNA序列与其对应的RNA结构信号相结合,并通过屏蔽部分已知RNA结构信号来进行自监督式训练,建立了一种恢复实验缺失的RNA结构信号的新方法——StructureImpute(图1)。
图1 StructureImpute模型
RNA结构测序经常会因覆盖度不够深而导致RNA结构信号缺失,极端情况下甚至会使RNA结构信号非常稀疏。准确地恢复出缺失的信号,将有利于RNA结构及功能的分析。非常有意思的是,在自动驾驶中也存在类似的信号缺失问题。雷达信号提供的周围物体的距离信息对于自动驾驶非常重要。在自动驾驶中通常采用多线雷达获得物体的三维点云信号。由于多线雷达设备昂贵,自动驾驶方案往往面临雷达信号非常稀疏(大量缺失)的挑战。大量的研究表明,可通过结合二维图像和稀疏的雷达信号,设计人工智能算法,实现缺失的雷达信号的恢复补全。GuideNet就是这样的一种雷达信号恢复补全方法。其使用配对的二维RGB图像和稀疏的三维雷达信号作为输入,采用自编码器的深度网络结构,通过二维物体信息的RGB图像引导缺失的三维物体雷达信号的恢复,从而实现三维雷达信号的补全。GuideNet在多个数据集上的表现明显优于其他方法,也曾长期处在自动驾驶KITTI数据集雷达信号补全任务的榜首。
受GuideNet的启发,作者开发了一种名为StructureImpute的深度学习模型,该模型将一维的RNA序列与含缺失值的RNA二级结构信号相结合,通过构建残差神经网络和长短时记忆网络模型(图1),采用随机屏蔽部分已知RNA结构信号来进行自监督式训练,从而得到具有恢复缺失RNA结构信号能力的人工智能模型。结果表明,StructureImpute具有优良的恢复效果(图2A),并且其准确性远远优于仅基于RNA序列进行恢复的方法。不同缺失值比例下也具有很好的表现(图2B)。从18S核糖体RNA的结构图谱中可以看出,在不同缺失比例下碱基的结构信号的预测值(蓝色)和真实值(红色)的分布很接近,说明模型在一定缺失比例范围内具有较好的鲁棒性(图2C-D)。另外,与仅基于序列预测结构信号图谱的方法ShaKer相比,StructureImpute展现出了巨大的优势(图2E)。作者还在多个生物学意义的RNA调控和功能位点上进行了测试,发现StructureImpute可以可靠地重建具有这些位点的RNA结构模式,包括蛋白结合位点、RNA修饰位点、翻译起始和终止位点等。
图2 StructureImpute的性能表现。A. 实例展示StructureImpute从缺失的区域(灰色)恢复出的结构信号(绿色),实验测得的真实值为蓝色。B. 不同比例的缺失值的恢复效果。C. StructureImpute与其他方法的效果比较。D-E. 不同缺失值比例下预测的18S核糖体RNA结构图谱与真实结构图谱的分布。
为了探究StructureImpute实现准确预测的根源,作者通过反向传播方法对神经网络中RNA序列分支和RNA结构信号分支分别进行了梯度分析。结果发现,缺失值区域本身的RNA序列信息对于预测其结构信号值是最为重要,邻近的序列随着距离增大而减小;同样,不管是结构单链还是双链区域,缺失值区域相邻位置的RNA结构信号也在恢复缺失值过程中提供了相对更加重要的信息。
作者还通过迁移学习的方法,将在全细胞数据集上训练的RNA结构信号恢复模型迁移到不同的细胞组分,包括细胞质、细胞核、染色质,并通过在各自细胞环境上的数据集上进行微调,最终发现迁移到各自组织上的模型的效果超越了全细胞数据集上的效果。另外,为探究StructureImpute在不同RNA结构探测技术上的效果,作者不仅在icSHAPE技术上进行了以上分析,还在DMS-Seq技术的数据集上进行了模型的训练以及整套流程的分析,发现StructureImpute也能在DMS-Seq的数据上取得很好的恢复效果,说明了StructureImpute具有很好的实用性,能应用于不同的探测技术。
清华大学生命科学学院、结构生物学高精尖创新中心、清华-北大生命科学联合中心的张强锋副教授为该文章的通讯作者。清华大学生命学院博士毕业生龚警、博士后徐魁为该文章的共同第一作者,清华大学生命学院鲁志副教授、博士生马梓源为工作提供了宝贵的建议。该研究得到了清华大学蛋白质研究技术中心的大力支持,同时还得到了国家自然科学基金委、科技部重点研发计划、北京市结构生物学高精尖创新中心、清华-北大生命联合中的资助。
论文链接:
https://www.nature.com/articles/s42256-021-00412-0
供稿:生命学院
编辑:李华山
审核:吕婷
2021年11月22日 09:31:04
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
生命学院张强锋课题组开发RNA结构测序数据缺失信号恢复的人工智能方法
本站小编 Free考研考试/2021-12-20
相关话题/结构 信号 序列 技术 数据
戴琼海研究团队:引领中国立体视频技术跨越式发展
清华自动化系戴琼海教授等完成的立体视频获取与重建技术及装置项目获2012年度国家技术发明奖一等奖引领中国立体视频技术跨越式发展记者程曦实习记者白雪蕾 项目名称:立体视频重建与显示技术及装置 完成人:戴琼海季向阳刘烨斌曹汛戈张杨艺 项目介绍:立体视频是新一代信息获取、 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华技术支持高温气冷堆核电站示范工程燃料元件生产线建设开工
清华技术支持高温气冷堆核电站示范工程燃料元件生产线建设开工 清华新闻网3月21日电(通讯员刘兵)3月16日,由清华大学技术支持的具有我国自主知识产权燃料元件生产线高温气冷堆核电站示范工程燃料元件生产线建设协议签字仪式和开工典礼在内蒙古包头市举行,中国华能集团、中国核工业 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20化石燃料燃烧排放PM2.5源头控制技术的研究项目在清华启动
化石燃料燃烧排放PM2.5源头控制技术的基础研究973计划项目启动会召开清华新闻网3月1日电2月23日,以清华大学为第一承担单位、清华大学热能系教授姚强为首席科学家的国家重点基础研究发展计划(973计划)项目化石燃料燃烧排放PM2.5源头控制技术的基础研究& ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华宽光谱信号无线传输理论与方法研究项目启动
清华“宽光谱信号无线传输理论与方法研究”项目启动清华新闻网2月27日电近日,由清华大学电子工程系徐正元教授任首席科学家的国家973计划“宽光谱信号无线传输理论与方法研究”项目启动会在清华大学电子工程馆召开。校党委常务副书记陈旭出席启动会并致辞。 陈旭代表学校对项目的启动表示祝贺。陈旭表示,学校将为 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华联合发起组建深圳海洋科学研究与技术联盟
清华联合发起组建深圳海洋科学研究与技术联盟 清华新闻网2月1日电近日,由深圳虚拟大学园发起,香港城市大学、清华大学、中科院先进技术研究院、厦门大学等十余所大学和研究机构共同组建的深圳海洋研究与技术联盟(英文名称:ShenzhenMArineResearchandTechnologyConsorti ...清华大学通知公告 本站小编 Free考研考试 2021-12-20电机系康重庆教授荣获英国工程技术学会成就奖章
清华新闻网10月25日电近日,清华大学电机系康重庆教授获颁英国工程技术学会(IET,TheInstitutionofEngineeringandTechnology)的2021年成就奖章(IETAchievementMedals),以表彰他在能源电力领域取得的卓越成果。IET每年遴选工程与技术不同领 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20精仪系类脑计算团队在新型器件技术上取得进展
清华新闻网10月20日电在过去半个多世纪里,集成电路产业一直在晶体管微缩驱动下发展(“摩尔定律”)。然而,随着晶体管尺寸微缩难度的持续增加,性能提升的空间不断缩小,集成电路的发展逐渐进入“后摩尔”时代。在“后摩尔”时代,新型器件和电路功能将成为主要驱动力。基于阻变器件的神经形态硬件是后摩尔时代新型技 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华大学卫星通信技术助力神舟十号胜利返回
清华大学卫星通信技术助力神舟十号胜利返回 清华新闻网6月26日电2013年6月26日7时许,中央电视台开始了神舟十号飞船返回的实况直播:直升机飞赴大漠的壮观,返回舱开伞降落的精彩,航天员胜利出舱的喜悦,一一生动地呈现在观众面前。完成这项保障任务的核心设备之一是清华大学与相关单位合作研制的直升机载宽 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20徐涛做客水木清华讲座讲解工程技术和生命科学
徐涛做客水木清华讲座讲解工程技术和生命科学的汇聚 清华新闻网7月8日电7月4日下午,中科院生物物理所所长徐涛研究员做客清华大学水木清华生命科学讲座,在生命科学馆报告厅,为来自清华生命学院、医学院、化学系及其他相关院系的100多名师生作题为《工程技术和生命科学的汇聚》的报告。图为徐涛作报告。 徐涛 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20航天航空学院冯雪课题组在柔性超声能量传输及通讯技术上取得突破进展
清华新闻网10月4日电心脏起搏器和脑起搏器等植入式医疗设备已成为多类顽固性疾病的重要治疗手段,全球已经完成了超过100万例的设备植入。然而,现有心脏起搏器等植入式医疗器械存在电池寿命有限、手术更换电池会带来二次手术风险等缺陷。此外,为了延长使用周期,需要用到大体积的电池,造成现有设备体积大,材质硬, ...清华大学通知公告 本站小编 Free考研考试 2021-12-20