近日,基因组所在国际生物多样性与健康大数据(Global Biodiversity & Health Big Data,简称BHBD)联盟框架下,与沙特阿卜杜拉国王科技大学、巴基斯坦真纳大学以及美国梅奥医学院开展科研合作,联合开发了可跨物种使用的长非编码RNA(long non-coding RNA, lncRNA)鉴定软件LGC。该成果以“Characterization and identification of long non-coding RNAs based on feature relationship”为题在国际学术期刊Bioinformatics在线发表。
测序技术的飞速发展产生了大量转录组数据,而转录组分析中一个重要的研究内容是鉴定新的转录本并且检测其蛋白编码能力。虽然利用蛋白质谱检测、Ribo-seq等实验方法可以获得蛋白编码证据,但成本高、耗时长且通量低。因此,目前主要依赖软件预测的计算方法鉴定lncRNA。已有相关软件大多需要高质量的训练集,对于缺乏高质量数据的非模式物种,鉴定其lncRNA难度极大,亟需发展支持跨物种使用的lncRNA准确鉴定方法与工具。
为解决以上难题,北京基因组所联合多家科研机构,研究了蛋白编码RNA与lncRNA在多物种中普遍存在的序列特征差异,发现GC含量与ORF(开放读码框)长度的关系在两者间存在显著差异,且这种差异在动植物中广泛存在。基于此,研发了能够跨物种使用的lncRNA鉴定方法和软件LGC。该方法不需要物种特异训练集,与同类方法相比,LGC可实现从植物到哺乳动物的lncRNA的准确鉴定,且具有较为平衡的灵敏度与特异性,为lncRNA跨物种鉴定以及功能分析提供重要方法和工具。同时,提供web server,支持fasta、gtf、bed三种格式,实现在线分析计算。Fasta格式不限定物种,gtf与bed格式目前支持人、小鼠、斑马鱼与果蝇的在线分析。
该项研究得到了中国科学院战略性先导科技专项、国家重点研发计划、中国科学院“十三五”信息化专项等基金的资助。
Web server
文章链接
GC含量与ORF长度的关系在蛋白编码RNA与lncRNA中存在显著差异
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
北京基因组所开发跨物种长非编码RNA鉴定软件LGC
本站小编 Free考研/2020-06-02
相关话题/鉴定 数据
北京基因组所生命与健康大数据中心召开2018年度工作会议
12月27日至28日,中国科学院北京基因组研究所生命与健康大数据中心(简称大数据中心)召开2018年度工作会议,总结大数据中心2018年主要工作进展,研究明确2019年工作思路和重点任务。 本次会议特邀中科院上海生命科学研究院赵国屏院士、中科院生物物理所陈润生院士、北京大学罗静初教授、基因组所于军 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所开发完成植物RNA编辑体数据库PED
近日,中国科学院北京基因组研究所生命与健康大数据中心开发了国际上首个植物RNA编辑体数据库—PED(Plant Editosome Database)。该库基于人工审编整合多种植物RNA编辑因子和大量RNA编辑事件等信息。研究成果以“Plant editosome database: a curat ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所生命与健康大数据中心开发系列特色科学数据库
近日,中国科学院北京基因组研究所生命与健康大数据中心(BIG Data Center,BIGD)有七篇数据库文章在国际学术期刊核酸研究Nucleic Acids Research(NAR)杂志在线发表,并将于该刊2019年1月出版的数据库专刊中集中刊发。包括表观组关联分析知识库EWAS Atlas、 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所开发完成核小体定位数据库
近日,中科院北京基因组研究所生命与健康大数据中心开发了国际上第一个全基因组核小体定位图谱数据库——NucMap(Nucleosome positioning map)。该数据库在研究所高性能计算平台和大数据存储平台的支撑下,基于人工审编整合了大量全基因组核小体测序数据,识别多物种不同条件下的核小体定 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02基因组所与昆明动物所合作完成犬科数据整合与共享系统研发
近日,由北京基因组所与昆明动物所合作开发的犬科动物数据库iDog正式上线。该项研究成果以“iDog:an integrated resource for domestic dogs and wild animals”为题在国际学术期刊Nucleic Acids Research在线发表。iDog是第 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所开发长非编码RNA数据库LncBook
近日,由基因组所开发的人类长非编码RNA(long non-coding RNA, lncRNA)数据库LncBook正式上线。该项研究成果以“LncBook: a curated knowledgebase of human long non-coding RNAs”为题在国际学术期刊Nuclei ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所举办第三届国际生命与健康大数据论坛
10月11至14日,“第三届国际生命与健康大数据论坛”在中国科学院北京基因组研究所召开。论坛依托中国科学院国际大科学计划“国际健康大数据共享计划”项目和国家重点研发计划“国际生命组学数据共享计划”项目,由北京基因组所生命与健康大数据中心主办。包括美国国家生物技术信息中心、康奈尔大学医学院、俄罗斯科学 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所等开发从低分辨率Hi-C数据中提取高分辨率3D基因组结构的新方法
高等真核生物的核内活动, 从基因转录,DNA的复制到DNA损伤修复等,都与基因组的三维空间结构息息相关。因此,3D基因组研究成为近年来的前沿热点领域。Hi-C是目前最常见的全基因组检测染色质三维结构的组学技术。然而,由于Hi-C具有分辨率相对较低,测序量要求极高的特点,在类似精准医学人群队列这样的大 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02国际生物多样性与健康大数据联盟成立
10月14日,国际生物多样性与健康大数据联盟启动仪式在京举行。该联盟依托中国科学院北京基因组研究所,成员主要来自“一带一路”沿线国家。包括巴基斯坦、沙特、泰国、俄罗斯、新加坡、美国等多个国家的机构代表参加了启动仪式。 该联盟是在国际生物科学联合会倡导的“国际生物多样性及健康大数据共享”计划框架下成 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02佳木斯高频相干散射雷达数据与SuperDARN实现数据交换
近日,佳木斯高频相干散射雷达数据与国际超级双极光雷达网(Super Dual Auroral Radar Network, SuperDARN)实现数据交换。 SuperDARN是一个高频雷达国际合作组织。该组织起源于上世纪80年代,之后不断发展壮大,目前共包括有来自英国,美国,加拿大,日本,中国 ...中科院国家空间科学中心 本站小编 Free考研 2020-05-30