近日,中国科学院北京基因组研究所方向东研究组等在Briefings in Bioinformatics发表题为Platform-independent approach for cancer detection from gene expression profiles of peripheral blood cells的研究论文,通过正常女性和乳腺癌病人外周血全细胞转录组比较,发现特定基因间的相对表达量大小可以区分正常人和乳腺癌病人,并发现相应基因在预测乳腺癌病人预后中的作用。这是首次通过大规模人群的外周血转录组数据来区分正常人和乳腺癌患者,相关算法模型已获批国家发明专利。
肿瘤是系统性疾病,在肿瘤发生发展过程中,除病灶位置外,外周血中多种细胞的表达量也发生变化,这使得我们有机会通过外周血在分子层次实现对肿瘤的追踪。研究人员整合公共数据库中上千例正常和乳腺癌个体外周血转录组数据,通过创新性的秩归一化方式屏蔽不同转录组检测平台、不同批次之间的噪音,并通过人工智能方法实现高维数据特征筛选和模型构建。在模型验证过程中,研究人员发现模型具有良好的泛化能力,在RNA-seq、不同芯片平台以及不同人种之间都取得了很好的预测效果。
该研究揭示了外周血转录组在肿瘤早筛中的作用。过往研究发现血小板转录组在预测肿瘤中的作用,但限于标准化方法不统一、数据集小等原因,取得的模型很难扩展到独立的数据集中,血小板转录组也受到除肿瘤之外其他因素的影响。该研究一方面整合外周血全细胞转录组,最大程度地降低了单一细胞类型受特定环境影响所导致的非特异性变化,另一方面基于秩序的标准化方法使不同来源的数据可以统一比较,大幅提升了可整合的数据量和肿瘤分类效果。
近年来乳腺癌发病低龄化趋势明显,为提高乳腺癌早期发现率并延长生存时间,外周血循环肿瘤细胞相关检测是研究热点,以循环肿瘤细胞(CTC) 为研究对象的一系列研究, 不仅能够对肿瘤患者的病情发展进行实时、动态监测, 更是了解肿瘤细胞内部致病分子机制的窗口, 从而为精准预防、精准治疗提供可能。目前相关研究已与解放军总医院等多个医学研究中心展开进一步合作,并已入组超过2000例正常女性、不同时期乳腺癌患者和高危人群,希望通过进一步的前瞻性研究提高分类效果,实现乳腺癌的早期诊断,减轻家庭和社会负担。
该研究得到了国家重点研发计划精准医学专项、863计划等基金资助。
数据标准化、特征筛选及模型构建
论文链接
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
北京基因组所等开发通过外周血检测乳腺癌的新方法
本站小编 Free考研/2020-06-02
相关话题/肿瘤 数据
北京基因组所揭示遗传负荷的积累对肿瘤细胞生长产生重要影响
近日,中国科学院北京基因组研究所吕雪梅研究组和台湾大学临床医学研究所王弘毅研究组联合在Molecular Biology and Evolution发表题为Genetic load and potential mutational meltdown in cancer cell population ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02中科院启动重点部署项目“经典化疗药物治疗肿瘤的新理论构建和创新应用”
12月17日, 中国科学院重点部署项目“经典化疗药物治疗肿瘤的新理论构建和创新应用”启动会在苏州大学附属儿童医院召开。该项目在科技促进发展局与前沿科学与教育局共同支持下,由北京基因组研究所和昆明动物研究所联合承担。 北京基因组所王前飞研究员、吕雪梅研究员及苏州儿童医院血液科胡绍燕主任等分别介绍了前 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所生命与健康大数据中心召开2018年度工作会议
12月27日至28日,中国科学院北京基因组研究所生命与健康大数据中心(简称大数据中心)召开2018年度工作会议,总结大数据中心2018年主要工作进展,研究明确2019年工作思路和重点任务。 本次会议特邀中科院上海生命科学研究院赵国屏院士、中科院生物物理所陈润生院士、北京大学罗静初教授、基因组所于军 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所开发完成植物RNA编辑体数据库PED
近日,中国科学院北京基因组研究所生命与健康大数据中心开发了国际上首个植物RNA编辑体数据库—PED(Plant Editosome Database)。该库基于人工审编整合多种植物RNA编辑因子和大量RNA编辑事件等信息。研究成果以“Plant editosome database: a curat ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所生命与健康大数据中心开发系列特色科学数据库
近日,中国科学院北京基因组研究所生命与健康大数据中心(BIG Data Center,BIGD)有七篇数据库文章在国际学术期刊核酸研究Nucleic Acids Research(NAR)杂志在线发表,并将于该刊2019年1月出版的数据库专刊中集中刊发。包括表观组关联分析知识库EWAS Atlas、 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所开发完成核小体定位数据库
近日,中科院北京基因组研究所生命与健康大数据中心开发了国际上第一个全基因组核小体定位图谱数据库——NucMap(Nucleosome positioning map)。该数据库在研究所高性能计算平台和大数据存储平台的支撑下,基于人工审编整合了大量全基因组核小体测序数据,识别多物种不同条件下的核小体定 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02基因组所与昆明动物所合作完成犬科数据整合与共享系统研发
近日,由北京基因组所与昆明动物所合作开发的犬科动物数据库iDog正式上线。该项研究成果以“iDog:an integrated resource for domestic dogs and wild animals”为题在国际学术期刊Nucleic Acids Research在线发表。iDog是第 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所开发长非编码RNA数据库LncBook
近日,由基因组所开发的人类长非编码RNA(long non-coding RNA, lncRNA)数据库LncBook正式上线。该项研究成果以“LncBook: a curated knowledgebase of human long non-coding RNAs”为题在国际学术期刊Nuclei ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所举办第三届国际生命与健康大数据论坛
10月11至14日,“第三届国际生命与健康大数据论坛”在中国科学院北京基因组研究所召开。论坛依托中国科学院国际大科学计划“国际健康大数据共享计划”项目和国家重点研发计划“国际生命组学数据共享计划”项目,由北京基因组所生命与健康大数据中心主办。包括美国国家生物技术信息中心、康奈尔大学医学院、俄罗斯科学 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所等开发从低分辨率Hi-C数据中提取高分辨率3D基因组结构的新方法
高等真核生物的核内活动, 从基因转录,DNA的复制到DNA损伤修复等,都与基因组的三维空间结构息息相关。因此,3D基因组研究成为近年来的前沿热点领域。Hi-C是目前最常见的全基因组检测染色质三维结构的组学技术。然而,由于Hi-C具有分辨率相对较低,测序量要求极高的特点,在类似精准医学人群队列这样的大 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02