删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于宏基因组学分析构建诊断大肠癌的肠道菌群标签

本站小编 Free考研考试/2022-02-12

摘要/Abstract


摘要: 目的 ·根据粪便样本宏基因组学数据建立肠道菌群标签,探索用于筛查与诊断大肠癌的非侵入性方法。方法 ·共纳入 285例样本,根据随机森林分类算法筛选出与大肠癌发生密切相关的特征细菌;利用 6种机器学习分类模型建立大肠癌的诊断模型,并进行内部和外部验证。结果 ·首先筛选出了 9种与大肠癌发生密切相关的特征细菌,利用这 9种细菌建立了 6种诊断模型。其中随机森林模型准确率最高(达 0.847 7),其在内部验证集和外部验证集中的准确率分别为 0.815 8和 0.734 4,在全集中受试者工作特征(receiver operating characteristic,ROC)曲线下面积( area under curve,AUC)为 0.894。结论 ·根据粪便样本的宏基因组学数据,利用随机森林算法建立了由 9种细菌组成的诊断大肠癌的菌群标签,能够有效对健康者与大肠癌患者进行区分。
关键词: 大肠癌, 诊断, 肠道菌群, 机器学习, 随机森林
Abstract:
Objective · To construct bacterial signaturesanalyzing fecal metagenomics for the screening and diagnosis of colorectal cancer (CRC). Methods · A total of 285 samples were included in the study. Diagnostic models for CRC according to six different machine learning algorithms were developed using the featured bacteria selectedrandom forest algorithm, and validated in validation sets. Results · Nine bacteria that differentiated CRC and the control were identified, with which 6 models were established. The best model was random forest model, with an accuracy of 0.847 7 in the training set. Its accuracy in two test sets was 0.815 8 and 0.734 4, respectively. The area under curve (AUC) of receiver operating characteristic of the random forest model in the set including all samples was 0.894. Conclusion · Bacterial signatures based on random forest algorithm for the diagnosis of CRC can differentiate patients with CRC and the control effectively, which suggests the potential clinical value of the bacterial signatures.
Key words: colorectal cancer, diagnosis, intestinal bacteria, machine learning, random forest


PDF全文下载地址:

点我下载PDF
相关话题/数据 健康 工作 细菌 森林

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 慢性牙周炎易感患者种植体周围角化黏膜对种植体周软组织 健康的影响
    摘要/Abstract摘要:目的观察慢性牙周炎患者种植修复后种植体周围角化黏膜对种植体周围软组织健康和稳定性的影响。方法收集2010年8月2013年11月接受种植修复的慢性牙周炎患者58例(158枚种植体),观察植入后4年软组织的情况,对不同角化黏膜宽度 ...
    本站小编 Free考研考试 2022-02-12
  • 基于差异信息量的多源数据融合方法
    王姝,任玉,关展旭,王晶东北大学信息科学与工程学院,辽宁沈阳110819收稿日期:2020-01-04基金项目:国家重点研发计划项目(2019YFE0105000);矿冶过程自动控制技术国家(北京市)重点实验室开放课题(BGRIMM-KZSKL-2018-09)。作者简介:王姝(1979-),女,辽 ...
    本站小编 Free考研考试 2021-12-15
  • 基于主成分分析协同随机森林算法的热连轧带钢宽度预测
    丁敬国,郭锦华东北大学轧制技术及连轧自动化国家重点实验室,辽宁沈阳110819收稿日期:2020-12-21基金项目:国家重点研发计划项目(2018YFB1308705,2017YFB0304100)。作者简介:丁敬国(1981-),男,吉林白山人,东北大学副教授。摘要:为提高热连轧粗轧带钢生产过程 ...
    本站小编 Free考研考试 2021-12-15
  • 露天矿点云数据中台阶线提取
    王植,安世缘,邹俊,张紫瑞东北大学资源与土木工程学院,辽宁沈阳110819收稿日期:2020-10-12基金项目:中央高校基本科研业务费专项资金资助项目(N170113027)。作者简介:王植(1979-),男,辽宁沈阳人,东北大学副教授。摘要:台阶线信息对于露天开采具有重要价值,现有获取台阶线的方 ...
    本站小编 Free考研考试 2021-12-15
  • 数据区间优化对SSVEP算法性能的影响
    段志豪,刘冲,陈杰,陆志国东北大学机械工程与自动化学院,辽宁沈阳110819收稿日期:2020-11-27基金项目:国家自然科学基金资助项目(51805074)。作者简介:段志豪(1997-),男,江西景德镇人,东北大学硕士研究生;刘冲(1980-),男,辽宁沈阳人,东北大学讲师,硕士生导师。摘要: ...
    本站小编 Free考研考试 2021-12-15
  • 基于无人机点云数据的露天采场矿车提取方法
    毛亚纯1,伏雨文1,曹旺1,赵占国21.东北大学资源与土木工程学院,辽宁沈阳110819;2.中国黄金集团,北京100000收稿日期:2020-10-21基金项目:国家重点研发计划项目(2016YFC0801602)。作者简介:毛亚纯(1966-),男,辽宁本溪人,东北大学教授,博士生导师;赵占国( ...
    本站小编 Free考研考试 2021-12-15
  • 测量数据的曲线曲面拟合算法
    顾天奇,罗祖德,胡晨捷,林述温福州大学机械工程及自动化学院,福建福州350116收稿日期:2020-08-18基金项目:国家自然科学基金资助项目(51605094,51605091)。作者简介:顾天奇(1983-),男,河北邢台人,福州大学副教授;林述温(1962-),男,福建平潭人,福州大学教授, ...
    本站小编 Free考研考试 2021-12-15
  • 基于区块链的电力数据资产化及交易系统设计
    王柯元1,2,于雷1,颜拥3,孙毅1,21.中国科学院计算技术研究所,北京100190;2.中国科学院大学计算机科学与技术学院,北京100049;3.国网浙江省电力有限公司电力科学研究院,浙江杭州310014收稿日期:2020-06-18基金项目:国家重点研发计划项目(2019YFB1404903) ...
    本站小编 Free考研考试 2021-12-15
  • 基于随机森林的热轧带钢质量分析与预测方法
    纪英俊1,勇晓玥1,刘英林2,刘士新11.东北大学信息科学与工程学院,辽宁沈阳110819;2.上海宝信软件股份有限公司大数据事业部,上海201203收稿日期:2018-04-19基金项目:国家重点研发计划项目(2017YFB0306401);国家自然科学基金资助项目(61573089)。作者简介: ...
    本站小编 Free考研考试 2020-03-23
  • 基于大数据和马尔科夫链的行驶工况构建
    曹骞,李君,刘宇,曲大为吉林大学汽车仿真与控制国家重点实验室,吉林长春130022收稿日期:2018-03-29基金项目:中国新能源汽车产品检测工况研究和开发项目(工信部工装函[2015]615号)。作者简介:曹骞(1986-),男,山东济南人,吉林大学博士研究生;李君(1961-),男,吉林长春人 ...
    本站小编 Free考研考试 2020-03-23