食源性疾病是全球重要的公共卫生和食品安全问题,近年来,食源性疾病呈现出跨区域传播、变化快、难预测的特点。依托国家重点研发计划课题“基于多源数据的食源性疾病实时预警技术体系研究”,大数据部将大数据与机器学习技术与食源性疾病预测的实际需求进行深度融合,在该交叉领域取得多项研究成果,在食品科技类期刊Food Control与Foodborne Pathogens and Disease、医学信息类期刊JMIR Medical Informatics发表多篇论文。
食源性疾病致菌是导致食源性疾病的主要原因,使用数据挖掘、机器学习的方法挖掘食源性疾病因素之间潜在的关联,从而对致病菌进行识别,能够为食源性疾病的诊疗起到辅助作用。课题组提出了一种利用机器学习来识别食源性疾病致病菌的方法,从空间、时间、患者信息、暴露食品等方面提取特征,使用合适的机器学习模型来对特征进行训练和学习,从而对重要的食源性疾病致病菌进行识别,以为食源性疾病的诊疗提供辅助支持。进一步,针对食源性疾病发病情况的时空预测问题,提出了基于多图结构化 LSTM 的时空风险预测模型,该模型能够通过构造多种空间相关性并进行动态融合,利用基于 Encoder-Decoder 的结构化 LSTM 模型同时对数据的时间依赖性和空间依赖性进行建模,实现对疾病风险的多步预测。
食源性疾病时空风险预测模型架构
食源性疾病暴发指发生两例及以上具有共同暴露和症状相似的食源性疾病病例,目前食源性疾病报告监测系统基于筛选规则来发现疑似食源性疾病暴发事件,然而该方法普遍存在误判的现象。为了进一步提高暴发识别和预测的准确性,课题组设计了一种基于机器学习的食源性疾病暴发识别模型。在识别暴发的同时分析了各类特征和致病因素对判别结果的影响,对医学工作者具有借鉴意义。
基于机器学习方法的食源性疾病暴发优化
基于上述系列研究成果,课题组发现大数据与机器学习技术可以在病例报告、疾病诊断、暴发识别和风险预测阶段,极大地改善现有的食源性疾病监控系统,并在此基础上总结了出机器学习驱动的食源性疾病监控系统框架,以促进未来对食源性疾病监测系统做出更智能的改进。(撰稿:张鹏、杜一)
相关成果:
1.Hanxue Wang, Wenjuan Cui, Yunchang Guo, Yi Du*, Yuanchun Zhou. Machine Learning Prediction of Foodborne Disease Pathogens: Algorithm Development and Validation Study,JMIR Medical Informatics, 2021
2.Yi Du*, Hanxue Wang, Wenjuan Cui, Hengshu Zhu, Yunchang Guo, Fayaz Ali Dharejo, Yuanchun Zhou. Foodborne Disease Risk Prediction using Multi-Graph Structural LSTM: Algorithm Design and Validation Study,JMIR Medical Informatics, 2021
3.Peng Zhang, Wenjuan Cui, Hanxue Wang, Yi Du*, and Yuanchun Zhou. High-Efficiency Machine Learning Method for Identifying Foodborne Disease Outbreaks and Confounding Factors,2021
4.Yi Du*, Yunchang Guo, Machine Learning Techniques and Research Framework in Foodborne Disease Surveillance System , Food Control, 2021
附件下载
中国科学院基本建设项目档案建档规范 科研课题档案建档规范 -->
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
大数据部在大数据与食源性疾病监测交叉研究领域取得系列进展
本站小编 Free考研考试/2022-01-02
相关话题/疾病 数据 空间 技术 医学
中国科学院“十三五”信息化专项“科学大数据工程”通过技术验收和总验收
6月28日,中国科学院办公厅组织专家对中国科学院“十三五”信息化专项“科学大数据工程”进行了技术验收和总验收。中国科学院办公厅网信处副处长(主持工作)褚大伟、高级工程师郑晓欢、项目承担单位计算机网络信息中心副主任许海燕等领导、项目验收专家组专家、“十三五”信息化发展规划实施效果第三方评估组专家出席会 ...中科院计算机网络信息中心 本站小编 Free考研考试 2022-01-02ScienceDB成为爱思唯尔和细胞出版社推荐数据存储库
近日,科学数据银行(Science Data Bank,简称ScienceDB)成为爱思唯尔(Elsevier)推荐数据存储库。今后全球科研人员在爱思唯尔旗下期刊投稿,可以选择ScienceDB提交并出版科研数据。 此外,5月28日,ScienceDB被爱思唯尔旗下顶尖的生命科学研究出版社细胞出版 ...中科院计算机网络信息中心 本站小编 Free考研考试 2022-01-02中科院“十三五”信息化专项“中国科学院科学数据中心体系建设”项目通过验收
6月28日,中国科学院“十三五”信息化专项“中国科学院科学数据中心体系建设”项目技术专项验收暨总验收会在计算机网络信息中心召开。验收专家组由来自中国科学院地理科学与资源研究所、中国科学院大学、中国农业科学院等单位的12位专家组成,孙九林院士为专家组组长。院办公厅网信处、项目组成员和项目办公室成员等出 ...中科院计算机网络信息中心 本站小编 Free考研考试 2022-01-02大数据部在遥感数据管理和分析方向取得多项学术成果
依托中国科学院战略性先导科技专项“格网数据引擎”和中国科学院基础前沿科学研究计划“从0到1”原始创新项目等科研项目,在建设中国科学院科学数据中心体系、国家基础学科公共科学数据中心、地理空间数据云等平台的同时,大数据部持续攻坚遥感数据管理和分析领域,在主流遥感杂志《Remote Sensing》、人工 ...中科院计算机网络信息中心 本站小编 Free考研考试 2022-01-02五个新建科学数据库入选国家基础学科公共科学数据中心
6月18日,国家基础学科公共科学数据中心(以下简称“国家基础数据中心”)2021年度新建科学数据库课题专家评审会顺利召开,来自中国医学科学院医学信息研究所、中国科学院植物研究所、中国科学院生物物理研究所、中国科学院地理科学与资源研究所、中国科学院计算机网络信息中心等单位的专家和相关人员参会。国家基础 ...中科院计算机网络信息中心 本站小编 Free考研考试 2022-01-02《基于视觉识别操作行为关键技术研究与应用》获电力企业信息技术应用创新金牌成果一等奖
近日,由中科信控(北京)科技有限公司及中科信控大数据有限公司共同承接并组织实施的国家电投集团信息化课题《基于视觉识别操作行为关键技术研究与应用》荣获2021年度电力企业信息技术应用创新金牌成果一等奖。 2021年电力企业信息技术应用创新金牌成果一等奖证书 近年来,人工智能技术在电力系统得到广泛应用 ...中科院计算机网络信息中心 本站小编 Free考研考试 2022-01-02研究人员利用LAMOST数据发现富含ɑ元素“年轻”恒星的形成机制
近期,北京大学博士研究生张萌、张华伟研究员、德国马普天文研究所向茂盛博士等使用红巨星样本的LAMOST光谱数据筛选出富含ɑ元素的“年轻”恒星,并对这些恒星的形成机制进行了深入分析和研究,结果表明这些富ɑ元素的“年轻”恒星可能起源于双星演化,这使得人们对此类特殊恒星的形成有了更进一步的认识。该成果发表 ...中科院国家天文台 本站小编 Free考研考试 2022-01-02科研人员利用LAMOST数据发布目前最大时域多星光谱星表
近日,国家天文台博士研究生李春乾、施建荣研究员、星云计划研究员闫宏亮等人利用LAMOST中分辨率光谱数据,发现了3133颗光谱双星以及132颗光谱三星,并精确测量了它们的视向速度,其中95%为最新发现的多星系统。这是迄今最大的具有时域光谱信息的多星星表,为开展相关研究提供了具有科学传承价值的资源。该 ...中科院国家天文台 本站小编 Free考研考试 2022-01-02研究人员利用LAMOST海量光谱数据证认Gaia数据中6000余颗白矮星
近期,国家天文台孔啸博士、罗阿理研究员基于LAMOST光谱数据在Gaia数据的白矮星侯选体样本中证认出6190颗白矮星,其中1920颗是首次发现的,并包含了64颗激变变星。并对证认出的白矮星样本进行了细致分类和大气参数测量。该工作体现了LAMOST大样本光谱数据集在证认测光巡天中大量特殊天体的独特优 ...中科院国家天文台 本站小编 Free考研考试 2022-01-02LAMOST DR7数据集向全世界公开发布
按照国际天文界惯例及《LAMOST光谱巡天数据政策》,2021年9月底,包含LAMOST先导巡天及正式巡天前七年的光谱数据——DR7数据集(v2.0版本)对全世界公开发布。 LAMOST DR7光谱数据获得于2011年10月至2019年6月共八年的巡天观测。2018年10月5日,LAMOST二期中 ...中科院国家天文台 本站小编 Free考研考试 2022-01-02