1(华东理工大学 上海 200237);2(上海申康医院发展中心 上海 200041);3(复旦大学附属儿科医院 上海 201108) (chentong_zhang@163.com)
出版日期:
2020-11-01基金资助:
国家自然科学基金项目(61772201);国家重点研发计划项目(2018YFC0910500)Construction of Large-Scale Disease Terminology Graph with Common Terms
Zhang Chentong1, Zhang Jiaying1, Zhang Zhixing1, Ruan Tong1, He Ping2, Ge Xiaoling31(East China University of Science and Technology, Shanghai 200237);2(Shanghai Hospital Development Center, Shanghai 200041);3(Children’s Hospital of Fudan University, Shanghai 201108)
Online:
2020-11-01Supported by:
This work was supported by the National Natural Science Foundation of China (61772201) and the National Key Research and Development Program of China (2018YFC0910500).摘要/Abstract
摘要: 国家卫计委要求医疗机构使用国际疾病分类(international classification of diseases, ICD)编码,然而由于临床疾病描述存在大量的常用词,导致电子病历中录入的诊断名称与ICD编码直接映射匹配率低.基于区域健康平台上的真实诊断数据,构建了融合常用语的疾病术语图谱.具体来说,在基于疾病构成成分的规则算法基础上,提出了基于数据增强的BERT(bidirectional encoder representation from transformers)上下位关系识别算法,将5万多个诊断常用语和ICD10(international classification of diseases 10th revision,Chinese version)中的疾病进行同义关系和上下位关系识别,进一步融合了ICD11(international classification of diseases 11th revision,Chinese version)的层次结构,此外,还提出了基于疾病-科室关联图谱的任务分配方法以进行人工校验,最终94 478个疾病实体形成了包含1 460条同义关系、46 508条上下位关系的大规模疾病术语图谱.评估实验表明,基于疾病术语图谱,对临床诊断数据的覆盖率比基于ICD10的直接映射编码的覆盖率提升了75.31%,另外,利用疾病术语图谱自动进行编码疾病相比于医生人工编码会缩短约59.75%的编码时间,且正确率达到85%.
参考文献
相关文章 4
[1] | 王赋攀,吴亚东,杨文超,杨帆,侯佳鑫,廖竞. 一种视觉信息融合数据手套设计研究[J]. 计算机研究与发展, 2018, 55(12): 2764-2774. |
[2] | 包震坤,张卫明,程 森,赵险峰. 基于像素链动态失真和校验格码的±1隐写编码[J]. 计算机研究与发展, 2014, 51(8): 1739-1747. |
[3] | 张招亮, 陈海明, 黄庭培, 崔 莉,. 无线网络的差异化比特错误率估计方法[J]. 计算机研究与发展, 2014, 51(1): 138-150. |
[4] | 赵 佳 韩 军 曾晓洋 韩 林. AES算法的并发错误检测方法及其VLSI实现[J]. , 2009, 46(4): 593-601. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4302