删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于融合条目词嵌入和注意力机制的自动 ICD 编码

本站小编 Free考研考试/2021-12-20

基于融合条目词嵌入和注意力机制的自动 ICD 编码

张虹科1, 付振新1, 任前平2, 徐辉2, 赵东岩1, 严睿1,?
1. 北京大学王选计算机研究所, 北京 1008712. 生命奇点(北京)科技有限公司, 北京 100080

收稿日期:2019-05-22修回日期:2019-09-25出版日期:2020-01-20

基金资助:国家重点研发计划(2017YFC0804001)和国家自然科学基金(61672058, 61876196)资助

Automated ICD Coding Based on Word Embedding with Entry Embedding and Attention Mechanism

ZHANG Hongke1, FU Zhenxin1, REN Qianping2, XU Hui2, ZHAO Dongyan1, YAN Rui1,?
1. Wangxuan Institute of Computer Technology, Peking University, Beijing 1008712. Gennlife (Beijing) Technology Ltd, Beijing 100080

Received:2019-05-22Revised:2019-09-25Published:2020-01-20



PDF

(725KB)

可视化

0

复制本文网址



1. 探讨2016版国际胰瘘研究小组定义和分级系统对胰腺术后患者胰瘘分级的影响.PDF(500KB)

-->



摘要/Abstract


摘要: 构建一种基于融合条目词嵌入和注意力机制的深度学习模型, 可以充分利用电子病案中的多种非结构化文本数据, 对病案首页的主要诊断进行自动ICD编码。该模型首先对含有病案条目的文本进行融合条目的词嵌入, 并通过关键词注意力来丰富词级别的类别表示; 然后利用词语注意力来突出重点词语的作用, 增强文本表示; 最后通过全连接神经网络分类器进行分类, 输出ICD编码。通过在中文电子病案数据集上的消融实验, 验证了融合条目词嵌入、关键词注意力和词语注意力的有效性; 与多个基准模型相比, 所建模型在对81 种疾病的分类中取得最好的分类效果, 可以有效地提高自动ICD编码的质量。

引用本文



张虹科, 付振新, 任前平, 徐辉, 赵东岩, 严睿. 基于融合条目词嵌入和注意力机制的自动 ICD 编码[J]. 北京大学学报自然科学版, 2020, 56(1): 1-8.
ZHANG Hongke, FU Zhenxin, REN Qianping, XU Hui, ZHAO Dongyan, YAN Rui. Automated ICD Coding Based on Word Embedding with Entry Embedding and Attention Mechanism[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 1-8.





PDF全文下载地址:

http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3426
相关话题/北京 北京大学 数据 生命 系统