利用URL-Key领域术语识别方法
吕书宁1, 董志安2,† 1. 北京工业大学软件学院, 北京1001242. 北京信息科技大学网络文化与数字传播北京市重点实验室, 北京100101
收稿日期:
2017-06-05修回日期:
2017-09-02出版日期:
2018-03-20基金资助:
国家自然科学基金(61671070)和国家语言文字工作委员会重点项目(ZDI135-53)资助Domain Term Extraction Using URL-Key
LÜ Shuning1, DONG Zhian2,† 1. School of Software Engineering, Beijing University of Technology, Beijing 1001242. Beijing Key Laboratory of Internet Culture and Digital Dissemination Research, Beijing Information Science and Technology University, Beijing 100101
Received:
2017-06-05Revised:
2017-09-02Published:
2018-03-20
可视化
0复制本文网址
1. 探讨2016版国际胰瘘研究小组定义和分级系统对胰腺术后患者胰瘘分级的影响.PDF(500KB)
-->
摘要/Abstract
摘要: 首次提出利用URL-Key进行领域术语识别的方法。以URL作为媒介, 借助已知URL-Key的领域性来判断未知领域候选术语的领域性。首先, 借助互联网中已有的人工分类领域URL, 根据URL-Key在各领域汇总使用的频度, 采用基于方差的领域URL-Key识别方法, 构建领域URL-Key词表; 然后, 利用伪反馈技术, 收集候选领域词检索得到的URL结果集, 根据URL结果集构建候选领域术语的URL-Key特征向量; 最后, 利用SVM对候选领域术语进行提取。在4个领域进行实验, 都取得不错的效果。新提出的方法可以有效地解决低频术语识别问题, 为低频术语的识别提供新的思路。
中图分类号:
-->TP391
引用本文
吕书宁, 董志安. 利用URL-Key领域术语识别方法[J]. 北京大学学报(自然科学版), 2018, 54(2): 262-270.
Lü Shuning, DONG Zhian. Domain Term Extraction Using URL-Key[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2018, 54(2): 262-270.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3181