(苏州大学计算机科学与技术学院 江苏苏州 215006) (jye.scu@gmail.com)
出版日期:
2019-07-01基金资助:
国家自然科学基金项目(61703293,61672367,61751206)Negation and Speculation Scope Detection in Chinese
Ye Jing, Zou Bowei, Hong Yu, Shen Longxiang, Zhu Qiaoming, Zhou Guodong(College of Computer Science and Technology, Soochow University, Suzhou, Jiangsu 215006)
Online:
2019-07-01摘要/Abstract
摘要: 自然语言文本中存在大量否定和不确定表述,识别这些信息并将其与确定性内容分离,对自然语言处理的下游应用,如信息抽取、信息检索、情感分析等,都具有十分重要的意义.与英语相比,面向汉语的否定与不确定覆盖域检测研究目前较为匮乏.提出了一个基于双向长短期记忆(bidirectional long short-term memory, BiLSTM)网络和条件随机场(conditional random fields, CRF)的融合模型,将覆盖域检测任务作为序列标注问题,针对给定的否定或不确定关键词,识别其在句子中的语义作用范围.该模型既具有LSTM(long short-term memory)网络能够利用前向与后向上下文信息的特性,同时又能够借助CRF 层获取输出标签之间的依赖关系,这得益于该框架能够有效地对序列信息及长距离上下文依赖信息进行编码的优势.在CNeSp语料集上的实验结果验证了模型的有效性,其中,在金融新闻子数据集上,否定与不确定覆盖域检测准确率分别达到79.16%和76.79%,比目前基于传统机器学习的汉语覆盖域检测方法分别提升了25.06%和34.46%.
参考文献
相关文章 15
[1] | 尉桢楷, 程梦, 周夏冰, 李志峰, 邹博伟, 洪宇, 姚建民. 基于类卷积交互式注意力机制的属性抽取研究[J]. 计算机研究与发展, 2020, 57(11): 2456-2466. |
[2] | 许晶航, 左万利, 梁世宁, 王英. 基于图注意力网络的因果关系抽取[J]. 计算机研究与发展, 2020, 57(1): 159-174. |
[3] | 万静,崔美玉,何云斌,李松. 障碍空间中基于Voronoi图的不确定数据聚类算法[J]. 计算机研究与发展, 2019, 56(5): 977-991. |
[4] | 杨卓群,金芝. 面向环境与需求不确定性的系统自适应决策[J]. 计算机研究与发展, 2018, 55(5): 1014-1033. |
[5] | 李博涵,张潮,李东静,许建秋,夏斌,秦小麟. 支持室内障碍空间的DSP-Topk查询优化算法研究[J]. 计算机研究与发展, 2017, 54(3): 557-569. |
[6] | 任丽芳,王文剑,许行. 不确定感知的自适应云计算服务组合[J]. 计算机研究与发展, 2016, 53(12): 2867-2881. |
[7] | 张志飞,苗夺谦,聂建云,岳晓冬. 否定句的情感不确定性度量及分类[J]. 计算机研究与发展, 2015, 52(8): 1806-1816. |
[8] | 吴红花,刘国华,王 伟. 不确定时间序列的相似性匹配问题[J]. 计算机研究与发展, 2014, 51(8): 1802-1810. |
[9] | 刘卓,杨悦,张健沛,杨静,初妍,张泽宝. 不确定度模型下数据流自适应网格密度聚类算法[J]. 计算机研究与发展, 2014, 51(11): 2518-2527. |
[10] | 张汝波, 尹莉莉, 顾恒文,. 不确定海洋环境下AUV环境感知方法研究[J]. 计算机研究与发展, 2013, 50(9): 1981-1991. |
[11] | 唐 杰, 文中华, 汪 泉, 黄 巍,. 不确定可逆规划的强循环规划解[J]. 计算机研究与发展, 2013, 50(9): 1970-1980. |
[12] | 张凤斌 王天博. 实值n维混沌映射否定选择算法[J]. , 2013, 50(7): 1387-1398. |
[13] | 祁亚斐 王意洁 李小勇. 基于高斯模型的不确定数据流Skyline查询方法[J]. , 2012, 49(7): 1467-1473. |
[14] | 王意洁 李小勇 祁亚斐 孙伟东. 不确定数据查询技术研究[J]. , 2012, 49(7): 1460-1466. |
[15] | 廖国琼, 吴凌琴, 万常选,. 基于概率衰减窗口模型的不确定数据流频繁模式挖掘[J]. , 2012, 49(5): 1105-1115. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3969