中文篇章零元素语料库构建
盛晨, 孔芳†, 周国栋 苏州大学计算机科学与技术学院自然语言处理实验室, 苏州 215006收稿日期:
2018-04-19修回日期:
2018-08-07出版日期:
2019-01-20基金资助:
国家自然科学基金(61472264, 61751206)和国家重点研发计划(2017YFB1002101)资助Building Chinese Zero Corpus Form Discourse Perspective
SHENG Chen, KONG Fang†, ZHOU Guodong Natural Language Processing Lab, School of Computer Science and Technology, Soochow University, Suzhou 215006Received:
2018-04-19Revised:
2018-08-07Published:
2019-01-20RichHTML
0可视化
0复制本文网址
1. 探讨2016版国际胰瘘研究小组定义和分级系统对胰腺术后患者胰瘘分级的影响.PDF(500KB)
-->
摘要/Abstract
摘要: 针对中文零指代问题, 从篇章视角进行理论分析, 并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus, CDZC)的构建工作。首先, 整理和分析已有的理论研究以及语料资源, 探究篇章层面中文零元素语料库标注的必要性。然后, 采用自底向上、前向搜索的标注策略和人机结合的半自动标注方式, 完成CDZC语料库的构建。最后, 对该语料库进行一系列详细的统计分析。结果表明, CDZC能够充分反映出中文零元素省略的语言特点, 为相关研究提供语料资源支持。
引用本文
盛晨, 孔芳, 周国栋. 中文篇章零元素语料库构建[J]. 北京大学学报自然科学版, 2019, 55(1): 15-21.
SHENG Chen, KONG Fang, ZHOU Guodong. Building Chinese Zero Corpus Form Discourse Perspective[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 15-21.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3296