一种基于循环神经网络的古文断句方法
王博立1, 史晓东1,2,3,†(
2. 厦门大学两岸关系和平发展协同创新中心, 厦门 361005
3. 福建省类脑计算技术及应用重点实验室, 厦门 361005
4. 厦门大学软件学院, 厦门 361005
收稿日期:
2016-07-29修回日期:
2016-10-07出版日期:
2016-11-30基金资助:
教育部专项“简繁汉字智能转换系统”、国家科技支撑计划项目(2012BAH14F03)、教育部博士点基金(20130121110040)、国家自然科学基金(61573294)和CCF中文信息技术开放课题(CCF2015-01-01)资助A Sentence Segmentation Method for Ancient Chinese Texts Based on Recurrent Neural Network
Boli WANG1, Xiaodong SHI1,2,3,†(
2. Collaborative Innovation Center for Peaceful Development of Cross-Strait Relations, Xiamen University, Xiamen 361005
3. Fujian Province Key Laboratory for Brain-inspired Computing, Xiamen 361005
4. Software School, Xiamen University, Xiamen 361005
Received:
2016-07-29Revised:
2016-10-07Published:
2017-03-20RichHTML
8
可视化
0复制本文网址
1. 探讨2016版国际胰瘘研究小组定义和分级系统对胰腺术后患者胰瘘分级的影响.PDF(500KB)
-->
摘要/Abstract
摘要: 提出一种基于循环神经网络的古文自动断句方法。该方法采用基于GRU (gated recurrent unit)的双向循环神经网络进行古文断句。在解码过程中, 该算法不仅利用神经网络输出的概率分布, 还进一步引入状态转移概率和长度惩罚, 以便提高断句准确率。在大规模古籍语料上的实验结果表明, 所提方法能够取得比传统方法更高的断句F1值。
中图分类号:
-->TP391
引用本文
王博立, 史晓东, 苏劲松. 一种基于循环神经网络的古文断句方法[J]. 北京大学学报自然科学版, 2017, 53(2): 255-261.
Boli WANG, Xiaodong SHI, Jinsong SU. A Sentence Segmentation Method for Ancient Chinese Texts Based on Recurrent Neural Network[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2017, 53(2): 255-261.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3076