面向维汉神经机器翻译的双向重排序模型分析
张新路1,2,3, 李晓1,2,3,?, 杨雅婷1,2,3, 王磊1,2,3, 董瑞1,2,3 1. 中国科学院新疆理化技术研究所, 乌鲁木齐 8300112. 中国科学院大学, 北京 1000493. 新疆民族语音语言信息处理实验室, 乌鲁木齐 830011收稿日期:
2019-06-02修回日期:
2019-09-27出版日期:
2020-01-20基金资助:
新疆维吾尔自治区重点实验室开放课题(2018D04018)、国家自然科学基金(U1703133)、中国科学院青年创新促进会项目(2017472)和新疆维吾尔自治区高层次人才引进工程项目(Y839031201)资助Analysis of Bi-directional Reranking Model for Uyghur-Chinese Neural Machine Translation
ZHANG Xinlu1,2,3, LI Xiao1,2,3,?, YANG Yating1,2,3, WANG Lei1,2,3, DONG Rui1,2,3 1. Xinjiang Technical Institute of Physics & Chemistry, Chinese Academy of Sciences, Urumqi 8300112. University of Chinese Academy of Sciences, Beijing 1000493. Xinjiang Laboratory of Minority Speech and Language Information Processing, Urumqi 830011Received:
2019-06-02Revised:
2019-09-27Published:
2020-01-20
可视化
0复制本文网址
1. 探讨2016版国际胰瘘研究小组定义和分级系统对胰腺术后患者胰瘘分级的影响.PDF(500KB)
-->
摘要/Abstract
摘要: 在维吾尔语到汉语等低资源语料库上, 神经机器翻译的拟合训练容易陷入局部最优解, 导致单一模型的翻译结果可能不是全局最优解。针对此问题, 通过集成策略, 有效整合多个模型预测的概率分布, 将多个翻译模型作为一个整体; 同时采用基于交叉熵的重排序方法, 将具有相反解码方向的翻译模型相结合, 最终选出综合得分最高的候选翻译作为输出。在CWMT2015维汉平行语料上的实验结果表明, 与单一的Transformer模型相比, 改进后的方法提升4.82个BLEU值。
引用本文
张新路, 李晓, 杨雅婷, 王磊, 董瑞. 面向维汉神经机器翻译的双向重排序模型分析[J]. 北京大学学报自然科学版, 2020, 56(1): 31-38.
ZHANG Xinlu, LI Xiao, YANG Yating, WANG Lei, DONG Rui. Analysis of Bi-directional Reranking Model for Uyghur-Chinese Neural Machine Translation[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 31-38.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3430