基于分析和生成的复述与SMT语料扩展
和为, 刘挺
(哈尔滨工业大学 计算机科学与技术学院, 150001 哈尔滨)
摘要:
为了解决统计机器翻译语料对调序现象覆盖不足的问题,采用复述方法对语料进行扩展.提出了一种基于依存分析和句子生成的复述方法.对句子进行依存分析得到依存树,然后从依存树生成多个自然语言句子.生成的句子与原句相比没有词汇上的改变,但可以在词序方面进行变换.实验表明方法在不引入额外资源的前提下,有效缓解了语料覆盖不足的问题,提高了机器翻译质量.
关键词: 复述 统计机器翻译 依存分析 句子生成
DOI:10.11918/j.issn.0367-6234.2013.05.009
分类号:
基金项目:国家自然科学基金面上资助项目(6,2);国家高技术研究发展计划重大资助项目(2011AA01A207).
Parse-realize based paraphrasing and SMT corpus enriching
HE Wei, LIU Ting
(School of Computer Science and Technology, Harbin Institute of Technology, 150001 Harbin, China)
Abstract:
To resolve the low-coverage problem of the statistic machine translation training corpus, a dependency parsing and sentence realization based paraphrasing method is proposed. The input sentence is first parsed into a dependency tree, and then the tree is realized into multiple natural language sentences. Although the generated sentences have the same lexical words, the expressions of word orders are re-arranged. The experiments shows that the paraphrasing method can be used to enlarge the bilingual corpus for statistic machine translation and the method efficiently relieves the low-coverage problem of training corpora without any extra resources, finally the translation quality is improved.
Key words: paraphrase statistic machine translation dependency parsing sentence realization
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
基于分析和生成的复述与SMT语料扩展
本站小编 哈尔滨工业大学/2019-10-24
相关话题/统计 质量 实验 资源 哈尔滨工业大学
Zn-Al钎料固相率及组分对Cu/Al管磁脉冲-半固态复合辅助钎焊接头质量的影响初探
Zn-Al钎料固相率及组分对Cu/Al管磁脉冲-半固态复合辅助钎焊接头质量的影响初探王振东,黄尚宇,李佳琪,黄海川,高远(武汉理工大学材料科学与工程学院,武汉430070)摘要:由于节能环保以及轻量化的要求,Cu/Al异种金属复合管件被广泛应用于各工业领域,为此探索一种Cu/Al管件间高效可靠的连接 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05基于问题导向的生物信息学综合实验教学设计
基于问题导向的生物信息学综合实验教学设计霍颖异1,2,徐程2,吴敏1,2,陈铭2(1.浙江大学国家级生物实验教学示范中心,杭州310058;2.浙江大学生命科学学院,杭州310058)摘要:针对生物信息学相关课程的实验教学需求,结合前沿科研问题和成果,设计了基于问题导向的生物信息学综合实验。实验以宏 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05电极丝前置式射流电解加工仿真及初步实验研究
电极丝前置式射流电解加工仿真及初步实验研究李飘庭1,2,荆奇1,3,张勇斌1,李建1,傅波2(1.中国工程物理研究院机械制造工艺研究所,四川绵阳621900;2.四川大学机械工程学院,成都610065;3.复旦大学光科学与工程系,上海200438)摘要:射流电解加工技术在航天、仪器、电子和医疗设备等 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05桥梁伸缩缝跳车冲击荷载计算方法与模型实验
桥梁伸缩缝跳车冲击荷载计算方法与模型实验丁勇1,2,王佩1,游玖昂1,诸葛萍1(1.宁波大学土木工程系,浙江宁波315211;2.桥梁工程结构动力学国家重点实验室(重庆交通科研设计院),重庆400067)摘要:为实测移动车辆对桥梁伸缩缝的冲击荷载,防止桥梁伸缩缝在这种冲击荷载作用下发生早期损坏,制作 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05大气感应耦合等离子体炬管的设计与仿真实验
大气感应耦合等离子体炬管的设计与仿真实验余德平1,吴杰1,2,涂军1,张仕杨2,辛强2,万勇建2(1.四川大学机械工程学院,成都610065;2.中国科学院光电技术研究所,成都610209)摘要:为提高大气感应耦合等离子体射流加工装置的工作稳定性,设计一种依靠单一零件定位各层介质管的分体式炬管,并研 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05考虑质量预测的前摄调度问题模型与算法
考虑质量预测的前摄调度问题模型与算法陆志强,朱宏伟,廖怡娜(同济大学机械与能源工程学院,上海201804)摘要:为有效描述装配人员水平、工件质量等因素对飞机装配作业质量的影响,并为飞机装配过程建立合理的前摄调度计划,提出支持向量回归(SVR)预测模型和两阶段循环迭代搜索算法.采集相关历史质量数据,以 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05一种基于统计损伤本构关系的岩石脆性评价新方法
一种基于统计损伤本构关系的岩石脆性评价新方法胡清波1,梁海安1,2,杨婷1,程新俊1,陈海康1,张龙鹏1(1.东华理工大学土木与建筑工程学院,南昌330013;2.核资源与环境国家重点实验室(东华理工大学),南昌330013)摘要:脆性评价对岩石(尤其是深部岩石)的可压裂、开挖损伤及岩爆等特性的研究 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05连续压实质量检测参数单点异常值识别及处理
连续压实质量检测参数单点异常值识别及处理聂志红,阚常壮,谢扬(中南大学土木工程学院,长沙410075)摘要:为解决现行连续压实检测参数异常值识别及处理方法未考虑数据空间分布特征的问题,结合地统计学的半变异函数,提出基于自相关距离的近邻加权估计识别法,并定义单点异常值判定指标:异常指数αi,将异常值剔 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2019-10-24动态数学数字资源开放平台的研究与设计
动态数学数字资源开放平台的研究与设计管皓1,2,秦小林1,2,饶永生3(1.中国科学院大学,北京100049;2.中国科学院成都计算机应用研究所,成都610041;3.广州大学计算科技研究院,广州510006)摘要:数字教育资源的共建共享行动已成为当前教育信息化的重要内容和研究热点.经过多年的研究和 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2019-10-24Zr41Ti14Ni12.5Cu10Be22.5非晶合金冲击压缩行为理论与实验研究
Zr41Ti14Ni12.5Cu10Be22.5非晶合金冲击压缩行为理论与实验研究张云峰1,罗兴柏1,孙华刚2,施冬梅1,张玉令1,刘国庆1(1.陆军工程大学,石家庄050000;2.陆军装备研究院,石家庄050000)摘要:为研究Zr41Ti14Ni12.5Cu10Be22.5非晶合金的冲击压缩响 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2019-10-24