摘要该文提出一种面向句子的汉英口语翻译自动评分方法,选取语义关键词、句子大意和口语流利度作为评分的主要参数。为了提高关键词评分的准确度,该文使用同义词辨析方法,识别考生答题关键词中的同义词;在句子层面,使用可伸展递归自编码(unfolding recursive auto-encoder,URAE)神经网络模型分析考生对句子大意的翻译;最后基于语速(tempo/rate)和语音的分布情况对口语流利度进行评分。综合三种参量加权评分,得到最后翻译质量的评分。实验结果表明,采用该文方法与人工评分结果具有较好的一致性,达到了预期设计目标。
PDF全文下载地址:
http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3161
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
一种面向句子的汉英口语翻译自动评分方法
本站小编 Free考研考试/2022-01-02
相关话题/翻译 设计 实验 质量 综合
译文质量估计中基于Transformer的联合神经网络模型
摘要译文质量估计作为机器翻译中的一项重要任务,在机器翻译的发展和应用中发挥着重要的作用。该文提出了一种简单有效的基于Transformer的联合模型用于译文质量估计。该模型由Transformer瓶颈层和双向长短时记忆网络组成,Transformer瓶颈层参数利用双语平行语料进行初步优化,模型所有参 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于重解码的神经机器翻译方法研究
摘要基于Transformer的序列转换模型是当前性能最优的机器翻译模型之一。该模型在生成机器译文时,通常从左到右逐个生成目标词,这使得当前位置词的生成不能利用译文中该词之后未生成词的信息,导致机器译文解码不充分从而降低译文质量。为了缓解上述问题,该文提出了基于重解码的神经机器翻译模型,该模型将已生 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于视觉-语义中间综合属性特征的图像中文描述生成算法
摘要图像描述是计算机视觉、自然语言处理与机器学习的交叉领域多模态信息处理任务,需要算法能够有效地处理图像和语言两种不同模态的信息。由于异构语义鸿沟的存在,该任务具有较大的挑战性。目前主流的研究仍集中在基于英文的图像描述任务,对图像中文描述的研究相对较少。图像视觉信息在图像描述算法中没有得到足够的重视 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02融合EMD最小化双语词典的汉—越无监督神经机器翻译
摘要神经机器翻译在平行语料充足的任务中能取得很好的效果,然而对于资源稀缺型语种的翻译任务则往往效果不佳。汉语和越南语之间没有大规模的平行语料库,在这项翻译任务中,该文探索只使用容易获得的汉语和越南语单语语料,通过挖掘单语语料中词级别的跨语言信息,融合到无监督翻译模型中提升翻译性能;该文提出了融合EM ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于神经机器翻译编码器的语义学习分析
摘要神经机器翻译凭借其良好性能成为目前机器翻译的主流方法,然而,神经机器翻译编码器能否学习到充分的语义信息一直是学术上亟待探讨的问题。为了探讨该问题,该文通过利用抽象语义表示(abstractmeaningrepresentation,AMR)所包含的语义特征,分别从单词级别、句子级别两种不同的角度 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02利用质量估计改进无监督神经机器翻译
摘要传统上神经机器翻译依赖于大规模双语平行语料,而无监督神经机器翻译的方法避免了神经机器翻译对大量双语平行语料的过度依赖,更适合低资源语言或领域。无监督神经机器翻译训练时会产生伪平行数据,这些伪平行数据质量对机器翻译最终质量起到了决定性的作用。因此,该文提出利用质量估计的无监督神经机器翻译模型,通过 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于递进式半知识蒸馏的神经机器翻译
摘要神经机器翻译(NMT)模型通常具有庞大的参数量,例如,Transformer在词表设为3万时有将近1亿的神经元,模型的参数量越大,模型越难优化,且存储模型的资源需求也越高。该文提出了一种压缩方法,用于将复杂且参数量大的NMT模型压缩为精简参数量小的NMT模型。该文同时提出半知识蒸馏方法和递进式半 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于层次分析法的汉语词汇综合复杂度量化分析
摘要在国际汉语教学中,词汇综合复杂度的量化研究有利于汉语二语学习者词汇习得顺序的确定,有利于教材编写过程中词汇的选择,有利于教师更加有效地组织课堂教学,最终提高教学效果。该文在对词汇的构词汉字属性、词汇一般属性、词汇统计属性等特征进行分析的基础上,构造了基于层次分析法(analytichierarc ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于迭代式回译策略的藏汉机器翻译方法研究
摘要该文通过稀缺语言资源条件下机器翻译方法的研究以提高藏汉机器翻译质量,同时希望对语言资源匮乏的其他少数民族语言机器翻译研究提供借鉴。首先该文使用164.1万句对藏汉平行语言资源数据在Transformer神经网络翻译模型上训练一个基线系统,作为起始数据资源,然后结合翻译等效性分类器,利用迭代式回译 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02神经机器翻译前沿综述
摘要机器翻译是指通过计算机将源语言句子翻译到与之语义等价的目标语言句子的过程,是自然语言处理领域的一个重要研究方向。神经机器翻译仅需使用神经网络就能实现从源语言到目标语言的端到端翻译,目前已成为机器翻译研究的主流方向。该文选取了近期神经机器翻译的几个主要研究领域,包括同声传译、多模态机器翻译、非自回 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02