删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

融合先验信息的蒙汉神经网络机器翻译模型

本站小编 Free考研考试/2022-01-02

闂備胶鎳撻悺銊╁礉閹烘梹瀚婚柣鏃傚劋鐎氭岸鏌涘▎宥呭姎闁轰讲鏅犻幃璺衡槈鏉堚晛甯ㄧ紓浣介哺缁诲牆鐣峰璺哄耿闁哄洢鍨婚崣鎰版煟閻樺弶鎼愬褌绮欓崺銏ゆ嚃閳哄倸鐨梺鍛婃处閸撴岸鎮橀幇鐗堚拺闁告挆鍐у闁汇埄鍨伴顓熺閸涘﹥缍囨い鎰╁灩楠炲姊洪崗鐓庡姢闁搞垼灏妵鎰版晸閿燂拷40%闂備礁婀辩划顖炲礉閺嶎厼鍨傛慨妯块哺鐏忓孩鎱ㄥΟ鍨厫閻忓浚浜弻銊モ槈閾忣偄顏�
闂備浇顫夋禍浠嬪礉瀹€鈧划璇差吋閸ャ劌鐨┑顔角归崺鏍焊椤忓牊鐓涘璺猴工閺嗙喐绻涙径妯哄籍濠碘剝鎸冲畷鎺戔攽閹邦剚顔曞┑鐐差嚟婵绱為埀顒勬煏閸℃鏆g€规洩缍侀、娑㈡倷閳轰椒澹曞┑顔矫壕顓犵不閺嶎灐鐟扳堪閸曨偆顑勬繛瀵稿Т閻楀繒妲愰弮鍫濈闁绘ê鐏氶幆锝夋⒒娓氬洤浜濋柡灞诲妿濞嗐垽鎮欑€电硶鏋栭梺缁樺灦钃遍柟鐤含缁辨帡寮埀顒勬偡閿旂偓鏆滅憸鐗堝笧瀹撲線鏌涢…鎴濇珮闁告艾鎳庨湁闁兼祴鏅涜ⅴ闂侀€炲苯澧梺鑺ュ⒊P濠电偞娼欓崥瀣嚌妤e啫绠熼柟鎯版閻忚櫕绻濋崹顐e暗缂佲偓婢舵劖鐓熼柍褜鍓欐俊浠嬫煕閳哄倻娲撮柡灞芥噹椤繂鐣烽崶鈺冩毇闂佽崵濮村ú銈堛亹閻愬搫鑸规い鎺戝€归崑姗€鏌曟繛褍瀚弳鐘绘⒑閸涘﹤绗掓俊顐f濡懘鍩¢崨顔惧弰闂佺粯鍔﹂崜娆愬緞瀹ュ鐓欓悗娑欋缚婢ь剟鏌熼惂鍝ョМ妤犵偛閰f俊鐑藉Ω閵夛妇浜峰┑鐐村灦濮婄懓顭垮鈧獮鍐ㄎ旈崨顔芥珫閻庡厜鍋撻柛鎰劤濞堢偓绻涚€电ǹ顎撶紓宥佸亾闂侀潧妫楅崯鎾箠閵忕姷鏆嬮柡澶庢硶閹拷40%闂備礁婀辩划顖炲礉閺嶎厼鍨傛慨妯挎硾杩濋梺绋挎湰缁诲秹宕甸敃鈧湁闁绘瑥鎳愮粔顒勬煏閸℃鏆熼柟宄扮秺椤㈡ê鈹戦崶褜浼嗛梻浣告惈閻楁粓宕滃☉銏″仧妞ゆ牗绋撻々鐑芥偣娴e摜锛嶇紒澶婄仢闇夋繝褏濮撮崯顖炲箚閸岀偞鐓ユ繛鎴炃圭€氱増绻涢悡搴☆劉缂佸倸绉归、鏇㈠閻樼數袣9闂備胶顢婇崺鏍綘闂侀€炲苯澧柛濠冩倐閹啴濮€閵堝懐顦梺绯曞墲濞茬喖鎮¢埡鍛拺闁告挆鍐у闁汇埄鍨遍幐铏繆鐎涙ɑ濯撮悷娆忓闂傤垶姊虹涵鍛牚闁稿骸宕湁婵せ鍋撻柟顔ㄥ洤鐐婇柍鍝勫暞閹綁姊洪幐搴b槈闁兼椿鍨甸妵鎰板磼閻愯尙顦梺鍝勵槹椤戞瑩宕濋崨瀛樼厸鐎规挻鍝庨崐銈夊疮閸儲鐓曠憸搴g矙韫囨稑鐒垫い鎴e劵閸忓本绻涢崨顐㈠闁诡垱妫冮弫鍐╂媴缁嬭法浠梻浣告啞閻ㄦ粍鎷呴幓鎺嶅婵炶揪缍侀弲鑼姳閹惰姤鐓曟俊銈勭閹兼悂鏌嶈閸忔稓绮堟担鍦洸闁哄洨鍠撻埞宥夊箳閹惰棄鐒垫い鎴濈仢閸婃構缂傚倷绀侀張顒€顪冮挊澹╂盯宕稿Δ鈧繚婵炶揪缍€濞咃綁宕i埀顒佺箾閹寸偞鐓ョ紒銊︽そ閸┾偓妞ゆ垶瀵х粊浼存煟椤忓懏灏﹂柟顔芥そ閺佹劙宕堕埡鍌涘劘闂備礁鎲¢懝鍓р偓姘煎墴婵$敻宕堕鍌氱ウ闂佸憡鍔栬ぐ鍐煀闁秵鐓忛柛鈽嗗幗鐎氾拷
摘要神经网络机器翻译模型在蒙古文到汉文的翻译任务上取得了很好的效果。神经网络翻译模型仅利用双语语料获得词向量,而有限的双语语料规模却限制了词向量的表示。该文将先验信息融合到神经网络机器翻译中,首先将大规模单语语料训练得到的词向量作为翻译模型的初始词向量,同时在词向量中加入词性特征,从而缓解单词的语法歧义问题。其次,为了降低翻译模型解码器的计算复杂度以及模型的训练时间,通常会限制目标词典大小,这导致大量未登录词的出现。该文利用加入词性特征的词向量计算单词之间的相似度,将未登录词用目标词典中与之最相近的单词替换,以缓解未登录词问题。最终实验显示在蒙古文到汉文的翻译任务上将译文的BLEU值提高了2.68个BLEU点。

PDF全文下载地址:

http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2580
闂備礁缍婂ḿ褔顢栭崱妞绘敠闁逞屽墴閻擃偊宕剁捄杞板枈闂侀€炲苯澧伴柛鐘查叄瀹曘垽濡堕崶銊ヮ伕闁荤喐鐟ョ€氼參寮抽崼銉︾厱闁归偊鍓欓〃娆戠磼閸欐ê宓嗙€规洏鍔戦弫鎾绘晸閿燂拷闂備焦瀵х粙鎴︽儔婵傚憡鍋熸繛鎴欏灩绾偓闁诲骸婀辨慨瀵哥不椤栫偞鐓曟繛鍡樺姉婢ь剚绻濋埀顒勫箥椤旀儳宕ュ┑鐐叉鐢偤濡堕锔界厸闁稿本绋撻幊鍡欐偖濞嗘挻鐓曟俊顖欒閸庢垹绱撻崒姘兼Ш闁逞屽墴濞佳兾涘☉銏″亯婵犲﹤鐗婇弲顒勬煥閻曞倹瀚�
相关话题/翻译 计算 语法 实验 信息

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于统计的蒙汉机器翻译中词对齐方法研究
    摘要蒙古语属于小语种,蒙古语到汉语机器翻译相关研究进展缓慢。所以,实现高质量的蒙汉机器翻译对我国少数民族地区信息化发展有着重要意义。其中,词语对齐对机器翻译质量起着至关重要的作用。该文提出了一种基于蒙古语切分的词干词缀为基本单位的蒙汉机器翻译词对齐方法。该方法利用词干词缀表和逆向最大匹配算法来实现蒙 ...
    本站小编 Free考研考试 2022-01-02
  • 基于CNN词根形态选择模型的改进蒙汉机器翻译研究
    摘要随着科学技术的发展,以循环神经网络为基础的机器翻译方法由于翻译质量更好而逐渐取代统计机器翻译方法,特别是在国际大语种之间的互译方面,RNN在对语料编码时能够提取更好的特征,这对翻译质量好坏至关重要。然而在蒙古语这类小语种的翻译方面,由于语料不足导致的数据稀疏和RNN模型训练梯度消失等问题,很难从 ...
    本站小编 Free考研考试 2022-01-02
  • 面向情感聚类的文本相似度计算方法研究
    摘要在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情感因素的表示问题,提出一种基于子空间的文本语义相似度计算方法(RESS)。 ...
    本站小编 Free考研考试 2022-01-02
  • 向量模型和多源词汇分类体系相结合的词语相似性计算
    摘要现有的词语语义相似性计算主要包括基于向量模型以及基于词汇分类体系两类方法,但这两类方法都存在自身的缺点。向量模型所依赖的文本共现中的上下文信息不等同于真正意义上的语义,而词汇分类体系方法则存在构建代价大,并且在一定程度上还不够完善的问题。该文提出一种向量模型与多源词汇分类体系相结合的词语相似性计 ...
    本站小编 Free考研考试 2022-01-02
  • 基于子字单元的神经机器翻译未登录词翻译分析
    摘要神经机器翻译为机器翻译提供了一种全新的方法,在多对语言之间的翻译质量上,已超过了统计机器翻译,并逐渐成为当前机器翻译的主流方向。未登录词翻译是神经机器翻译的主要难点之一。为了消解未登录词,一种可行的方案是采用BytePairEncoding(BPE)方法。该方法在翻译前将原有的单词拆解为更小粒度 ...
    本站小编 Free考研考试 2022-01-02
  • 基于最长名词短语分治策略的神经机器翻译
    摘要神经机器翻译自兴起以来,不断给机器翻译领域带来振奋人心的消息。但神经机器翻译没有显式地利用语言学知识对句子结构进行分析,因此对结构复杂的长句翻译效果不佳。该文基于分治法的思想,识别并抽取句子中的最长名词短语,保留特殊标识或核心词,与其余部分组成句子框架。通过神经机器翻译系统分别翻译最长名词短语和 ...
    本站小编 Free考研考试 2022-01-02
  • 基于共现词映射的中英韩跨语种文档相似度计算
    摘要该文采用中英韩跨语种文本数据研究不同语种文档间相似度的计算方法。首先,通过共现词映射将某语种空间中的文档向量表示成另一语种空间中的文档向量;其次,利用潜在语义分析补充了不同语言间一词多义现象造成的向量缺失;最后,在具有等价语义信息的同一语种空间中计算了两个文档之间的余弦相似度。该文工作避开了外部 ...
    本站小编 Free考研考试 2022-01-02
  • 网络传播信息内容的可信度研究进展
    摘要网络中存在着大量的谣言、偏激和虚假信息,这对网络信息的质量、可信度以及舆情的产生与发展趋势具有严重的负面影响。为实现信息可信度的准确判断与高效度量,该文在大量已有最新研究成果与文献的基础上,将不可信信息分为极端突发事件信息、网络偏激信息、网络谣言、虚假信息、误报信息和垃圾信息等类型,并分别针对这 ...
    本站小编 Free考研考试 2022-01-02
  • 开放域上基于深度语义计算的复述模板获取方法
    摘要利用实体关系从网络大规模单语语料获取复述模板的方法可以规避对单语平行语料或可比语料的依赖,但是后期需要人工对有语义差异的关系模板分类后获取复述模板。针对这一遗留问题,该文提出基于深度语义计算的复述模板自动获取方法,首先设计基于统计特征的模板裁剪方法,从非复述语料中获取高质量的关系模板,然后设计基 ...
    本站小编 Free考研考试 2022-01-02
  • 基于多特征信息传播模型的微博意见领袖挖掘
    摘要在线社交网络中的意见领袖通常是指在社交网络的信息传播中具有较大社会影响力的个体。针对当前意见领袖挖掘方法中只考虑社交网络的拓扑结构和节点的个体属性,缺乏信息传播中交互特征的问题,该文提出了基于扩展独立级联模型,并融入网络结构特征、个体属性和行为特征的意见领袖挖掘模型(extendedindepe ...
    本站小编 Free考研考试 2022-01-02
闂備胶绮崝妤呭箠閹捐鍚规い鏂垮⒔閸楁岸鎮楅敐搴濈盎缂佷緡鍣i弻鐔煎礂閼测晝鐓傞梺绋跨焿閹凤拷2濠电偞鍨堕幐绋棵洪妸鈺嬬稏闁圭儤顨嗛崵鈧梺鍛婂姦娴滅偤宕洪敓鐘崇厽闁靛繈鍊栧☉褔鏌i埄鍐噰闁诡啫鍥ч唶闁挎繂娲㈤崑鎺楁⒑閸濆嫬鈧綊鎮锋潏鈺傤潟闁跨噦鎷�
濠电姰鍨归悥銏ゅ炊瑜嶆慨銈夋⒑閸涘﹤绗掓俊顐g洴椤㈡棃濮€閵堝棭妫勯柣搴秵閸犳牠宕㈤幘顔界厸闁告洟娼ч悘锝嗐亜閹存繃澶勭紒瀣樀閸┾偓妞ゆ巻鍋撻柍璇查叄濡鹃亶鏌嶈閸撴瑩宕导瀛樺亯婵炲樊浜濋弲顒勬倶閻愮數鎽傞柛銈囧Т闇夋繝濠傚暣椤庢銇勯埞顓炲婵挳鏌¢崶鈺佹灁闁告瑢鍋撻梻浣哥秺濞佳嗐亹閻愮數绠旈柟鎯ь嚟閳绘梹鎱ㄥΟ璇插闁搞倧绠撻弻鐔虹矙閹稿孩鎮欓梺浼欑秮缁犳牕顕i鈶╂瀻闁归偊鍘剧粙鍕⒑閹稿海鈽夐柡鍫墴瀹曞綊濡歌婵ジ鏌涘☉姗堟敾缂佺姵甯為埀顒€鐏氬姗€鎮ч崱娴板洭宕稿Δ浣镐痪闂佺鎻梽鍕晬閺嶎厽鐓忛柛鈩冩礀椤b暜ee濠电姰鍨圭紞濠囧焵椤掍胶鈯曢柕鍡楀暣閺屾盯骞掗幋鐑嗘濡炪倖甯為崰鎰矙婵犲洦鍋愰柣銏㈡暩鏁堥梻浣稿悑濠㈡﹢宕导瀛樺亯闁告繂濯辨惔銏$秶妞ゆ劗鍠庢禍楣冩煛閸ャ劍鐨戦柣鐔叉櫅閳藉骞樼紙鐘卞濡炪倖娲濆▍鏇炨缚韫囨稑宸濇い鎾楀啯顔�20婵°倗濮烽崑鐘诲箵椤忓棙顫曟繝闈涱儏缁犳垿鏌ゆ慨鎰偓妤€鈻旈姀鐘嗙懓饪伴崘鈺婃%缂備礁顦顓㈠焵椤掆偓濠€閬嶅磻閻旂厧鏋侀柕鍫濐槹閸庡秹鏌涢弴銊ュ闁伙箑缍婇幃妤冩喆閸曨収鏆¢梺鍝勬閸嬫捇姊洪崫鍕垫Ч闁告梹鐗犻幃锟犳晬閸曨剙鐝伴梺闈涚箚閸撴繈鎮″▎鎰濠㈣泛顑嗙粈鈧悗娈垮櫍閺€鍗烆嚗閸曨偒鍚嬮柛鏇ㄥ幘濡叉垿姊洪崫鍕偓浠嬶綖婢跺本鍏滈柛顐f礃閺咁剟鎮橀悙闈涗壕缂佺姵甯″濠氬炊閿濆懍澹曢梺鑽ゅ枑濞叉垿鎳楃捄琛℃灁闁硅揪闄勯崕鎴︽倵閿濆骸骞樼紒鐘崇墵閺屸剝寰勫☉娆忣伓