摘要音节是缅甸语的最小构词单位。当前主流的基于统计的分词方法效果严重依赖于预先标注的训练样本集规模及人工方式选取特征的质量,然而,缅甸语属于稀缺资源语言,分词语料标注及特征选取面临较大困难。该文提出一种基于卷积神经网络的缅甸语分词方法,首先将缅甸语音节结构特征应用于缅甸语音节词向量特征分布式表示,然后基于卷积神经网络将音节及其上下文的特征进行融合,得到有效的特征表示,并通过深层网络的逐层特征优化自动学习到缅甸语分词的有效特征向量,最后利用softmax分类器来对构成缅甸语词汇的音节序列标记进行预测。实验结果表明,该方法取得了较好的效果。
PDF全文下载地址:
http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2583
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
基于卷积神经网络的缅甸语分词方法
本站小编 Free考研考试/2022-01-02
相关话题/语言 网络 质量 实验 结构
移动社交网络幂律分布特征及亲属关系判别
摘要社交网络特征和用户关系是社交网络分析研究的重要内容。该文对移动社交网络中存在的幂律分布及用户亲属关系判别问题进行研究。在幂律分布的研究中,该文在度、连通子图规模及用户联系人数量的分布中找出存在的三个幂律分布,同时分析其中规律和结论,并与其他社交网络进行对比。在该文亲属关系判别研究中,通过提取用户 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02交互式问答的关系结构体系及标注
摘要交互式问答是一种对话式的、连续的、前后关联的信息交互形式,交互式问答的关系结构直接体现了交互式场景在不同语言层面上的上下文关联。该文归纳分析了交互式问答中的对话行为和语句关系,在此基础上提出了对应的关系结构体系;为了验证类别体系的合理性,对真实环境中的交互式问答语料进行了对话行为标注和上下文语句 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02中亚语言自然语言处理综述
摘要该文对中亚地区属于同一个语族的土耳其语、哈萨克语等诸语言的自然语言处理现状进行了综述。首先分别回顾土耳其语、哈萨克语和其他中亚语言在词法分析、句法分析、命名实体识别、机器翻译方面的研究进展,随后讨论了与具体语言无关的黏着语词法分析方面的研究情况,最后指出国内外中亚诸语言处理自然语言领域中所面临的 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02短语结构树库向句式结构树库的自动转换研究
摘要该文从短语结构和句式结构的区别与联系入手,设计了一种将短语结构自动转换为句式结构的算法。并以清华短语结构树库(TCT)为测试语料,实现了将大规模短语结构语料向句式结构语料的转换。最后,搭建了一套可扩展的可视化系统,用于不同句法结构语料的可视化查看。这一研究不仅实现了两种结构之间的初步转换,而且极 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于循环神经网络的藏语语音识别声学模型
摘要探索将循环神经网络和连接时序分类算法应用于藏语语音识别声学建模,实现端到端的模型训练。同时根据声学模型输入与输出的关系,通过在隐含层输出序列上引入时域卷积操作来对网络隐含层时域展开步数进行约简,从而有效提升模型的训练与解码效率。实验结果显示,与传统基于隐马尔可夫模型的声学建模方法相比,循环神经网 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于深度信念网络的维吾尔语事件伴随关系识别
摘要维吾尔语事件伴随关系是维吾尔语语言中常见且重要的关系之一。结合对维吾尔语语言特点的研究,该文提出一种基于深度信念网络的维吾尔语事件伴随关系识别方法,根据维吾尔语语言特性和事件伴随关系的特点,抽取12项基于事件结构信息的特征;同时充分利用事件对所对应的两个触发词之间的语义信息,引入WordEmbe ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于语义的政策血缘网络演化机理研究
摘要该文将行业政策形式化为一个由微观、中观和宏观政策血缘网络构成的复杂网络体系。分别通过改进的基于语义的政策词语相似度计算方法、依存句分析和基于向量空间模型的方法构建了微观、中观及宏观的政策血缘网络。在此基础上,该文对政策血缘网络进行了层次结构演化和碎片清理,构建了政策血缘森林并提出基于政策血缘森林 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02试题知识点预测:一种教研知识强化的卷积神经网络模型
摘要在各类在线学习系统中,为了给学生提供优质的学习服务,一个基础性的任务是试题知识点预测,即预测一道试题所考察的知识概念、能力等。在这个任务中,已有方法通常基于人工专家标注或者传统机器学习方法。然而,这些传统方法要么耗时耗力,要么仅关注试题资源的浅层特征,忽略了试题文本和知识点之间的深层语义关联。因 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于概念层次网络的知识表示与本体建模
摘要知识表示是自然语言理解的重要基础。知识表示不统一、语义信息无法系统化利用是目前存在的亟待解决的问题。要解决这个问题,就要解决语义知识表示的问题。该文基于概念层次网络,描述了词语、句子和篇章层面的语义知识表示方法。基于文中描述的词汇层面的表示方法,构建了一个多语言本体知识库。该知识库的知识表示方法 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02分层递阶的网络结构洞占据者挖掘及分析
摘要结构洞是在社会网络信息传播中占据重要位置的一类关键节点。据研究,5%的结构洞控制着50%的信息传播。****们研究了单一粒度网络下结构洞的挖掘方法及分析,然而很多网络存在分层递阶的多粒度结构特性,对分层递阶网络的结构洞挖掘和分析具有现实意义。因此,该文提出了一种分层递阶网络的多粒度结构洞挖掘方法 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02