删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

藏文音节拼写检查的CNN模型

本站小编 Free考研考试/2022-01-02

摘要藏文音节拼写检查是藏语自然语言处理的基本任务,在藏文文字处理、文字识别、文本生成等领域具有广泛的应用。该文首先针对藏文音节的结构提出了音节向量化的方法,即音节矩阵。然后构建了适合于藏文音节拼写检查的CNN模型,使用1 364 880个藏文音节进行训练。最后对68 244个藏文音节进行测试。实验结果显示,藏文音节拼写检查CNN模型的结果优于规则、RNN和LSTM等模型,不仅对符合藏文文法的音节能正确识别外,而且对梵音藏文音节也能有效识别,正确率、召回率以及F值分别为99.52%、99.30%和99.41%。

PDF全文下载地址:

http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2704
相关话题/藏文 结构 文字 文法 实验

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于转移的中文篇章结构解析研究
    摘要篇章结构解析作为篇章分析的子任务,对于篇章理解和下游篇章应用至关重要。该文基于中文连接依存树篇章标注语料,利用转移系统和深度学习的方法,给出了一个完整的从平文本到树形结构的篇章结构自动解析框架。该文统计了中文篇章语料的基本特点,提出了针对树形篇章结构的评测方法,并采用不同的方法对篇章解析过程的篇 ...
    本站小编 Free考研考试 2022-01-02
  • 基于中文AMR语料库的非投影结构研究
    摘要非投影结构是指依存树上的词语节点与原句中的词语序列出现错位的现象,对于句法分析器的影响较大,在语言理论上也有较大研究价值。在世界多种语言的依存树或图库上,都发现了含有非投影结构的句子,并对比展开了相关研究。而汉语的非投影结构尚未得到重视,语料库构建过程中也因遵循了投影性原则而缺乏对非投影结构的标 ...
    本站小编 Free考研考试 2022-01-02
  • 基于联合模型的藏文实体关系抽取方法研究
    摘要从无结构文本中抽取实体与实体之间的关系是自然语言处理领域的重要研究内容,同时也为构建知识图谱、问答系统等应用提供重要支撑。基于联合模型的实体关系抽取任务将实体识别和关系抽取同时进行,克服了传统实体关系抽取任务中先识别句子中的实体,然后再进行实体关系判断这两次任务中的错误累加。该文针对藏文语料匮乏 ...
    本站小编 Free考研考试 2022-01-02
  • 藏文字同现网络的小世界效应和无标度特性
    摘要复杂网络具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质,而语言文字作为人类智慧和文明的结晶,是经过漫长演化形成的复杂网络。该文对藏语诗歌、散文、政治、佛教、教材和口语等六类具有代表性的体裁语料,每类各取15篇共90篇文章构建了97个藏文字同现网络,分析了藏文字同现网络的最短路径长度、 ...
    本站小编 Free考研考试 2022-01-02
  • 基于分形几何的甲骨文字形识别方法
    摘要甲骨文是流行于我国古代商朝的成熟文字系统,本质上是一种平面图形,笔画和结构不是非常稳定。很多字形具有图画性质,难以区分明显的结构,难写难记。已有的编码输入方法受众面小,效率很低,使用受限。该文分析了甲骨文字形的分形性质,在此基础上,通过字形的重心建立二维平面直角坐标系,将甲骨文字形的平面图形划分 ...
    本站小编 Free考研考试 2022-01-02
  • 一种基于向量模型的藏文字拼写检查方法
    摘要自动拼写检查是自然语言处理领域一项极具挑战性的研究课题,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。藏文字是一种表音拼音文字,由1~7个基本构件横向和纵向拼接而成。藏文文本中非真字出现的频率很高,是藏文字拼写检查的基础和重点。该文通过分析藏文文法中的构字规则,利用藏文字向 ...
    本站小编 Free考研考试 2022-01-02
  • 基于卷积降噪自编码器的藏文历史文献版面分析方法
    摘要近年来,随着人们对历史和传统文化的保护和传承越来越重视,研究人员对历史文献数字化的兴趣也越来越高涨。版面分析是历史文献数字化的重要基础步骤,该文提出了一种基于卷积降噪自编码器的藏文历史文献版面分析方法。首先,将藏文历史文献图像进行超像素聚类获得超像素块;然后,利用卷积降噪自编码器提取超像素块的特 ...
    本站小编 Free考研考试 2022-01-02
  • 结合短语结构句法的语义角色标注
    摘要该文提出一种结合短语结构句法的语义角色标注方法。结合短语结构句法对句子进行剪枝、子句抽取处理,然后,对处理过的句子进行语义角色分析并还原。最后,结合短语树对还原后的论元边界进行修正。其中,剪枝包括并列结构、插入语的剪枝,子句抽取针对不同形式的子句有不同的处理方式。边界修正主要是针对某些类型论元进 ...
    本站小编 Free考研考试 2022-01-02
  • 交互式问答的关系结构体系及标注
    摘要交互式问答是一种对话式的、连续的、前后关联的信息交互形式,交互式问答的关系结构直接体现了交互式场景在不同语言层面上的上下文关联。该文归纳分析了交互式问答中的对话行为和语句关系,在此基础上提出了对应的关系结构体系;为了验证类别体系的合理性,对真实环境中的交互式问答语料进行了对话行为标注和上下文语句 ...
    本站小编 Free考研考试 2022-01-02
  • 短语结构树库向句式结构树库的自动转换研究
    摘要该文从短语结构和句式结构的区别与联系入手,设计了一种将短语结构自动转换为句式结构的算法。并以清华短语结构树库(TCT)为测试语料,实现了将大规模短语结构语料向句式结构语料的转换。最后,搭建了一套可扩展的可视化系统,用于不同句法结构语料的可视化查看。这一研究不仅实现了两种结构之间的初步转换,而且极 ...
    本站小编 Free考研考试 2022-01-02