删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于混合策略的藏文虚词识别方法

本站小编 Free考研考试/2022-01-02

摘要藏文虚词在歧义消解、句法、句型和语义处理等方面起着重要的语法作用。该文在分析传统藏文虚词研究成果的基础上,统计了面向自然语言处理的藏文虚词及特征,提出了基于规则和最大熵模型相结合的藏文虚词识别策略。实验表明,该方法识别藏文虚词的准确率、召回率和F1值分别达98.39%、98.75%、98.57%。

PDF全文下载地址:

http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2800
相关话题/语法 实验 统计 藏文 虚词

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 藏文词向量相似度和相关性评测集构建
    摘要词向量评测是词向量研究的基础,包括内部评测(intrinsicevaluation)和外部评测(extrinsicevaluations)。外部评测是将得到的词向量应用到具体某个任务中进行评测,是词向量研究的目标。内部评测是通过建立词之间的语义相似度或相关性能力的评测集,评价词向量模型的性能,是 ...
    本站小编 Free考研考试 2022-01-02
  • 藏文句子语义块识别方法
    摘要语义理解是自然语言理解的一项关键任务,传统上采用以语法为中心的词法和句法分析等技术来解析句义。该文提出了一种以语义块分析藏文句义的新方法,其中藏文语义块识别通过采用Bi-LSTM和ID-CNN两种神经网络构架对该任务进行建模和对比分析。经实验,上述的两种模型在测试数据集上取得了良好的性能表现,F ...
    本站小编 Free考研考试 2022-01-02
  • 注意力的端到端模型生成藏文律诗
    摘要文本自动撰写在自然语言处理中是一个重要的研究领域,可通过人工智能的方法来提升文本的生成结果。目前主流的生成方法是基于深度学习的方法,而该文则提出了一种基于注意力的端到端模型生成藏文律诗法。该方法基本框架是一个双向LSTM的编码—解码模型,在此基础上引入了藏文字嵌入、注意力机制和多任务学习法。实验 ...
    本站小编 Free考研考试 2022-01-02
  • 基于PCFG的藏文疑问句句法分析
    摘要藏文疑问句的句法分析在藏文问答系统、搜索引擎、信息的抽取和检索等领域有着广泛的应用前景。该文通过分析藏文疑问句的构成特点,对藏文疑问句进行了分类,归纳了各类藏文疑问句的结构特征,进而利用PCFG对藏文疑问句进行了句法分析。经测试,在封闭测试集上的准确率、召回率和F1值分别达97.6%、97.3% ...
    本站小编 Free考研考试 2022-01-02
  • 余华与莫言长篇小说的计量统计和分析
    摘要该文以余华和莫言的各5部长篇小说作为语料,选用段落、句子和分句的长度,标点及其n元,词类及其n元,词汇及其n元和颜色词作为特征,使用层次聚类、k-s检验从整体上判断两位作者的作品是否有差异,再使用秩和检验判断两位作者的某一具体特征是否有差异。该文对余华和莫言用词上的特征进行了详尽的分析,发现了莫 ...
    本站小编 Free考研考试 2022-01-02
  • 藏文音节拼写检查的CNN模型
    摘要藏文音节拼写检查是藏语自然语言处理的基本任务,在藏文文字处理、文字识别、文本生成等领域具有广泛的应用。该文首先针对藏文音节的结构提出了音节向量化的方法,即音节矩阵。然后构建了适合于藏文音节拼写检查的CNN模型,使用1364880个藏文音节进行训练。最后对68244个藏文音节进行测试。实验结果显示 ...
    本站小编 Free考研考试 2022-01-02
  • 基于联合模型的藏文实体关系抽取方法研究
    摘要从无结构文本中抽取实体与实体之间的关系是自然语言处理领域的重要研究内容,同时也为构建知识图谱、问答系统等应用提供重要支撑。基于联合模型的实体关系抽取任务将实体识别和关系抽取同时进行,克服了传统实体关系抽取任务中先识别句子中的实体,然后再进行实体关系判断这两次任务中的错误累加。该文针对藏文语料匮乏 ...
    本站小编 Free考研考试 2022-01-02
  • 基于统计和神经网络的蒙汉机器翻译研究
    摘要该文对基于传统统计模型的蒙汉机器翻译模型和基于神经网络机器翻译模型进行了研究。其中,神经网络翻译模型分别为基于CNN、RNN的翻译模型,并通过将所有翻译模型结果进行句子级融合得到一个融合模型。面对蒙汉翻译面临资源稀少、蒙古文形态复杂等困难,该文提出多种翻译技术,对各个模型进行改进,并对蒙古文进行 ...
    本站小编 Free考研考试 2022-01-02
  • 维吾尔语依存树库构建及统计分析
    摘要本着构建维吾尔语依存树库的目的,该文根据黏着性语言的结构特点及其在依存属性中对依存角色的影响,提出构建维吾尔语依存树库时需要考虑的几点要素。其包含依存粒度的确定、维吾尔语依存关系、标注原则、依存树结构以及标注工具的设计与实现。然后根据《维吾尔语依存树库标注手册》人工标注了3400多条句子并从三个 ...
    本站小编 Free考研考试 2022-01-02
  • 藏文字同现网络的小世界效应和无标度特性
    摘要复杂网络具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质,而语言文字作为人类智慧和文明的结晶,是经过漫长演化形成的复杂网络。该文对藏语诗歌、散文、政治、佛教、教材和口语等六类具有代表性的体裁语料,每类各取15篇共90篇文章构建了97个藏文字同现网络,分析了藏文字同现网络的最短路径长度、 ...
    本站小编 Free考研考试 2022-01-02