删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

面向文本聚类的实体—动作关联模型研究

本站小编 Free考研考试/2022-01-02

摘要该文提出面向文本聚类分析的实体—动作关联模型EARM,探讨汉语语义实体及其行为的描述方法。汉语属于非形态语言,语句没有时态及语态的变化,词类跟句法成分之间也不是简单的一一对应关系。该文提出一种句法成分识别机制,根据词汇类别特征及位置特征识别实体及动作。在句法成分识别的基础上展开句法分析,通过匹配句型特征建立实体—动作关联模型EARM,描述实体的行为及状态。对于嵌套句型等较为复杂的句型结构,需要在句法分析过程中实施动作层次分解,将复杂语句分解为简单的基本句型,以便于挖掘实体—动作关联。考虑到汉语语法比较灵活,语句成分缺省和倒装现象相对普遍,该文提出了倒装句的识别机制,通过匹配接近的句型进行实体移位,调整语序。论述了基于统计模型的EARM权重量化策略,借助语法树的最大公共子图量化文本的相似度并实施聚类,设计并开展了EARM实体—动作分析实验和EARM聚类实验。实验结果表明EARM的分析是准确有效的,聚类结果是合理的。

PDF全文下载地址:

http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2562
相关话题/汉语 实验 语法 设计 公共

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 现代汉语形容词资源库的构建
    摘要形容词与名词、动词构成汉语实词的主体组成部分,在句法上表现出对“名词”的极度依赖,其核心功能是在概念层面上,在认知注意机制的调适作用下对名词的特征进行“评价”。该文主要叙述汉语形容词知识库构建的相关工作。首先是考察已有的形容词的收词情况,并结合语言演变中新产生的形容词,构建了一个较为全面的形容词 ...
    本站小编 Free考研考试 2022-01-02
  • 汉语的语素概念提取与语义构词分析
    摘要作为基础的表义单位,语素及此上的构词分析,既是汉语作为意合语言进行语义分析的起点,也是认知、理解词义的关键。该文提出了一种探寻汉语语义基元和分析词义的新的视角和方法:基于语素义相似度计算形成“同义语素集”,用来表征“语素概念”,并借鉴生成词库理论形成“语素概念体系”;建立在此基础上的汉语语义构词 ...
    本站小编 Free考研考试 2022-01-02
  • 一种基于聚类与分类结合的汉语隐喻短语识别方法
    摘要隐喻识别是自然语言处理的一个重要研究分支。目前人们越来越清楚地认识到隐喻在思维及语言中所处的重要地位。本研究在前人工作的实验和考察基础上,发现基于分类器来识别隐喻的方法存在数据稀疏的问题,即当训练语料中缺少需要识别的源域词数据时,分类的结果将不会太好。应对数据稀疏问题,该文提出了一种基于聚类与分 ...
    本站小编 Free考研考试 2022-01-02
  • 英语学习者书面语法错误自动检测研究综述
    摘要英语学习者书面语法错误检测和修改系统可为作文自动评分提供参数,评测作文整体质量;也可用于计算机辅助英语教学,为学生提供书面纠错反馈,促进其二语写作能力的发展。该文概述了近十年来自然语言处理技术在英语学习者语法错误自动检测研究中的应用,首先介绍了基于大规模本族语和学习者语料库的三种数据驱动的系统设 ...
    本站小编 Free考研考试 2022-01-02
  • 基于语言学特征向量和词嵌入向量的汉语动词事件类型预测
    摘要该文主要介绍汉语动词事件类型的预测。事件类型是根据内部时间结构对汉语动词进行的重要分类,包括状态、活动、变化(完结和达成)。对汉语动词事件类型进行预测从理论上能够对以往语言学研究提出的特征进行验证,从应用上可以服务于机器翻译等任务。该文基于两种方式构建词向量进行汉语动词事件类型的预测,一种是根据 ...
    本站小编 Free考研考试 2022-01-02
  • 汉语小句的俄语对应单位研究
    摘要该文标注汉俄平行文本中汉语小句的俄语对应单位,并统计分析。首先,根据汉语小句切分对齐切分俄语,得到俄语对应单位;其次,对俄语对应单位进行语法标注;最后,基于标注语料,分析发现俄语对应单位。研究发现:(1)句子组成部分多(74.85%),句子少(25.15%);(2)单一述谓核心多(69.04%) ...
    本站小编 Free考研考试 2022-01-02
  • 汉语“的”字短语认知神经机制的ERP研究
    摘要隐喻是我们日常生活中常见的语言现象,更是我们认知、理解、描述世界的重要方式。该文围绕汉语独有的隐喻形式,考察汉语NP+NP形式的“的”字短语隐喻的脑认知加工机制。通过有意义程度(plausibility)、熟悉度(familiarity)和比喻的程度(figurativeness)三个方面来对语 ...
    本站小编 Free考研考试 2022-01-02
  • 基于知识库的汉语未登录词语义预测
    摘要该文基于知识库的语素构词知识,采用了分阶段的算法自动预测未登录词的语素构词知识,以此实现对未登录词的语义预测。基本思路是通过语素义组合或语素义类组合的匹配,先预测语义层面的知识,再确定相应语素项,最终获得未登录词多层面的语素构词知识。该算法简单、直观、合理,在首素性类、首素义类、首素义、尾素性类 ...
    本站小编 Free考研考试 2022-01-02
  • 篇章视角的汉语零指代语料库构建
    摘要:零指代是汉语中普遍存在的一个现象,在汉英机器翻译、文本摘要以及阅读理解等众多自然语言处理任务中都起着重要作用,目前已成为自然语言处理领域的一个研究热点.提出了篇章视角的汉语零指代表示体系,从服务于篇章分析的角度出发,首先以基本篇章单元为考察对象,判别其是否包含零元素;再根据零元素在基本篇章单元 ...
    本站小编 Free考研考试 2022-01-02
  • 全委托的公共可验证的外包数据库方案
    摘要:为解决可验证外包数据库方案存在的预处理阶段开销较大及不支持公共可验证的问题,提出了一个全委托的公共可验证的外包数据库模型.给出了模型的架构及交互流程,对模型进行了形式化定义,并给出了模型的正确性定义和安全性定义.利用双线性映射及可验证外包模幂运算协议,构建了一个全委托的公共可验证外包数据库方案 ...
    本站小编 Free考研考试 2022-01-02