摘要句子相似度计算是信息处理领域一项基础技术,在基于实例的机器翻译中直接影响译文质量。该文以韩国语句子为研究对象,结合韩国语的句子特点提出了一种句子结构相似度的计算方法。该方法通过先提取句子的骨架结构,然后结合韩国语的句法特点制定标记转换规则,最后用转换后的句子结构与实例库中句子匹配得到与之相似的句子,得出两个句子间的结构相似度,并且通过实验验证了该方法的可行性,提高了相似度计算效果。
PDF全文下载地址:
http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2732
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
韩国语句子结构相似度计算方法研究
本站小编 Free考研考试/2022-01-02
相关话题/结构 计算 质量 信息 基础
基于注意力机制与文本信息的用户关系抽取
摘要随着社交媒体的发展,用户之间的关系网络对于社交媒体的分析有很大的帮助。因此,该文主要研究用户好友关系检测。以往的关于用户好友关系抽取的研究主要基于社交媒体上的结构化信息,比如其他好友关系,用户的不同属性等。但是,很多时候用户本身并没有大量的好友信息存在,同时也不一定有很多确定的属性。因此,我们希 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02融合依存信息Attention机制的药物关系抽取研究
摘要药物关系(Drug-DrugInteraction,DDI)抽取是生物医学关系抽取领域的重要分支,现有方法主要强调实体、位置等信息对关系抽取的影响。相关研究表明,依存信息对于关系抽取具有重要作用,如何合理利用依存信息是关系抽取研究中需要解决的问题。该文提出一种融合依存信息Attention机制的 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于RNN的中文二分结构句法分析
摘要为了构建一个简单易扩展的中文句法分析器,我们依据朱德熙和陆俭明先生的中文二分结构的层次分析句法理论,手工构建了一个3万句的二分结构的中文句法树库,并使用哈夫曼编码方式来简化表示完全二叉树的层次结构。该文将中文句法分析转换为迭代二分的序列标注问题,并根据该任务的特点,提出了在词的间隔上进行标记的序 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于篇章修辞结构的自动文摘连贯性研究
摘要尽管抽取式自动文摘方法是目前自动文摘领域的主流方法,并且取得了长足的进步,但抽取式自动文摘形成的摘要由于缺乏句子之间的合理指代或篇章结构,使得文摘缺乏连贯性而影响可读性。为提高自动摘要的可读性,该文尝试将篇章修辞结构信息应用于中文自动文摘。首先,基于汉语篇章修辞结构抽取摘要,然后使用基于LSTM ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于转移的中文篇章结构解析研究
摘要篇章结构解析作为篇章分析的子任务,对于篇章理解和下游篇章应用至关重要。该文基于中文连接依存树篇章标注语料,利用转移系统和深度学习的方法,给出了一个完整的从平文本到树形结构的篇章结构自动解析框架。该文统计了中文篇章语料的基本特点,提出了针对树形篇章结构的评测方法,并采用不同的方法对篇章解析过程的篇 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于中文AMR语料库的非投影结构研究
摘要非投影结构是指依存树上的词语节点与原句中的词语序列出现错位的现象,对于句法分析器的影响较大,在语言理论上也有较大研究价值。在世界多种语言的依存树或图库上,都发现了含有非投影结构的句子,并对比展开了相关研究。而汉语的非投影结构尚未得到重视,语料库构建过程中也因遵循了投影性原则而缺乏对非投影结构的标 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02面向任务口语对话系统中不含槽信息话语的端到端对话控制
摘要端到端(end-to-end)模型因其能有效避免传统管道式设计存在的错误传递与累积问题,成为了近年来口语对话系统(spokendialoguesystem,SDS)的研究热点。在面向任务SDS的end-to-end对话控制中,处理携带任务领域语义信息(槽信息)的话语可以结合命名实体识别、数据库查 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于BiLSTM-CRF模型的汉语否定信息识别
摘要否定信息识别是将自然语言中的肯定信息与否定信息分离,它对信息检索、文本挖掘、情感分析等都有重要作用。该文主要对汉语否定信息中的触发词识别和覆盖域识别进行研究,采用双向长短期记忆网络结合条件随机场(BiLSTM-CRF)为模型,预训练的词向量为输入特征对触发词进行识别,在此基础上添加已知触发词特征 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02面向语言信息处理的藏语短语及其分类方法研究
摘要短语作为语言分析的一个层次,占有十分重要的位置。有效的短语分析对降低其后句法分析的难度,缩小句法分析器的搜索空间,提高机器翻译的翻译正确率是很有帮助的。而目前面向信息处理的藏语短语的研究刚刚起步,有待于进一步发展。该文在藏语短语与藏语句子的界线研究的基础上,根据藏语信息处理的特点和要求,按照语法 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于文体和词表的突发事件信息抽取研究
摘要非结构化数据的结构化任务是大数据环境下管理信息系统面临的新课题。该文从文体的角度研究自由文本的特性,提出了从Web新闻中抽取突发事件属性的方法,该方法首先分析研究了Web文本和新闻文体的特征,利用GoogleWord2Vec对领域专家构建的词表进行扩展,针对突发事件的不同属性制定了不同的抽取方法 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02