摘要针对构建朝鲜语语料库的人工标注工作过于费时费力,少数民族语言难以与各家资源融合的这一问题,该文从表征学习的角度,意图构建有效的朝鲜语句子结构表示,用来提升后续自然语言处理任务的效果。我们将深度强化学习与自注意力机制相结合,提出了一种分层结构的自注意力模型(Hierarchically Structured Korean,HS-K)。模型利用强化学习中的Actor-Critic思想,将文本分类效果作为强化学习的标签反馈信息,把文本的结构划分任务转化为序列决策任务。实验结果表明,模型可以识别出接近人工标注的朝鲜语重要句子结构,对朝鲜语信息化与智能化有着良好的辅助作用。
PDF全文下载地址:
http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3191
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
基于强化学习与自注意力机制的朝鲜语重要句子结构识别
本站小编 Free考研考试/2022-01-02
相关话题/朝鲜语 结构 信息 工作 实验
NOBEL: 一种基于拓扑信息与监督学习的蛋白质复合物识别方法
摘要蛋白质复合物对于生物学家有效了解细胞组织和功能具有重要意义,如何通过计算方法从蛋白质-蛋白质相互作用(PPI)网络中识别复合物是当前研究热点之一。然而,由于PPI网络中存在大量假阴性和假阳性噪声数据且现有已知蛋白质复合物并不完整,使得如何克服PPI网络的噪声问题,以及更好地利用已知蛋白质复合物, ...中科院软件研究所 本站小编 Free考研考试 2022-01-02面向对话的融入交互信息的实体关系抽取
摘要实体关系抽取旨在从文本中抽取出实体之间的语义关系,是自然语言处理的一项基本任务。在新闻报道、维基百科等规范文本上,该任务的研究相对丰富且已取得了一定的效果,但面向对话文本的相关研究还处于起始阶段。相较于规范文本,对话是一个交互的过程,大量信息隐藏在交互中,这使得面向对话文本的实体关系抽取更具挑战 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于时空注意力的社交网络信息级联预测模型
摘要针对目前信息级联预测模型的构建多基于级联的时序信息或者空间拓扑结构、极少考虑两者的结合问题,该文提出一种面向社交网络的基于深度学习方法的信息级联预测(InformationCascadePrediction,ICP)模型。首先,使用拉普拉斯矩阵对级联节点采样,生成空间序列;然后,通过结合了图卷积 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于文章和近答案句信息的问题生成模型
摘要自动问题生成任务旨在给文章中的一段文本生成相应的自然语言的问句,该研究在问答系统和语音助手的对话系统中有重要作用,可以帮助它们启动对话和继续对话。目前的神经网络问题生成模型主要是将包含答案的句子或者整篇文章作为模型的输入,而这些方法存在语义表示不能很好地结合句子和文章信息的问题。因此该文提出多输 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02融合词义信息的文本蕴涵识别方法
摘要文本蕴涵识别是对两个文本之间语义关系的有向推理,而词汇的词义对理解文本的语义以及推理文本之间的语义蕴涵关系有着重要作用。因此,为了有效利用词汇的词义信息推断文本之间的语义蕴涵关系,该文提出一种融合词义信息的文本蕴涵识别方法。该方法首次提出将原始的词汇转化为对应的目标词义,然后利用词汇的词义信息改 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于网络结构的增强社会群体凝聚力策略研究
摘要目前社会群体研究主要集中在将群体划分为多个社区。然而,在一个群体中,通常希望所有的成员团结一致,形成一个具有凝聚力的群体,这对社会群体的合作以及社会习俗形成等相关研究具有广泛意义。因此理解社会凝聚力与社会群体的动态行为之间的关系显得十分重要。该文在合作博弈的基础上,建立了社会群体动态行为模型。基 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02聚合邻域信息的联合知识表示模型
摘要知识表示学习在关系抽取、自动问答等自然语言处理任务中获得了广泛关注,该技术旨在将知识库中的实体与关系表示为稠密低维实值向量。然而,已有的模型在建模知识库中的三元组时,或是忽略三元组的邻域信息,导致无法处理关联知识较少的罕见实体,或是在引入邻域信息时不能自适应地为每个实体抽取最相关的邻节点属性,导 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02融合粗细粒度信息的长答案选择神经网络模型
摘要答案选择是问答系统中的关键技术之一,而长答案选择在社区问答系统、开放域问答系统等非实体问答系统中有着重要地位。该文提出了一个结合粗粒度(句子级别)和细粒度(单词或n元单词级)信息的模型,缓解了传统句子建模方式应用于长答案选择时不能把握住句子的全部重要信息的不足和使用比较-聚合框架处理该类问题时不 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02融合序列和图结构的机器阅读理解
摘要机器阅读理解是自然语言处理中的一项重要而富有挑战性的任务。近年来,以BERT为代表的大规模预训练语言模型在此领域取得了显著的成功。但是,受限于序列模型的结构和规模,基于BERT的阅读理解模型在长距离和全局语义构建的能力有着显著缺陷,影响了其在阅读理解任务上的表现。针对这一问题,该文提出一种融合了 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于信息增强BERT的关系分类
摘要关系分类是自然语言处理领域中重要的语义处理任务,随着机器学习技术的发展,预训练模型BERT在多项自然语言处理任务中取得了大量研究成果,但在关系分类领域尚有待探索。该文针对关系分类的问题特点,提出一种基于实体与实体上下文信息增强BERT的关系分类方法(EC_BERT),该方法利用BERT获取句子特 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02