删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

软件所四项成果被自然语言处理顶级会议ACL 2019接收

本站小编 Free考研/2020-05-28

ACL(Annual Meeting of the Association for Computational Linguistics)是自然语言处理领域的顶级国际会议,被中国计算机学会推荐国际学术会议列表认定为A类会议。ACL2019将于2019年7月28日至8月2日在意大利佛罗伦萨举行。
  在国家自然科学基金重点项目“汉语认知加工机制与计算模型”和国家重点研发计划 “基于大数据的面向开放域的智能问答技术”项目支持下,中国科学院软件研究所中文信息处理实验室3篇长文《Sequence-to-Nuggets: Nested Entity Mention Detection via Anchor-Region Networks》、《Distilling Discrimination and Generalization Knowledge for Event Detection via ?-Representation Learning》、《Progressively Self-Supervised Attention Learning for Aspect-Level Sentiment Analysis》和1篇短文《Cost-sensitive Regularization for Label Confusion-aware Event Detection》被ACL2019接收。
  (1) 《Sequence-to-Nuggets: Nested Entity Mention Detection via Anchor-Region Networks》
  论文作者:林鸿宇(中科院软件所),陆垚杰(中科院软件所),韩先培(中科院软件所),孙乐(中科院软件所)
  命名实体识别是自然语言处理中一个根本性的任务。然而,现有的命名实体识别模型通常假定一个字符仅属于一个实体提及,这就使得这些模型无法被用于带有嵌套命名实体提及的情况。但是,嵌套命名实体提及在自然语言中分布非常广泛,这就使得忽视这类嵌套实体会对后续自然语言处理任务产生巨大影响。
  针对这一问题,该团队提出了一种全新的神经网络结构:锚点-区域网络。该网络充分地利用了自然语言词组以头词为中心的结构特性,提出了通过检测不同头词来检测不同嵌套实体的方案。同时,为了能够在没有实体头词标注数据的情况下训练上述网络结构,团队还提出了一种新的包损失函数。该损失函数能够自动挖掘无头词标注数据中的头词信息,从而对锚点-区域网络进行端到端训练。
  实验结果表明该团队提出的模型在ACE2005、GENIA以及KBP2017等多个不同领域的命名实体识别标准数据集上都取得了当前最好的性能。
  (2) Distilling Discrimination and Generalization Knowledge for Event Detection via Representation Learning
  论文作者:陆垚杰(中科院软件所),林鸿宇(中科院软件所),韩先培(中科院软件所),孙乐(中科院软件所)
  事件检测是信息抽取的重要任务,近年来,在知识图谱构建、信息检索和文本理解中扮演着重要角色。事件检测系统不仅依赖判别性知识来区分存在歧义的事件触发词,还依赖泛化性知识来检测未见的、稀疏的事件触发词。现有的神经网络方法通常聚焦于获取一个以触发词为中文的特征表示用于事件检测,这样的方法可以有效的蒸馏出判别性的知识,但是难以学习到泛化性的知识,致使模型难以检测未见的、稀疏的事件触发词。
  为解决这一问题,本文提出了一种表示学习框架,通过有效分离、增量学习,最后自适应合成不同的事件特征表示,能够有效地蒸馏判别性和泛化性知识。
  实验结果证明了本文的方法在未见的、稀疏的事件触发词上超过了之前的方法,同时在ACE2005和KBP2017两个数据集取得了当前最佳性能。
  (3) Progressively Self-Supervised Attention Learning for Aspect-Level Sentiment Analysis
  论文作者:唐家龙(中科院软件所),陆紫耀(厦门大学),苏劲松(厦门大学),葛毓斌(UIUC),宋霖峰(罗切斯特大学),孙乐(中科院软件所), 罗杰波(罗切斯特大学)
  在方面层次的情感分类任务中,使用注意力机制来捕获上下文文本中与给定方面最为相关的信息是近年来研究者们的普遍做法。然而,注意力机制容易过多的关注数据中少部分有强烈情感极性的高频词汇,而忽略那些频率较低的词。
  本文提出了一种渐进的自监督注意力的学习算法,能够自动的、渐进的挖掘文本中重要的监督信息,从而在模型训练过程中约束注意力机制的学习。该团队迭代的在训练实例上擦除对情感极性“积极”/“消极”的词汇。这些词在下一轮学习过程中将会被一个特殊标记替代,并记录下来。最终,团队针对不同情况,设计出不同的监督信号,在最终模型训练目标函数中作为正则化项约束注意力机制的学习。
  在SemEval 14 REST,LAPTOP以及口语化数据集TWITTER上的实验结果表明,团队提出的渐进注意力机制能在多个前沿模型的基础之上取得显著性提升。
  (4) Cost-sensitive Regularization for Label Confusion-aware Event Detection
  论文作者:林鸿宇(中科院软件所),陆垚杰(中科院软件所),韩先培(中科院软件所),孙乐(中科院软件所)
  事件检测是信息抽取中的一个重要任务。近年来,神经网络在事件检测上取得了重大的进展。然而,我们的研究发现,神经网络模型在事件检测上的错误通常出现在某些特定的类别对之间。针对上述问题,我们提出了一种代价敏感的正则化约束优化目标。该约束目标使得神经网络在训练的过程中能够更加关注某些特定的易混淆类别对。除此之外,我们还提出了两种实例级别以及语料库级别的用于估计类别间混淆度的方法。在ACE2005以及KBP2017数据集上实验结果表明,我们提出的代价敏感的正则化约束能够显著提升多种不同架构的神经网络事件检测模型的性能。
  论文全文和源代码将在中文信息处理实验室网(www.icip.org.cn)开放,欢迎大家关注!
相关话题/软件 数据

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 中科院软件所智能操作系统FactOS及配套工具公开发布
    近年来我国AI产业增长快速,据统计2019年中国人工智能核心产业规模预计达到960亿元,增长率达到40%。人工智能与多行业也在快速融合,从智能无人驾驶、智能投顾与算法交易、智能医疗,到智能制造、城市大脑等,“AI+”相关产业成为热门赛道。政府层面也对人工智能产业大力扶持,通过印发《新一代人工智能发展 ...
    本站小编 Free考研 2020-05-28
  • 软件所召开学术委员会和青年骨干代表“十四五”规划研讨会
    为更好地做好研究所“十四五”发展规划工作,研究所于近期分别组织召开了所学术委员会委员和青年骨干代表研讨会。  4月16日软件所召开所学术委员会部分委员研讨会,征集对研究所“十四五”规划工作的意见和建议。所领导班子成员、林惠民院士等所学术委员会委员共20余人参加了会议。会上,各位委员围绕研究所“十四五 ...
    本站小编 Free考研 2020-05-28
  • 软件所首届“开源软件供应链点亮计划-暑期2020”启动
    5月15日,首届“开源软件供应链点亮计划-暑期2020”正式启动。“开源软件供应链点亮计划-暑期2020”(以下简称“暑期2020”)是由中国科学院软件研究所与 openEuler 社区共同举办、中科院软件研究所南京软件技术研究院承办的一项面向高校学生的暑期活动,旨在鼓励高校在校学生积极参与开源软件 ...
    本站小编 Free考研 2020-05-28
  • 软件所应邀参加首届openEuler峰会2020
    4 月 17 日,openEuler 社区在线召开首届 openEuler 峰会2020 (openEuler Virtual Summit 2020),旨在与计算产业界分享 openEuler 的最新技术进展、研讨新版本技术规划。  openEuler社区秉承“共建、共享、共治”理念,与社区参与者 ...
    本站小编 Free考研 2020-05-28
  • 软件所助力贵州区块链技术高质量发展
    区块链技术作为数字经济发展的重要基础,受到高度重视。2019年10月24日,中共中央政治局就区块链技术发展现状和趋势进行第十八次集体学习。习近平总书记在主持学习时强调,我们要把区块链作为核心技术自主创新的重要突破口,明确主攻方向,加大投入力度,着力攻克一批关键核心技术,加快推动区块链技术和产业创新发 ...
    本站小编 Free考研 2020-05-28
  • 中科院软件所应邀参与华为开发者大会2020(Cloud)
    3月27日,华为开发者大会2020(Cloud)召开,这是华为公司面向ICT(信息与通信技术)领域全球开发者的年度顶级旗舰活动。大会旨在搭建全球性的交流和实践平台,开放华为30年积累的ICT技术与能力,以“鲲鹏+昇腾”硬核双引擎,为开发者提供澎湃动力,改变世界,变不可能为可能。  会上,华为介绍了“ ...
    本站小编 Free考研 2020-05-28
  • 软件所举行2019年度工作总结考核会
    3月31日,软件所举行了2019年度工作总结考核会。由于仍处于新冠肺炎疫情防控期间,此次工作总结考核会议依托CAS科技云会以视频方式进行。所领导、各中心/实验室负责人、公共创新平台负责人、管理支撑部门负责人、分部负责人以及职工代表共80余人参加了总结考核会。  此次交流和考核是软件所2019年度工作 ...
    本站小编 Free考研 2020-05-28
  • 软件所组织观看2019年中国科学院年度人物和年度团队发布会
    为大力弘扬新时代科学家精神,树立良好作风学风,让爱国奋斗在研究所蔚为风尚,1月9日下午,软件所组织观看了“弘扬科学家精神做新时代追梦人”——2019年中国科学院年度人物和年度团队发布会。全体所班子成员、党员、职工和学生共300余人,在大会现场或通过网络直播观看了发布会。  会上,大家认真听取了年度人 ...
    本站小编 Free考研 2020-05-28
  • 软件所举行管理支撑部门工作人员2019年度绩效考核会
    1月15日,软件所召开了管理支撑部门工作人员2019年度绩效考核会。党委书记、副所长操云甫,党委副书记、纪委书记李衡,管理支撑部门负责人以及全体工作人员50余人参加了考核会。  来自各部门共46名工作人员就个人2019年度的工作内容与2020年度的工作计划进行了述职报告。分管所领导、部门负责人从岗位 ...
    本站小编 Free考研 2020-05-28
  • 软件所召开2019年度工作总结暨考核测评会议
    1月9日,软件所召开了2019年度工作总结暨考核测评会议。北京分院纪检组组长、分党组成员,京区事业单位党委副书记、纪委书记倪宏,北京分院干部人事处魏莱到会指导。软件所领导班子成员、党委委员、纪委委员、学术委员会委员、职代会常设主席团成员、中层领导人员、副高以上专业技术骨干人员、六级以上职员及各类职工 ...
    本站小编 Free考研 2020-05-28