删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

大数据部在知识指导的科研项目分类领域取得进展

本站小编 Free考研考试/2022-01-02

为科研项目寻找到合理的领域方向,从而协助科学家与科研管理者进行研究方向管理是面临的典型问题。针对该问题,大数据部博士生肖濛的研究成果在国际电子电气工程师学会(IEEE)旗下会议International Conference on Data Mining 2021上发表,该会议长文接收率为9.9%。研究成果相关论文第一作者为大数据部博士生肖濛,导师为周园春研究员。
  随着科研项目申请迅速增长,学科划分不断细化,申请者及科研管理人员如何在具有层次结构的学科体系中选择项目申请所属的细分学科领域,是需要解决的重要问题。申请书数据是由标题、摘要、关键词、额外属性、正文等不同类别数据组成的复杂结构文本。并且,在申请书的分类过程中,专家知识可以在较为容易判断的大类学科中提供对模型的指导,并利用模型生成最为合适粒度的层级标签。
  该研究成果提出了一个Encoder-Decoder架构的层次多标签分类算法(Hierarchical Multi-label Classification)。编码器部分,通过利用多层次的Transformer组件实现对申请书中文本文档内的字词、文本文档间的互动关系进行建模,从而完成多类别文本的语义抽取。解码器部分,利用自注意力机制抽取专家知识以及已生成标签的特征,并结合编码器所抽取的语义信息,依照学科体系结构逐层生成标签序列。这一研究成果为科研项目分类场景提供了结合人工智能的解决方案,有着丰富的应用场景。(撰稿:肖濛)
  相关成果:Meng Xiao, Ziyue Qiao, Yanjie Fu, Yi Du*, Pengyang Wang, and Yuanchun Zhou. "Expert Knowledge-Guided Length-Variant Hierarchical Label Generation for Proposal Classification." 2021 IEEE International Conference on Data Mining (ICDM). IEEE, 2021.

图1.专家知识指导的层次多标签生成任务

图2. 专家知识指导的科研项目申请书变长层次多标签生成模型图


附件下载
中国科学院基本建设项目档案建档规范 科研课题档案建档规范 -->

相关话题/学科 知识 数据 申请书 档案

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 大数据部在大数据与食源性疾病监测交叉研究领域取得系列进展
    食源性疾病是全球重要的公共卫生和食品安全问题,近年来,食源性疾病呈现出跨区域传播、变化快、难预测的特点。依托国家重点研发计划课题“基于多源数据的食源性疾病实时预警技术体系研究”,大数据部将大数据与机器学习技术与食源性疾病预测的实际需求进行深度融合,在该交叉领域取得多项研究成果,在食品科技类期刊Foo ...
    本站小编 Free考研考试 2022-01-02
  • 中国科学院“十三五”信息化专项“科学大数据工程”通过技术验收和总验收
    6月28日,中国科学院办公厅组织专家对中国科学院“十三五”信息化专项“科学大数据工程”进行了技术验收和总验收。中国科学院办公厅网信处副处长(主持工作)褚大伟、高级工程师郑晓欢、项目承担单位计算机网络信息中心副主任许海燕等领导、项目验收专家组专家、“十三五”信息化发展规划实施效果第三方评估组专家出席会 ...
    本站小编 Free考研考试 2022-01-02
  • ScienceDB成为爱思唯尔和细胞出版社推荐数据存储库
    近日,科学数据银行(Science Data Bank,简称ScienceDB)成为爱思唯尔(Elsevier)推荐数据存储库。今后全球科研人员在爱思唯尔旗下期刊投稿,可以选择ScienceDB提交并出版科研数据。  此外,5月28日,ScienceDB被爱思唯尔旗下顶尖的生命科学研究出版社细胞出版 ...
    本站小编 Free考研考试 2022-01-02
  • 中科院“十三五”信息化专项“中国科学院科学数据中心体系建设”项目通过验收
    6月28日,中国科学院“十三五”信息化专项“中国科学院科学数据中心体系建设”项目技术专项验收暨总验收会在计算机网络信息中心召开。验收专家组由来自中国科学院地理科学与资源研究所、中国科学院大学、中国农业科学院等单位的12位专家组成,孙九林院士为专家组组长。院办公厅网信处、项目组成员和项目办公室成员等出 ...
    本站小编 Free考研考试 2022-01-02
  • 大数据部在遥感数据管理和分析方向取得多项学术成果
    依托中国科学院战略性先导科技专项“格网数据引擎”和中国科学院基础前沿科学研究计划“从0到1”原始创新项目等科研项目,在建设中国科学院科学数据中心体系、国家基础学科公共科学数据中心、地理空间数据云等平台的同时,大数据部持续攻坚遥感数据管理和分析领域,在主流遥感杂志《Remote Sensing》、人工 ...
    本站小编 Free考研考试 2022-01-02
  • 五个新建科学数据库入选国家基础学科公共科学数据中心
    6月18日,国家基础学科公共科学数据中心(以下简称“国家基础数据中心”)2021年度新建科学数据库课题专家评审会顺利召开,来自中国医学科学院医学信息研究所、中国科学院植物研究所、中国科学院生物物理研究所、中国科学院地理科学与资源研究所、中国科学院计算机网络信息中心等单位的专家和相关人员参会。国家基础 ...
    本站小编 Free考研考试 2022-01-02
  • 研究人员利用LAMOST数据发现富含ɑ元素“年轻”恒星的形成机制
    近期,北京大学博士研究生张萌、张华伟研究员、德国马普天文研究所向茂盛博士等使用红巨星样本的LAMOST光谱数据筛选出富含ɑ元素的“年轻”恒星,并对这些恒星的形成机制进行了深入分析和研究,结果表明这些富ɑ元素的“年轻”恒星可能起源于双星演化,这使得人们对此类特殊恒星的形成有了更进一步的认识。该成果发表 ...
    本站小编 Free考研考试 2022-01-02
  • 科研人员利用LAMOST数据发布目前最大时域多星光谱星表
    近日,国家天文台博士研究生李春乾、施建荣研究员、星云计划研究员闫宏亮等人利用LAMOST中分辨率光谱数据,发现了3133颗光谱双星以及132颗光谱三星,并精确测量了它们的视向速度,其中95%为最新发现的多星系统。这是迄今最大的具有时域光谱信息的多星星表,为开展相关研究提供了具有科学传承价值的资源。该 ...
    本站小编 Free考研考试 2022-01-02
  • 研究人员利用LAMOST海量光谱数据证认Gaia数据中6000余颗白矮星
    近期,国家天文台孔啸博士、罗阿理研究员基于LAMOST光谱数据在Gaia数据的白矮星侯选体样本中证认出6190颗白矮星,其中1920颗是首次发现的,并包含了64颗激变变星。并对证认出的白矮星样本进行了细致分类和大气参数测量。该工作体现了LAMOST大样本光谱数据集在证认测光巡天中大量特殊天体的独特优 ...
    本站小编 Free考研考试 2022-01-02
  • LAMOST DR7数据集向全世界公开发布
    按照国际天文界惯例及《LAMOST光谱巡天数据政策》,2021年9月底,包含LAMOST先导巡天及正式巡天前七年的光谱数据——DR7数据集(v2.0版本)对全世界公开发布。  LAMOST DR7光谱数据获得于2011年10月至2019年6月共八年的巡天观测。2018年10月5日,LAMOST二期中 ...
    本站小编 Free考研考试 2022-01-02