删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于图卷积半监督学习的论文作者同名消歧方法研究

本站小编 Free考研考试/2022-01-03

盛晓光1,,,
王颖2,
钱力2, 3,
王颖1
1.中国科学院大学人工智能学院 北京 100049
2.中国科学院文献情报中心 北京 100190
3.中国科学院大学图书情报与档案管理系 北京 100190
基金项目:国家自然科学基金(61702038),国家社会科学基金(15CTQ006)

详细信息
作者简介:盛晓光:男,1989年生,博士生,研究方向为教育数据挖掘、人工智能
王颖:女,1982年生,副研究馆员,研究方向为知识组织与知识挖掘
钱力:男,1981年生,研究馆员,研究方向为大数据与机器智能
王颖:女,1969年生,教授,研究方向为数字信号处理、教育数据挖掘
通讯作者:盛晓光 shengxiaoguang@ucas.ac.cn
1) https://api.fanyi.baidu.com/
中图分类号:TP391.1

计量

文章访问数:60
HTML全文浏览量:36
PDF下载量:16
被引次数:0
出版历程

收稿日期:2020-10-23
录用日期:2021-11-04
修回日期:2021-09-23
网络出版日期:2021-11-10
刊出日期:2021-12-21

Author Name Disambiguation Based on Semi-supervised Learning with Graph Convolutional Network

Xiaoguang SHENG1,,,
Ying WANG2,
Li QIAN2, 3,
Ying WANG1
1. School of Artificial Intelligence, University of Chinese Academy of Sciences, Beijing 100049, China
2. National Science Library, Chinese Academy of Sciences, Beijing 100190, China
3. Department of Library, Information and Archives Management, University of Chinese Academy of Sciences, Beijing 100190, China
Funds:The National Natural Science Foundation of China (61702038), The National Social Science Foundation of China (15CTQ006)


摘要
摘要:为解决****与成果的精确匹配问题,该文提出了一种基于图卷积半监督学习的论文作者同名消歧方法。该方法使用SciBERT预训练语言模型计算论文题目、关键字获得论文节点语义表示向量,利用论文的作者和机构信息获得论文的合作网络和机构关联网络邻接矩阵,并从论文合作网络中采集伪标签获得正样本集和负样本集,将这些作为输入利用图卷积神经网络进行半监督学习,获得论文节点嵌入表示进行论文节点向量聚类,实现对论文作者同名消歧。实验结果表明,与其他消歧方法相比,该方法在实验数据集上取得了更好的效果。
关键词:同名消歧/
图卷积神经网络/
BERT语言模型
Abstract:In order to solve the problem of exact matching between scholars and articles, a new method of author name disambiguation is proposed based on semi-supervised learning with graph convolutional network. In this method, the SciBERT pre-training language model is applied to calculating the semantic embedding vector of each paper with their title and keywords. Authors and organizations of papers are used to obtain the adjacency matrixes of the paper’s co-author network and co-organization network. The pseudo labels are collected from the co-author network to obtain the positive and negative samples. The semantic embedding vector, adjacency matrixes and the positive and negative samples are used as input to be processed by Graph Convolution neural Network (GCN). In semi-supervised learning, the embedding vectors of papers are learned to be clustered in order to realize the name disambiguation of papers. The experimental results show that, compared with other disambiguation methods, this method achieves better results on the experimental dataset.
Key words:Name disambiguation/
Graph Convolutional Network (GCN)/
BERT language model
注释:
1) 1) https://api.fanyi.baidu.com/



PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=284575fe-32bc-4db1-972a-802c0e8ba557
相关话题/论文 网络 语言 北京 知识

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 考虑评论质量的自注意力胶囊网络评分预测模型
    梁顺攀1,2,,,刘伟1,尤殿龙1,2,刘泽谦1,张付志1,21.燕山大学信息科学与工程学院秦皇岛0660042.燕山大学河北省软件工程重点实验室秦皇岛066004基金项目:国家自然科学基金(62072393),河北省自然科学基金(G2021203010,F2021203038)详细信息作者简介:梁 ...
    本站小编 Free考研考试 2022-01-03
  • 基于注意力的多尺度水下图像增强网络
    方明2,1,刘小晗1,,,付飞蚺11.长春理工大学计算机科学技术学院长春1300222.长春理工大学人工智能学院长春130022基金项目:山东省支持青岛海洋科学与技术试点国家实验室重大科技专项(2018SDKJ0102-6)详细信息作者简介:方明:男,1977年生,副教授,博士,硕士生导师,研究方向 ...
    本站小编 Free考研考试 2022-01-03
  • 基于知识图谱共同邻居排序采样的推荐模型
    李世宝1,张益维1,,,刘建航1,崔学荣1,张玉成21.中国石油大学(华东)海洋与空间信息学院青岛2665802.中国科学院智能农业机械装备工程实验室北京100190基金项目:国家自然科学基金(61972417,61872385,91938204),国家重点研发计划(2017YFC1405203), ...
    本站小编 Free考研考试 2022-01-03
  • 改进通道注意力机制下的人体行为识别网络
    陈莹,,龚苏明江南大学轻工过程先进控制教育部重点实验室无锡214122基金项目:国家自然科学基金(61573168)详细信息作者简介:陈莹:女,1976年生,教授,博士,研究方向为信息融合、模式识别.Euclid龚苏明:男,1995年生,硕士生,研究方向为计算机视觉与模式识别通讯作者:陈莹 chen ...
    本站小编 Free考研考试 2022-01-03
  • 基于深度动态贝叶斯网络的服务功能链故障诊断算法
    唐伦,廖皓,,曹睿,王兆堃,陈前斌1.重庆邮电大学通信与信息工程学院重庆4000652.重庆邮电大学移动通信技术重点实验室重庆400065基金项目:国家自然科学基金(61571073),重庆市教委科学技术研究项目(KJZD-M201800601)详细信息作者简介:唐伦:男,1973年生,教授,博士生 ...
    本站小编 Free考研考试 2022-01-03
  • 基于硬件损伤的MIMO异构网络波束成形算法
    徐勇军1,2,谢豪1,陈前斌1,,,刘期烈11.重庆邮电大学通信与信息工程学院重庆4000652.移动通信技术重庆市重点实验室重庆400065基金项目:国家自然科学基金(61601071,62071078),重庆市自然科学基金(cstc2019jcyj-xfkxX0002),重庆研究生科研创新项目( ...
    本站小编 Free考研考试 2022-01-03
  • 基于深度布隆过滤器的NDN网络三级名字查找方法
    吴庆涛1,师君如1,张明川1,,,王倩玉1,朱军龙1,张宏科21.河南科技大学信息工程学院洛阳4710232.北京交通大学下一代互联网互联设备国家工程实验室北京100044基金项目:国家自然科学基金(61871430,61976243),中原科技创新领军人才(214200510012),河南省教育厅 ...
    本站小编 Free考研考试 2022-01-03
  • 基于博弈论的网络攻防行为建模与态势演化分析
    刘小虎1,张恒巍1,,,张玉臣1,胡浩1,程建21.战略支援部队信息工程大学郑州4500012.国防科技大学武汉430000详细信息作者简介:刘小虎:男,1989年生,博士生,讲师,研究方向为网络攻防博弈、网络建模仿真张恒巍:男,1978年生,博士,副教授,研究方向为网络攻防博弈张玉臣:男,1977 ...
    本站小编 Free考研考试 2022-01-03
  • 基于人工神经网络的复杂介质中波的传播不确定性分析方法
    程曦,张志勇,新疆农业大学计算机与信息工程学院乌鲁木齐830052基金项目:国家自然科学基金(61701427)详细信息作者简介:程曦:女,1986年生,讲师,研究方向为计算电磁学、人工神经网络张志勇:男,1984年生,讲师,研究方向为计算电磁学、人工神经网络、农业信息化通讯作者:张志勇 jsjzz ...
    本站小编 Free考研考试 2022-01-03
  • 基于径向基神经网络的波束优化方法
    任笑莹,王英民,,王奇西北工业大学航海学院西安710072基金项目:国家自然科学基金(51879221)详细信息作者简介:任笑莹:女,1989年生,博士生,主要研究方向为信号处理、人工智能算法王英民:男,1963年生,教授,主要研究方向为信号处理、水声通信、声呐系统设计王奇:男,1983年生,副研究 ...
    本站小编 Free考研考试 2022-01-03