删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于孪生BERT网络的科技文献类目映射

本站小编 Free考研考试/2022-01-01

何贤敏1,李茂西1,何彦青2
1(江西师范大学计算机信息工程学院 南昌 330022);2(中国科学技术信息研究所 北京 100038) (xianminhe@jxnu.edu.cn)
出版日期: 2021-08-01


基金资助:国家自然科学基金项目(61662031);中国科学技术信息研究所重点工作项目(ZD2020-18)

Siamese BERT-Networks Based Classification Mapping of Scientific and Technological Literature

He Xianmin1, Li Maoxi1, He Yanqing2
1(School of Computer Information and Engineering, Jiangxi Normal University, Nanchang 330022);2(Institute of Scientific and Technical Information of China, Beijing 100038)
Online: 2021-08-01


Supported by:This work was supported by the National Natural Science Foundation of China (61662031) and the Fund of the Institute of Scientific and Technical Information of China (ZD2020-18).




摘要/Abstract


摘要: 国际专利分类法(international patent classification, IPC)和中国图书馆分类法(Chinese library classification, CLC)作为重要分类标识,分别在专利信息和期刊文献的组织以及管理中发挥着重要作用.如何准确地建立它们之间的映射关系对实现专利信息、期刊资源交叉浏览和检索有着重要的意义.提出了基于BERT预训练上下文语言模型的孪生网络用于建立IPC类目和CLC类目之间的映射关系,利用孪生网络模型分别抽象这2个分类法类目描述文本,通过平均池化抽象后的向量表示计算得到它们相同维度的句子向量,基于余弦相似度计算句子之间的相似度得分,完成类目映射.在人工标注一定规模的IPC类目和CLC类目之间的映射语料库上进行实验验证,结果表明提出的方法显著优于基于规则的方法和Sia-Multi,Bi-TextCNN,Bi-LSTM等深度神经网络的方法.相关的代码、模型和人工标注语料库已经公开发布.






[1]刘艳芳,李文斌,高阳. 基于被动-主动的特征演化流学习[J]. 计算机研究与发展, 2021, 58(8): 1575-1585.
[2]王原,陈名,邢立宁,吴亚辉,马武彬,赵宏. 用于求解旅行商问题的深度智慧型蚁群优化算法[J]. 计算机研究与发展, 2021, 58(8): 1586-1598.
[3]储晓恺,范鑫鑫,毕经平. 基于K阶互信息估计的位置感知网络表征学习[J]. 计算机研究与发展, 2021, 58(8): 1612-1623.
[4]马扬, 刘泽一, 梁星星, 程光权, 阳方杰, 成清, 刘忠. 基于病毒传播网络的基因序列表示学习[J]. 计算机研究与发展, 2021, 58(8): 1642-1654.
[5]黄训华,张凤斌,樊好义,席亮. 基于多模态对抗学习的无监督时间序列异常检测[J]. 计算机研究与发展, 2021, 58(8): 1655-1667.
[6]谢娟英,鲁银圆,孔维轩,许升全. 基于改进RetinaNet的自然环境中蝴蝶种类识别[J]. 计算机研究与发展, 2021, 58(8): 1686-1704.
[7]丁宗元,孙权森,王涛,王洪元. 基于融合多尺度标记信息的深度交互式图像分割[J]. 计算机研究与发展, 2021, 58(8): 1705-1717.
[8]刘凡, 王君锋, 陈峙宇, 许峰. 基于并行注意力UNet的裂缝检测方法[J]. 计算机研究与发展, 2021, 58(8): 1718-1726.
[9]郑海斌, 陈晋音, 章燕, 张旭鸿, 葛春鹏, 刘哲, 欧阳亦可, 纪守领. 面向自然语言处理的对抗攻防与鲁棒性分析综述[J]. 计算机研究与发展, 2021, 58(8): 1727-1750.
[10]史存会, 胡耀康, 冯彬, 张瑾, 俞晓明, 刘悦, 程学旗. 舆情场景下基于层次知识的话题推荐方法[J]. 计算机研究与发展, 2021, 58(8): 1811-1819.
[11]Amrita,Bhattacharjee,舒凯,高旻,刘欢. 网络信息生态系统中的虚假信息:检测、缓解与挑战[J]. 计算机研究与发展, 2021, 58(7): 1353-1365.
[12]陈慧敏,金思辰,林微,朱泽宇,仝凌波,刘一芃,叶奕宁,姜维翰,刘知远,孙茂松,金兼斌. 新冠疫情相关社交媒体谣言传播量化分析[J]. 计算机研究与发展, 2021, 58(7): 1366-1384.
[13]胡斗,卫玲蔚,周薇,淮晓永,韩冀中,虎嵩林. 一种基于多关系传播树的谣言检测方法[J]. 计算机研究与发展, 2021, 58(7): 1395-1411.
[14]徐铭达,张子柯,许小可. 基于模体度的社交网络虚假信息传播机制研究[J]. 计算机研究与发展, 2021, 58(7): 1425-1435.
[15]陈波冯,李靖东,卢兴见,沙朝锋,王晓玲,张吉. 基于深度学习的图异常检测技术综述[J]. 计算机研究与发展, 2021, 58(7): 1436-1455.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4478
相关话题/计算机 网络 信息 传播 中国科学技术信息研究所

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 网络信息生态系统中的虚假信息:检测、缓解与挑战
    Amrita,Bhattacharjee1,舒凯2,高旻3,刘欢11(亚利桑那州立大学计算机科学与工程系美国亚利桑那州坦佩85281);2(伊利诺伊理工大学计算机科学系美国伊利诺伊州芝加哥60616);3(重庆大学大数据与软件学院重庆400044)(abhatt43@asu.edu)出版日期:202 ...
    本站小编 Free考研考试 2022-01-01
  • 虚假信息检测专题前言
    出版日期:2021-07-01Online:2021-07-01摘要/Abstract摘要:虚假信息检测旨在综合应用自然语言处理、社交挖掘、跨模态分析等智能处理手段,发现并利用信息的内在特征、产生机理与传播规律,为以假新闻为代表的虚假、伪造信息的识别与干预提供理论和技术支持.《Science》在20 ...
    本站小编 Free考研考试 2022-01-01
  • 一种基于多关系传播树的谣言检测方法
    胡斗1,卫玲蔚2,3,周薇2,淮晓永1,韩冀中2,虎嵩林2,31(华北计算机系统工程研究所北京100083);2(中国科学院信息工程研究所北京100093);3(中国科学院大学网络空间安全学院北京100049)(hudou18@mails.ucas.edu.cn)出版日期:2021-07-01基金资 ...
    本站小编 Free考研考试 2022-01-01
  • 基于模体度的社交网络虚假信息传播机制研究
    徐铭达1,张子柯2,3,许小可11(大连民族大学信息与通信工程学院辽宁大连116600);2(浙江大学传媒与国际文化学院杭州310058);3(杭州师范大学阿里巴巴复杂科学研究中心杭州311121)(854655253@qq.com)出版日期:2021-07-01基金资助:国家自然科学基金项目(61 ...
    本站小编 Free考研考试 2022-01-01
  • 融合源信息和门控图神经网络的谣言检测研究
    杨延杰,王莉,王宇航(太原理工大学大数据学院山西晋中030600)(yangyanjie1073@link.tyut.edu.cn)出版日期:2021-07-01基金资助:国家自然科学基金项目(61872260)RumorDetectionBasedonSourceInformationandGat ...
    本站小编 Free考研考试 2022-01-01
  • 基于全局-时频注意力网络的语音伪造检测
    王成龙1,2,易江燕2,陶建华2,3,马浩鑫2,田正坤2,傅睿博21(中国科学技术大学信息科学技术学院合肥230027);2(模式识别国家重点实验室(中国科学院自动化研究所)北京100080);3(中国科学院大学人工智能学院北京100049)(chenglong.wang@nlpr.ia.ac.cn ...
    本站小编 Free考研考试 2022-01-01
  • 基于粗粒度数据流架构的稀疏卷积神经网络加速
    吴欣欣1,2,3,欧焱1,2,3,李文明1,2,王达1,2,张浩1,2,范东睿1,2,31(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院计算技术研究所北京100190);3(中国科学院大学计算机科学与技术学院北京100049)(wuxinxin@ict. ...
    本站小编 Free考研考试 2022-01-01
  • 社交网络信息传播预测与特定信息抑制
    曹玖新1,高庆清1,夏蓉清2,刘伟佳1,朱雪林1,刘波21(东南大学网络空间安全学院南京211189);2(东南大学计算机科学与工程学院南京211189)(jx.cao@seu.edu.cn)出版日期:2021-07-01基金资助:国家自然科学基金项目(61772133,61972087);国家社会 ...
    本站小编 Free考研考试 2022-01-01
  • 计算机芯片关键技术前沿与进展专题前言
    出版日期:2021-06-01Online:2021-06-01摘要/Abstract摘要:“计算机体系结构前沿技术2021”专题———“计算机芯片关键技术前沿与进展”,集中介绍计算机芯片设计、测试、验证方面的新理论、新技术,以及新型部件和新型芯片系统.本专题包括关于处理器芯片敏捷设计和类脑计算的2 ...
    本站小编 Free考研考试 2022-01-01
  • 图神经网络加速结构综述
    李涵1,2,严明玉1,2,吕征阳1,2,李文明1,叶笑春1,范东睿1,2,唐志敏1,21(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院大学北京100049)(lihan-ams@ict.ac.cn)出版日期:2021-06-01基金资助:国家自然科学基金 ...
    本站小编 Free考研考试 2022-01-01