删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

关于短文本匹配的泛化性和迁移性的研究分析

本站小编 Free考研考试/2022-01-01

马新宇,范意兴,郭嘉丰,张儒清,苏立新,程学旗
(中国科学院网络数据科学与技术重点实验室(中国科学院计算技术研究所) 北京 100190) (中国科学院大学 北京 100049) (maxinyu17g@ict.ac.cn)
出版日期: 2022-01-01


基金资助:国家自然科学基金项目(61722211,61773362,61872338,62006218,61902381);国家重点研发计划项目(2016QY02D0405);北京智源人工智能研究院项目(BAAI2019ZD0306);中国科学院青年创新促进会项目(20144310,2016102);重庆市基础科学与前沿技术研究专项项目(重点)(cstc2017jcjyBX0059);王宽诚教育基金会项目;联想-中科院联合实验室青年科学家项目

An Empirical Investigation of Generalization and Transfer in Short Text Matching

Ma Xinyu, Fan Yixing, Guo Jiafeng, Zhang Ruqing, Su Lixin, Cheng Xueqi
(CAS Key Laboratory of Network Data Science & Technology (Institute of Computing Technology, Chinese Academy of Sciences), Beijing 100190) (University of Chinese Academy of Sciences, Beijing 100049)
Online: 2022-01-01


Supported by:This work was supported by the National Natural Science Foundation of China (61722211, 61773362, 61872338, 62006218, 61902381), the National Key Research and Development Program of China (2016QY02D0405), the Project of Beijing Academy of Artificial Intelligence (BAAI2019ZD0306), the Youth Innovation Promotion Association CAS (20144310, 2016102), the Project of Chongqing Research Program of Basic Research and Frontier Technology (cstc2017jcyjBX0059), the K.C.Wong Education Foundation, and the Lenovo-CAS Joint Lab Youth Scientist Project.




摘要/Abstract


摘要: 自然语言理解中的许多任务,比如自然语言推断任务、机器问答和复述问题,都可以看作是短文本匹配问题.近年来,大量的数据集和深度学习模型的涌现使得短文本匹配任务取得了长足的进步,然而,很少有工作去分析模型在不同数据集之间的泛化能力,以及如何在新领域中有效地利用现有不同领域中的大量带标注的数据,达到减少新领域的数据标注量和提升性能的目标.为此,重点分析了不同数据集之间的泛化性和迁移性,并且通过可视化的方式展示了影响数据集之间泛化性的因素.具体地,使用深度学习模型ESIM(enhanced sequential inference model)和预训练语言模型BERT(bidirectional encoder representations from transformers)在10个通用的短文本匹配数据集上进行了详尽的实验.通过实验,发现即使是在大规模语料预训练过的BERT,合适的迁移仍能带来性能提升.基于以上的分析,也发现通过在混合数据集预训练过的模型,在新的领域和少量样本情况下,具有较好的泛化能力和迁移能力.






[1]翁泽佳, 陈静静, 姜育刚. 基于域对抗学习的可泛化虚假人脸检测方法研究[J]. 计算机研究与发展, 2021, 58(7): 1476-1489.
[2]冯伟, 杭文龙, 梁爽, 刘学军, 王辉. 基于层间模型知识迁移的深度堆叠最小二乘分类器[J]. 计算机研究与发展, 2019, 56(12): 2589-2599.
[3]卢 敏, 黄亚楼, 谢茂强, 王 扬, 刘 杰, 廖 振,. 代价敏感的列表排序算法[J]. , 2012, 49(8): 1738-1746.
[4]杨 武, 云晓春, 李建华,. 一种基于强化规则学习的高效入侵检测方法[J]. , 2006, 43(7): 1252-1259.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4562
相关话题/数据 北京 中国科学院 计算机 实验

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于属性分割的高维二值数据差分隐私发布
    洪金鑫1,吴英杰1,蔡剑平2,孙岚11(福州大学数学与计算机科学学院福州350108);2(厦门华厦学院信息与智能机电工程学院福建厦门361024)(fzu_hjx@163.com)出版日期:2022-01-01基金资助:福建省自然科学基金项目(2017J01754,2018J01797)Diffe ...
    本站小编 Free考研考试 2022-01-01
  • 基于滑动窗口模型的数据流闭合高效用项集挖掘
    程浩东,韩萌,张妮,李小娟,王乐(北方民族大学计算机科学与工程学院银川750021)(734811467@qq.com)出版日期:2021-11-01基金资助:国家自然科学基金项目(62062004);宁夏自然科学基金项目(2020AAC03216);北方民族大学研究生创新项目(YCX20077)C ...
    本站小编 Free考研考试 2022-01-01
  • 区块链数据隐私保护:研究现状与展望
    王晨旭1,3,程加成1,桑新欣1,李国栋2,管晓宏31(西安交通大学软件学院西安710049);2(西安交通大学网络信息中心西安710049);3(智能网络与网络安全教育部重点实验室(西安交通大学)西安710049)(cxwang@mail.xjtu.edu.cn)出版日期:2021-10-01基金 ...
    本站小编 Free考研考试 2022-01-01
  • 面向超导量子计算机的程序映射技术研究
    窦星磊,刘磊,陈岳涛(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190)(中国科学院计算技术研究所北京100190)(liulei2010@ict.ac.cn)出版日期:2021-09-01基金资助:国家自然科学基金项目(62072432,61502452)AnInvesti ...
    本站小编 Free考研考试 2022-01-01
  • 基于深度学习的数据库自然语言接口综述
    潘璇1,3,徐思涵1,3,蔡祥睿2,3,温延龙1,3,袁晓洁2,31(南开大学计算机学院天津300350);2(南开大学网络空间安全学院天津300350);3(天津市网络与数据安全技术重点实验室(南开大学)天津300350)(panxuan@dbis.nankai.edu.cn)出版日期:2021- ...
    本站小编 Free考研考试 2022-01-01
  • 基于粗粒度数据流架构的稀疏卷积神经网络加速
    吴欣欣1,2,3,欧焱1,2,3,李文明1,2,王达1,2,张浩1,2,范东睿1,2,31(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院计算技术研究所北京100190);3(中国科学院大学计算机科学与技术学院北京100049)(wuxinxin@ict. ...
    本站小编 Free考研考试 2022-01-01
  • 计算机芯片关键技术前沿与进展专题前言
    出版日期:2021-06-01Online:2021-06-01摘要/Abstract摘要:“计算机体系结构前沿技术2021”专题———“计算机芯片关键技术前沿与进展”,集中介绍计算机芯片设计、测试、验证方面的新理论、新技术,以及新型部件和新型芯片系统.本专题包括关于处理器芯片敏捷设计和类脑计算的2 ...
    本站小编 Free考研考试 2022-01-01
  • 面向云网融合的数据中心能效评估方法
    龙赛琴1,2,3,黄金娜1,李哲涛1,2,3,裴廷睿1,2,3,夏元清41(湘潭大学计算机学院湖南湘潭411105);2(物联网与信息安全湖南省重点实验室(湘潭大学)湖南湘潭411105);3(智慧网络湖南省国际科技创新合作基地(湘潭大学)湖南湘潭411105);4(北京理工大学自动化学院北京100 ...
    本站小编 Free考研考试 2022-01-01
  • 基于预测的数据中心间混合流量调度算法
    王然1,2,张宇超1,王文东1,2,徐恪3,崔来中41(北京邮电大学计算机学院(国家示范性软件学院)北京100876);2(网络与交换技术国家重点实验室(北京邮电大学)北京100876);3(清华大学计算机科学与技术系北京100084);4(深圳大学计算机与软件学院广东深圳518060)(wangr ...
    本站小编 Free考研考试 2022-01-01
  • 基于预测误差自适应编码的图像加密可逆数据隐藏
    杨尧林1,和红杰1,陈帆1,原长琦21(西南交通大学信息科学与技术学院成都611756);2(北京电子技术应用研究所北京100091)(ylyangwr@foxmail.com)出版日期:2021-06-01基金资助:国家自然科学基金项目(61872303,U1936113);四川省科技厅科技创新人 ...
    本站小编 Free考研考试 2022-01-01