删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

面向问答领域的数据增强方法

本站小编 Free考研考试/2022-11-27

面向问答领域的数据增强方法

丁家杰, 肖康, 叶恒, 周夏冰?, 张民
苏州大学计算机科学与技术学院, 苏州 215000

收稿日期:2021-06-08修回日期:2021-08-14出版日期:2022-01-20

基金资助:国家自然科学基金(62176174)资助

Data Augmentation Method for Question Answering

DING Jiajie, XIAO Kang, YE Heng, ZHOU Xiabing?, ZHANG Min
School of Computer Science and Technology, Soochow University, Suzhou 21500

Received:2021-06-08Revised:2021-08-14Published:2022-01-20






摘要/Abstract


摘要: 针对当前自动问答数据增强方法需要大量外部数据的问题, 提出一个面向问答模型缺陷的数据增强方法。首先, 在训练集上训练好问答模型、问题生成模型以及问答匹配模型; 然后, 获取问答模型在训练集上预测的所有答案, 并选取其中预测错误的答案; 再后, 使用问题生成模型对这些答案生成相应问题; 最后, 通过问答匹配模型对生成的问答对进行过滤, 保留其中质量较高的数据作为最终的增强数据。该方法不需要额外的数据与领域知识, 同时能够针对模型构造特定数据, 耗费较少的训练代价就能使模型性能提升。实验结果表明, 所提出的数据增强方法对R-Net, Bert-Base以及Luke均有效, 与其他数据增强方法相比, 在较少的增强数据规模下, 问答模型获得更好的性能提升。

引用本文



丁家杰, 肖康, 叶恒, 周夏冰, 张民. 面向问答领域的数据增强方法[J]. 北京大学学报自然科学版, 2022, 58(1): 54-60.
DING Jiajie, XIAO Kang, YE Heng, ZHOU Xiabing, ZHANG Min. Data Augmentation Method for Question Answering[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 54-60.





PDF全文下载地址:

http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3698
相关话题/

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19