删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

用于金融文本挖掘的多任务学习预训练金融语言模型

本站小编 Free考研考试/2022-01-01

刘壮1,刘畅2,Wayne,Lin3,赵军4
1(东北财经大学应用金融与行为科学学院 辽宁大连 116025);2(中国石油物资采购中心 沈阳 110031);3(南加州大学计算机学院 美国加利福尼亚州洛杉矶 90007);4(IBM研究院 北京 100101) (liuzhuang@dufe.edu.cn)
出版日期: 2021-08-01


基金资助:辽宁省教育厅2021年度高等学校基本科研项目(面上项目);教育部产学合作协同育人项目(202002037015)

Pretraining Financial Language Model with Multi-Task Learning for Financial Text Mining

Liu Zhuang1, Liu Chang2, Wayne Lin3, Zhao Jun4
1(School of Applied Finance and Behavioral Science, Dongbei University of Finance and Economics, Dalian, Liaoning 116025);2(China Petroleum Materials Procurement Center, Shenyang 110031);3(School of Computer Science, University of Southern California, Los Angeles, CA, USA 90007);4(IBM Research, Beijing 100101)
Online: 2021-08-01


Supported by:This work was supported by the Basic Scientific Research Project (General Program) of Department of Education of Liaoning Province and the University-Industry Collaborative Education Program of the Ministry of Education of China (202002037015).




摘要/Abstract


摘要: 近年来,机器学习,尤其是深度神经网络方法促进了金融文本挖掘研究的发展,在金融科技(Fintech)领域起着越来越重要的作用.如何从金融大数据中提取有价值的信息已经成为学术界和工业界一个非常有挑战的研究.由于深度神经网络需要大量标注数据,但是金融领域缺乏训练数据,因此,将深度学习应用于金融大数据挖掘并没有取得很好效果.为了更好地解决该问题,利用自监督学习和多任务学习等深度学习领域最新的思想和技术,提出了基于BERT模型架构的开源金融预训练语言模型F-BERT.F-BERT是一种针对特定领域(金融文本数据)的预训练语言模型,它通过在大型金融语料库上进行无监督训练得到.基于BERT架构,F-BERT可以有效地自动将知识从金融大数据中提取出并记忆在模型中,而无需进行特定于金融任务的模型结构修改,从而可以直接将其应用于下游各种金融领域任务,包括股票涨跌预测、金融情绪分类、金融智能客服等.在金融关系提取、金融情绪分类、金融智能问答任务上的大量实验表明了F-BERT模型的有效性和鲁棒性.同时,F-BERT在这3个有代表性的金融文本挖掘任务上均取得了很高的模型准确率,进一步验证了模型的性能.






[1]何贤敏, 李茂西, 何彦青. 基于孪生BERT网络的科技文献类目映射[J]. 计算机研究与发展, 2021, 58(8): 1751-1760.
[2]张东杰,黄龙涛,张荣,薛晖,林俊宇,路瑶. 基于主题与情感联合预训练的虚假评论检测方法[J]. 计算机研究与发展, 2021, 58(7): 1385-1394.
[3]邢新颖, 冀俊忠, 姚垚. 基于自适应多任务卷积神经网络的脑网络分类方法[J]. 计算机研究与发展, 2020, 57(7): 1449-1459.
[4]卓君宝, 苏驰, 王树徽, 黄庆明. 最小熵迁移对抗散列方法[J]. 计算机研究与发展, 2020, 57(4): 888-896.
[5]冯伟, 杭文龙, 梁爽, 刘学军, 王辉. 基于层间模型知识迁移的深度堆叠最小二乘分类器[J]. 计算机研究与发展, 2019, 56(12): 2589-2599.
[6]秦晨光, 王海, 任杰, 郑杰, 袁璐, 赵子鑫. 基于多任务学习的方言语种识别[J]. 计算机研究与发展, 2019, 56(12): 2632-2640.
[7]程晓阳,詹永照,毛启容,詹智财. 基于拓扑稀疏编码预训练CNN的视频语义分析[J]. 计算机研究与发展, 2018, 55(12): 2703-2714.
[8]王珺,卫金茂,张璐. 基于保留分类信息的多任务特征学习算法[J]. 计算机研究与发展, 2017, 54(3): 537-548.
[9]周彧聪,刘轶,王锐. 互补学习:一种面向图像应用和噪声标注的深度神经网络训练方法[J]. 计算机研究与发展, 2017, 54(12): 2649-2659.
[10]文益民,唐诗淇,冯超,高凯. 基于在线迁移学习的重现概念漂移数据流分类[J]. 计算机研究与发展, 2016, 53(8): 1781-1791.
[11]董爱美,毕安琪,王士同. 基于迁移共享空间的分类新算法[J]. 计算机研究与发展, 2016, 53(3): 632-643.
[12]吴 琼 刘 悦 沈华伟 张 瑾 许洪波 程学旗. 面向跨领域情感分类的统一框架[J]. , 2013, 50(8): 1683-1689.
[13]梅灿华 张玉红 胡学钢 李培培. 一种基于最大熵模型的加权归纳迁移学习方法[J]. , 2011, 48(9): 1722-1728.
[14]陈海鹏 申铉京 吕颖达 金玉善. 基于Lambert光照模型的图像真伪盲鉴别算法[J]. , 2011, 48(7): 1237-1245.
[15]洪佳明 印 鉴 黄 云 刘玉葆 王甲海. TrSVM:一种基于领域相似性的迁移学习算法[J]. , 2011, 48(10): 1823-1830.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4479
相关话题/金融 计算机 数据 图像 科技

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于粗粒度数据流架构的稀疏卷积神经网络加速
    吴欣欣1,2,3,欧焱1,2,3,李文明1,2,王达1,2,张浩1,2,范东睿1,2,31(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院计算技术研究所北京100190);3(中国科学院大学计算机科学与技术学院北京100049)(wuxinxin@ict. ...
    本站小编 Free考研考试 2022-01-01
  • 计算机芯片关键技术前沿与进展专题前言
    出版日期:2021-06-01Online:2021-06-01摘要/Abstract摘要:“计算机体系结构前沿技术2021”专题———“计算机芯片关键技术前沿与进展”,集中介绍计算机芯片设计、测试、验证方面的新理论、新技术,以及新型部件和新型芯片系统.本专题包括关于处理器芯片敏捷设计和类脑计算的2 ...
    本站小编 Free考研考试 2022-01-01
  • 面向云网融合的数据中心能效评估方法
    龙赛琴1,2,3,黄金娜1,李哲涛1,2,3,裴廷睿1,2,3,夏元清41(湘潭大学计算机学院湖南湘潭411105);2(物联网与信息安全湖南省重点实验室(湘潭大学)湖南湘潭411105);3(智慧网络湖南省国际科技创新合作基地(湘潭大学)湖南湘潭411105);4(北京理工大学自动化学院北京100 ...
    本站小编 Free考研考试 2022-01-01
  • 基于预测的数据中心间混合流量调度算法
    王然1,2,张宇超1,王文东1,2,徐恪3,崔来中41(北京邮电大学计算机学院(国家示范性软件学院)北京100876);2(网络与交换技术国家重点实验室(北京邮电大学)北京100876);3(清华大学计算机科学与技术系北京100084);4(深圳大学计算机与软件学院广东深圳518060)(wangr ...
    本站小编 Free考研考试 2022-01-01
  • 基于预测误差自适应编码的图像加密可逆数据隐藏
    杨尧林1,和红杰1,陈帆1,原长琦21(西南交通大学信息科学与技术学院成都611756);2(北京电子技术应用研究所北京100091)(ylyangwr@foxmail.com)出版日期:2021-06-01基金资助:国家自然科学基金项目(61872303,U1936113);四川省科技厅科技创新人 ...
    本站小编 Free考研考试 2022-01-01
  • 基于区域卷积神经网络的图像秘密共享方案
    刘雁孝1,2,吴萍,孙钦东11(西安理工大学计算机科学与工程学院西安710048);2(广西可信软件重点实验室(桂林电子科技大学)广西桂林541004)(liuyanxiao@xaut.edu.cn)出版日期:2021-05-01基金资助:陕西省自然科学基础研究计划项目(2019JQ-736);陕西 ...
    本站小编 Free考研考试 2022-01-01
  • 命名数据网络中基于内容类型的隔跳概率缓存机制
    郭江1,2,王淼1,张玉军1,21(中国科学院计算技术研究所北京100190);2(中国科学院大学北京100049)(guojiang@ict.ac.cn)出版日期:2021-05-01基金资助:国家重点研发计划项目(2018YFB1800403,2016YFE0121500);网络计算创新研究院课 ...
    本站小编 Free考研考试 2022-01-01
  • 一种基于条带的一致性散列数据放置算法
    魏征1,2,窦禹1,2,高艳珍1,2,马捷1,孙凝晖1,邢晶11(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院大学北京100190)(weizheng@ncic.ac.cn)出版日期:2021-04-01基金资助:国家重点发展计划项目(2018YFC08 ...
    本站小编 Free考研考试 2022-01-01
  • 基于Storm平台的数据恢复节能策略
    蒲勇霖1,于炯1,鲁亮2,李梓杨1,国冰磊1,廖彬31(新疆大学信息科学与工程学院乌鲁木齐830046);2(中国民航大学计算机科学与技术学院天津300300);3(新疆财经大学统计与数据科学学院乌鲁木齐830012)(puyonglin1991@foxmail.com)出版日期:2021-03-0 ...
    本站小编 Free考研考试 2022-01-01
  • 基于深度集成学习的类极度不均衡数据信用欺诈检测算法
    刘颖1,杨轲21(吉林财经大学管理科学与信息工程学院长春130117);2(吉林财经大学税务学院长春130117)(lyaihua1995@163.com)出版日期:2021-03-01基金资助:国家社会科学基金项目(20BTJ062)CreditFraudDetectionforExtremely ...
    本站小编 Free考研考试 2022-01-01