基于循环卷积多任务学习的多领域文本分类方法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-03

谢金宝¹,
李嘉辉^2,,,
康守强²,
王庆岩²,
王玉静²
1.广东科学技术职业学院机器人学院珠海 519090
2.哈尔滨理工大学电气与电子工程学院哈尔滨 150000
基金项目:基于工业互联网的协作式智能机器人产教融合创新应用平台(2020CJPT004)，黑龙江省自然科学基金(LH2019E058)，智能机器人湖北省重点实验室开放基金(HBIR202004)，黑龙江省普通高校基本科研业务费专项资金(LGYC2018JC027)

详细信息

作者简介:谢金宝：男，1980年生，副教授，研究方向为自然语言处理、人工智能
李嘉辉：男，1995年生，硕士生，研究方向为自然语言处理、人工智能
康守强：男，1980年生，教授，研究方向为智能诊断、人工智能
王庆岩：男，1984年生，副教授，研究方向为智能诊断、人工智能、智能图像处理
王玉静：女，1983年生，副教授，研究方向为智能诊断、人工智能

通讯作者:李嘉辉　maillijiahui@163.com

中图分类号:TP391.1

计量

文章访问数:451
HTML全文浏览量:167
PDF下载量:71
被引次数:0

出版历程

收稿日期:2020-10-09
修回日期:2021-02-03
网络出版日期:2021-03-01
刊出日期:2021-08-10

A Multi-domain Text Classification Method Based on Recurrent Convolution Multi-task Learning

Jinbao XIE¹,
Jiahui LI^2,,,
Shouqiang KANG²,
Qingyan WANG²,
Yujing WANG²
1. School of Robotic, Guangdong Polytechnic of Science and Technology, Zhuhai 519090, China
2. School of Electrical and Electronic Engineering, Harbin University of Science and Technology, Harbin 150000, China
Funds:The collaborative intelligent robot production and education integrates innovative application platform based on the industrial Internet (2020CJPT004), The Natural Science Foundation of Heilongjiang Province (LH2019E058), The open fund projects of Hubei Key Laboratory of Intelligent Robot (Wuhan Institute of Technology) (HBIR 202004), The Fundamental Research Fundation for Universities of Heilongjiang Province (LGYC2018JC027)

摘要
摘要:文本分类任务中，不同领域的文本很多表达相似，具有相关性的特点，可以解决有标签训练数据不足的问题。采用多任务学习的方法联合学习能够将不同领域的文本利用起来，提升模型的训练准确率和速度。该文提出循环卷积多任务学习(MTL-RC)模型用于文本多分类，将多个任务的文本共同建模，分别利用多任务学习、循环神经网络(RNN)和卷积神经网络(CNN)模型的优势获取多领域文本间的相关性、文本长期依赖关系、提取文本的局部特征。基于多领域文本分类数据集进行丰富的实验，该文提出的循环卷积多任务学习模型(MTL-LC)不同领域的文本分类平均准确率达到90.1%，比单任务学习模型循环卷积单任务学习模型(STL-LC)提升了6.5%，与当前热门的多任务学习模型完全共享多任务学习模型(FS-MTL)、对抗多任务学习模型(ASP-MTL)、间接交流多任务学习框架(IC-MTL)相比分别提升了5.4%, 4%和2.8%。
关键词:多领域文本分类/
多任务学习/
循环神经网络/
卷积神经网络
Abstract:In the text classification task, many texts in different domains are similarly expressed and have the characteristics of correlation, which can solve the problem of insufficient training data with labels. The text of different fields can be combined with the multi-task learning method, and the training accuracy and speed of the model can be improved. A Recurrent Convolution Multi-Task Learning (MTL-RC) model for text multi-classification is proposed, jointly modeling the text of multiple tasks, and taking advantage of multi-task learning, Recurrent Neural Network(RNN) and Convolutional Neural Network(CNN) models to obtain the correlation between multi-domain texts, long-term dependence of text. Local features of text are extracted. Rich experiments are carried out based on multi-domain text classification datasets, the Recurrent Convolution Multi-Task Learning(MTL-LC) proposed in this paper has an average accuracy of 90.1% for text classification in different fields, which is 6.5% higher than the single-task learning model STL-LC. Compared with mainstream multi-tasking learning models Full Shared Multi-Task Learning(FS-MTL), Adversarial Multi-Task Learninng(ASP-MTL), and Indirect Communciation for Multi-Task Learning(IC-MTL) have increased by 5.4%, 4%, and 2.8%, respectively.
Key words:Multi-domain text classification/
Multi-task learning/
Recurrent Neural Netword(RNN)/
Convolutional Neural Network(CNN)

PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=e1e47a1f-1541-43ea-835a-c0c109c74e34

相关话题/智能 数据 广东 哈尔滨理工大学 基金

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
区块链上基于云辅助的密文策略属性基数据共享加密方案
牛淑芬1,杨平平1,,,谢亚亚1,杜小妮21.西北师范大学计算机科学与工程学院兰州7300702.西北师范大学数学与统计学院兰州730070基金项目:国家自然科学基金(61562077,61662069,61662071,61772022)，西北师范大学青年教师科研提升计划(NWNU-LKQN-13 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于深度生成对抗网络的海杂波数据增强方法
丁斌1,,,夏雪2,梁雪峰1,31.西安文理学院西安7100652.西安石油大学西安7100653.西安电子科技大学西安710071基金项目:西安市科技计划(2019KJWL30)详细信息作者简介:丁斌：男，1980年生，博士，高级工程师，研究方向为智能信息处理、图像解译与智慧遥感夏雪：女，1985 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一种异构网络多协议并行数据分发方法
刘建航1,,,武万萍1,王树庆1,李世宝1,张玉成21.中国石油大学(华东)计算机与通信工程学院青岛2665802.中国科学院智能农业机械装备工程实验室北京100190基金项目:国家自然科学基金(61972417)，山东省自然科学基金(ZR201911070168)，中央高校基本科研业务费专项资金( ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于多元高斯混合模型的离线指纹数据库
秦宁宁1,2,,,王超1,杨乐3,孙顺远11.江南大学轻工过程先进控制教育部重点实验室无锡2141222.南京航空航天大学电磁频谱空间认知动态系统工信部重点实验室南京2111063.坎特伯雷大学电气与计算机工程系克赖斯特彻奇8011基金项目:国家自然科学基金(61702228,61803183)，江 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于随机数三角阵映射的高维大数据二分聚类初始中心高效鲁棒生成算法
李旻1,2,,,何婷婷11.华中师范大学国家数字化学习工程技术研究中心武汉4300792.河南大学计算机与信息工程学院开封475001基金项目:河南省科技攻关计划(162102210168)详细信息作者简介:李旻：男，1976年生，副教授，主要研究方向为数据挖掘、自然语言处理、教育信息技术等何婷婷： ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于大通讯时滞的二阶多智能体系统的一致性分析
晋守博,,魏章志,李耀红宿州学院数学与统计学院宿州234000基金项目:国家自然科学基金(61876073)；安徽省高校自然科学研究重点项目(KJ2019A0666,KJ2019A0672,KJ2018A0452)详细信息作者简介:晋守博：男，1980年生，硕士，副教授，研究方向为多智能体系统魏章志 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于Sentinel-1/2遥感数据的冬小麦覆盖地表土壤水分协同反演
赵建辉,张蓓,李宁,郭拯危,1.河南大学河南省大数据分析与处理重点实验室开封4750042.河南大学河南省智能技术与应用工程技术研究中心开封4750043.河南大学计算机与信息工程学院开封475004基金项目:国家自然科学基金(61871175)，河南省科技攻关计划项目(182102210233,1 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
非平稳信道下的鲁棒数据链优化设计综述——带限环境下的混沌传输系统
苗美媛1,宋丹1,徐位凯1,湛佳2,王琳1,,1.厦门大学信息学院厦门3610052.香港理工大学电子与信息工程学院香港999077基金项目:国家自然科学基金(61671395,61871337)详细信息作者简介:苗美媛：女，1991年生，博士生，研究方向为混沌调制，带限传输系统宋丹：女，1994年 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于信令数据的轨迹驻留点识别算法研究
李万林1,王超1,2,许国良2,,,雒江涛2,张轩1,21.重庆邮电大学通信与信息工程学院　重庆　4000652.重庆邮电大学电子信息与网络工程研究院　重庆　400065基金项目:重庆市自然科学基金(cstc2018jcyjAX0587)，新型感知技术、信息融合处理及其应用(A2017-10)详细信 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于粒子群优化多核支持向量数据描述的广播式自动相关监视异常数据检测模型
王布宏,罗鹏,,李腾耀,田继伟,尚福特空军工程大学信息与导航学院西安710077基金项目:国家自然科学基金(61902426)详细信息作者简介:王布宏：男，1975年生，博士，教授，研究方向为人工智能安全、信息物理系统安全等罗鹏：男，1995年生，硕士生，研究方向为人工智能安全、ADS-B数据攻击检 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03