删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于深度集成学习的类极度不均衡数据信用欺诈检测算法

本站小编 Free考研考试/2022-01-01

刘颖1,杨轲2
1(吉林财经大学管理科学与信息工程学院 长春 130117);2(吉林财经大学税务学院 长春 130117) (lyaihua1995@163.com)
出版日期: 2021-03-01


基金资助:国家社会科学基金项目(20BTJ062)

Credit Fraud Detection for Extremely Imbalanced Data Based on Ensembled Deep Learning

Liu Ying1, Yang Ke2
1(School of Management Science and Information Engineering, Jilin University of Finance and Economics, Changchun 130117);2(School of Taxation, Jilin University of Finance and Economics, Changchun 130117)
Online: 2021-03-01


Supported by:This work was supported by the National Social Science Foundation of China (20BTJ062).




摘要/Abstract


摘要: 信用欺诈数据分布极度不均衡时, 信息失真、周期性统计误差和报告偏倚所产生的噪声错误对训练模型干扰凸显, 且易产生过拟合现象.鉴于此, 提出一种深度信念神经网络集成算法来解决类极度不均衡的信用欺诈问题.首先, 提出双向联合采样算法克服信息缺失和过拟合问题; 然后, 构造2阶段基分类器簇, 针对支持向量机(support vector machine, SVM)对不均衡数据分布所表现的分类超平面向少数类偏移问题, 利用增强(boosting)算法生成SVM与随机森林(random forest, RF)结合的基分类器簇; 利用深度信念网络(deep belief network, DBN)整合基分类器簇的多元预测, 输出分类结果.考虑传统精度评价指标过度关注多数类样本, 忽视信用欺诈存在违约损失高于利息收益事实, 引入成本-效益指数兼顾正类和负类样本的识别能力, 提高模型对少数类样本预测精度.通过对欧洲信用卡欺诈数据检测发现, 相比于其他相关算法成本-效益指数均值提高3个百分点, 同时, 实验比较样本不均衡比例对算法精度影响, 结果表明在处理极端不均衡数据时所提算法效果更优.






[1]陈善静, 向朝参, 康青, 吴韬, 刘凯, 冯亮, 邓涛. 基于多源遥感时空谱特征融合的滑坡灾害检测方法[J]. 计算机研究与发展, 2020, 57(9): 1877-1887.
[2]王婕婷, 钱宇华, 李飞江, 刘郭庆. 消除随机一致性的支持向量机分类方法[J]. 计算机研究与发展, 2020, 57(8): 1581-1593.
[3]肖珂,戴舜,何云华,孙利民. 基于城市监控的自然场景图像的中文文本提取方法[J]. 计算机研究与发展, 2019, 56(7): 1525-1533.
[4]倪明涛,赵波,吴福生,樊佩茹. CREBAD:基于芯片辐射的物联网设备异常检测方案[J]. 计算机研究与发展, 2018, 55(7): 1451-1461.
[5]周宇航,周志华. 代价敏感大间隔分布学习机[J]. 计算机研究与发展, 2016, 53(9): 1964-1970.
[6]冯昌,廖士中. 随机傅里叶特征空间中高斯核支持向量机模型选择[J]. 计算机研究与发展, 2016, 53(9): 1971-1978.
[7]陈忆群,周如旗,朱蔚恒,李梦婷,印鉴. 挖掘专利知识实现关键词自动抽取[J]. 计算机研究与发展, 2016, 53(8): 1740-1752.
[8]何文斌,刘群锋,熊金志. 支持向量机多项式光滑函数的误差理论研究[J]. 计算机研究与发展, 2016, 53(7): 1576-1585.
[9]董爱美,毕安琪,王士同. 基于迁移共享空间的分类新算法[J]. 计算机研究与发展, 2016, 53(3): 632-643.
[10]甘丽新,万常选,刘德喜,钟青,江腾蛟. 基于句法语义特征的中文实体关系抽取[J]. 计算机研究与发展, 2016, 53(2): 284-302.
[11]张虎,谭红叶,钱宇华,李茹,陈千. 基于集成学习的中文文本欺骗检测研究[J]. 计算机研究与发展, 2015, 52(5): 1005-1013.
[12]李涛,刘学臣,张帅,王恺,杨愚鲁. 基于混合编程模型的支持向量机训练并行化[J]. 计算机研究与发展, 2015, 52(5): 1098-1108.
[13]陈耀东,李仁发. 一种层次化的联合识别模型[J]. 计算机研究与发展, 2015, 52(11): 2431-2440.
[14]刘金宝,盛达魁,张铭. 微博自媒体账号识别研究[J]. 计算机研究与发展, 2015, 52(11): 2527-2534.
[15]花小朋, 丁世飞,. 局部保持对支持向量机[J]. 计算机研究与发展, 2014, 51(3): 590-597.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4385
相关话题/计算机 数据 中文 吉林财经大学 信息

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 一种联合检测命名数据网络中攻击的方法
    吴志军,张入丹,岳猛(中国民航大学电子信息与自动化学院天津300300)(zjwu@cauc.edu.cn)出版日期:2021-03-01基金资助:国家自然基金委员会与中国民航局联合基金项目(U1933108);天津市教委科研计划项目(2019KJ117);中央高校基本科研业务费专项资金(31220 ...
    本站小编 Free考研考试 2022-01-01
  • 基于维度分组降维的高维数据近似k近邻查询
    李松,胡晏铭,郝晓红,张丽平,郝忠孝(哈尔滨理工大学计算机科学与技术学院哈尔滨150080)(lisongbeifen@163.com)出版日期:2021-03-01基金资助:国家自然科学基金项目(61872105);黑龙江省自然科学基金项目(LH2020F047);黑龙江省留学归国人员科学基金项目 ...
    本站小编 Free考研考试 2022-01-01
  • 基于直方图的隐私键-值数据收集算法
    张啸剑1,徐雅鑫1,付楠1,孟小峰21(河南财经政法大学计算机与信息工程学院郑州450002);2(中国人民大学信息学院北京100872)(xjzhang82@ruc.edu.cn)出版日期:2021-03-01基金资助:国家自然科学基金项目(61502146,91646203,91746115,6 ...
    本站小编 Free考研考试 2022-01-01
  • 基于区块链的数据透明化:问题与挑战
    孟小峰1,刘立新1,21(中国人民大学信息学院北京100872);2(内蒙古科技大学信息工程学院内蒙古包头014010)(xfmeng@ruc.edu.cn)出版日期:2021-02-01基金资助:国家自然科学基金项目(91646203,61941121,61532010,91846204,6153 ...
    本站小编 Free考研考试 2022-01-01
  • 数据治理与数据透明专题前言
    孟小峰1,冯登国21(中国人民大学北京100872);2(中国科学院软件研究所北京100190)出版日期:2021-02-01Online:2021-02-01摘要/Abstract摘要:2020年4月,中共中央国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,提出要加快培育数据要素市场 ...
    本站小编 Free考研考试 2022-01-01
  • 基于社会新闻数据集的伦理行为判别方法
    古天龙1,冯旋1,李龙1,2,包旭光1,李云辉11(广西可信软件重点实验室(桂林电子科技大学)广西桂林541004);2(暨南大学信息科学技术学院/网络空间安全学院广州510632)(gu@guet.edu.cn)出版日期:2021-02-01基金资助:国家自然科学基金项目(U1711263,U18 ...
    本站小编 Free考研考试 2022-01-01
  • 基于多级网络编码的多副本云数据存储
    徐光伟,史春红,冯向阳,罗辛,石秀金,韩松桦,李玮(东华大学计算机科学与技术学院上海201620)(gwxu@dhu.edu.cn)出版日期:2021-02-01基金资助:国家自然科学基金项目(61772018,61772128);上海市自然科学基金项目(19ZR1402000,17ZR140020 ...
    本站小编 Free考研考试 2022-01-01
  • 大数据时代的存储系统与智能存储技术专题前言
    舒继1,王意洁2,吴晨涛31(清华大学北京100084);2(国防科技大学长沙410072);3(上海交通大学上海200240)出版日期:2021-02-01Online:2021-02-01摘要/Abstract摘要:随着大数据时代的到来,各领域的数据呈现出爆炸式增长态势,数据资源得到了各行各业的 ...
    本站小编 Free考研考试 2022-01-01
  • 面向跨数据中心网络的节点约束存储转发调度方法
    林霄1,姬硕1,岳胜男2,孙卫强2,胡卫生21(福州大学物理与信息工程学院福州350116);2(区域光纤通信网与新型光通信系统国家重点实验室(上海交通大学)上海200240)(linxiaocer@fzu.edu.cn)出版日期:2021-02-01基金资助:国家自然科学基金青年科学基金项目(61 ...
    本站小编 Free考研考试 2022-01-01
  • 基于蚁群优化算法的纠删码存储系统数据更新方案
    李乾,胡玉鹏,叶振宇,肖叶,秦拯(湖南大学信息科学与工程学院长沙410082)(qianli160@hnu.edu.cn)出版日期:2021-02-01基金资助:国家自然科学基金项目(61872130,61572181);湖南省交通厅科技项目(201928);长沙市重点研发计划项目(kq190710 ...
    本站小编 Free考研考试 2022-01-01