1(吉林财经大学管理科学与信息工程学院 长春 130117);2(吉林财经大学税务学院 长春 130117) (lyaihua1995@163.com)
出版日期:
2021-03-01基金资助:
国家社会科学基金项目(20BTJ062)Credit Fraud Detection for Extremely Imbalanced Data Based on Ensembled Deep Learning
Liu Ying1, Yang Ke21(School of Management Science and Information Engineering, Jilin University of Finance and Economics, Changchun 130117);2(School of Taxation, Jilin University of Finance and Economics, Changchun 130117)
Online:
2021-03-01Supported by:
This work was supported by the National Social Science Foundation of China (20BTJ062).摘要/Abstract
摘要: 信用欺诈数据分布极度不均衡时, 信息失真、周期性统计误差和报告偏倚所产生的噪声错误对训练模型干扰凸显, 且易产生过拟合现象.鉴于此, 提出一种深度信念神经网络集成算法来解决类极度不均衡的信用欺诈问题.首先, 提出双向联合采样算法克服信息缺失和过拟合问题; 然后, 构造2阶段基分类器簇, 针对支持向量机(support vector machine, SVM)对不均衡数据分布所表现的分类超平面向少数类偏移问题, 利用增强(boosting)算法生成SVM与随机森林(random forest, RF)结合的基分类器簇; 利用深度信念网络(deep belief network, DBN)整合基分类器簇的多元预测, 输出分类结果.考虑传统精度评价指标过度关注多数类样本, 忽视信用欺诈存在违约损失高于利息收益事实, 引入成本-效益指数兼顾正类和负类样本的识别能力, 提高模型对少数类样本预测精度.通过对欧洲信用卡欺诈数据检测发现, 相比于其他相关算法成本-效益指数均值提高3个百分点, 同时, 实验比较样本不均衡比例对算法精度影响, 结果表明在处理极端不均衡数据时所提算法效果更优.
参考文献
相关文章 15
[1] | 陈善静, 向朝参, 康青, 吴韬, 刘凯, 冯亮, 邓涛. 基于多源遥感时空谱特征融合的滑坡灾害检测方法[J]. 计算机研究与发展, 2020, 57(9): 1877-1887. |
[2] | 王婕婷, 钱宇华, 李飞江, 刘郭庆. 消除随机一致性的支持向量机分类方法[J]. 计算机研究与发展, 2020, 57(8): 1581-1593. |
[3] | 肖珂,戴舜,何云华,孙利民. 基于城市监控的自然场景图像的中文文本提取方法[J]. 计算机研究与发展, 2019, 56(7): 1525-1533. |
[4] | 倪明涛,赵波,吴福生,樊佩茹. CREBAD:基于芯片辐射的物联网设备异常检测方案[J]. 计算机研究与发展, 2018, 55(7): 1451-1461. |
[5] | 周宇航,周志华. 代价敏感大间隔分布学习机[J]. 计算机研究与发展, 2016, 53(9): 1964-1970. |
[6] | 冯昌,廖士中. 随机傅里叶特征空间中高斯核支持向量机模型选择[J]. 计算机研究与发展, 2016, 53(9): 1971-1978. |
[7] | 陈忆群,周如旗,朱蔚恒,李梦婷,印鉴. 挖掘专利知识实现关键词自动抽取[J]. 计算机研究与发展, 2016, 53(8): 1740-1752. |
[8] | 何文斌,刘群锋,熊金志. 支持向量机多项式光滑函数的误差理论研究[J]. 计算机研究与发展, 2016, 53(7): 1576-1585. |
[9] | 董爱美,毕安琪,王士同. 基于迁移共享空间的分类新算法[J]. 计算机研究与发展, 2016, 53(3): 632-643. |
[10] | 甘丽新,万常选,刘德喜,钟青,江腾蛟. 基于句法语义特征的中文实体关系抽取[J]. 计算机研究与发展, 2016, 53(2): 284-302. |
[11] | 张虎,谭红叶,钱宇华,李茹,陈千. 基于集成学习的中文文本欺骗检测研究[J]. 计算机研究与发展, 2015, 52(5): 1005-1013. |
[12] | 李涛,刘学臣,张帅,王恺,杨愚鲁. 基于混合编程模型的支持向量机训练并行化[J]. 计算机研究与发展, 2015, 52(5): 1098-1108. |
[13] | 陈耀东,李仁发. 一种层次化的联合识别模型[J]. 计算机研究与发展, 2015, 52(11): 2431-2440. |
[14] | 刘金宝,盛达魁,张铭. 微博自媒体账号识别研究[J]. 计算机研究与发展, 2015, 52(11): 2527-2534. |
[15] | 花小朋, 丁世飞,. 局部保持对支持向量机[J]. 计算机研究与发展, 2014, 51(3): 590-597. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4385