删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

一种基于广义极值分布的非平衡数据分类算法

本站小编 Free考研考试/2022-01-01

付俊杰,刘功申
(School of Electronic Information and Electrical Engineering, Shanghai Jiao Tong University, Shanghai 200240)
出版日期: 2018-11-01


基金资助:国家“九七三”重点基础研究发展计划基金项目(2013CB329603);国家自然科学基金项目(61472248,61772337)

A GEV-Based Classification Algorithm for Imbalanced Data

Fu Junjie, Liu Gongshen
(上海交通大学电子信息与电气工程学院 上海 200240) (tianzhiyinyi@sjtu.edu.cn)
Online: 2018-11-01







摘要/Abstract


摘要: 在许多业务应用中,非平衡数据分类问题都会频繁出现,然而这个问题仍未得到很好的解决.除了直接预测数据对应的分类标签,许多应用还可能关心这个预测的准确性有多少.然而,已有的许多研究都主要集中在分类准确度上而忽略分类概率预测值的准确度.为了解决这个问题,提出了一种新的线性回归算法,该算法在广义线性模型的框架下,结合广义极值(generalized extreme value, GEV)分布作为链接函数以及校准损失函数作为目标优化函数,形成凸优化问题,利用广义极值分布的非对称性解决非平衡数据分类问题.另外,由于广义极值分布的形状参数对建模精度有较大影响,还提出了2种参数寻优方法.在实验部分,人工数据集和真实数据集均表明所提算法有着优异的分类性能以及准确的分类概率预测.






[1]王继娜, 陈军华, 高建华. 基于排序损失的ECC多标签代码异味检测方法[J]. 计算机研究与发展, 2021, 58(1): 178-188.
[2]王婕婷, 钱宇华, 李飞江, 刘郭庆. 消除随机一致性的支持向量机分类方法[J]. 计算机研究与发展, 2020, 57(8): 1581-1593.
[3]鞠卓亚, 王志海. 基于选择性模式的贝叶斯分类算法[J]. 计算机研究与发展, 2020, 57(8): 1605-1616.
[4]邢新颖, 冀俊忠, 姚垚. 基于自适应多任务卷积神经网络的脑网络分类方法[J]. 计算机研究与发展, 2020, 57(7): 1449-1459.
[5]刘烨, 黄金筱, 马于涛. 基于混合神经网络和注意力机制的软件缺陷自动分派方法[J]. 计算机研究与发展, 2020, 57(3): 461-473.
[6]沈明珠, 刘辉. 面向技术论坛的问题解答状态预测[J]. 计算机研究与发展, 2020, 57(3): 474-486.
[7]程光, 钱德鑫, 郭建伟, 史海滨, 吴桦, 赵玉宇. 基于散度的网络流概念漂移分类方法[J]. 计算机研究与发展, 2020, 57(12): 2673-2682.
[8]张晨童, 张佳影, 张知行, 阮彤, 何萍, 葛小玲. 融合常用语的大规模疾病术语图谱构建[J]. 计算机研究与发展, 2020, 57(11): 2467-2477.
[9]宋珂慧,张莹,张江伟,袁晓洁. 基于生成式对抗网络的结构化数据表生成模型[J]. 计算机研究与发展, 2019, 56(9): 1832-1842.
[10]张佳影,王祺,张知行,阮彤,张欢欢,何萍. 区域医疗健康平台中检验检查指标的标准化算法[J]. 计算机研究与发展, 2019, 56(9): 1897-1906.
[11]任婕,侯博建,姜远. 多示例学习下的深度森林架构[J]. 计算机研究与发展, 2019, 56(8): 1670-1676.
[12]苏锦钿,欧阳志凡,余珊珊. 基于依存树及距离注意力的句子属性情感分类[J]. 计算机研究与发展, 2019, 56(8): 1731-1745.
[13]张志昌,张珍文,张治满. 基于IndRNN-Attention的用户意图分类[J]. 计算机研究与发展, 2019, 56(7): 1517-1524.
[14]彭成维,云晓春,张永铮,李书豪. 一种基于域名请求伴随关系的恶意域名检测方法[J]. 计算机研究与发展, 2019, 56(6): 1263-1274.
[15]刘琳,唐麟,唐明靖,周维. 基于布尔矩阵分解的蛋白质功能预测框架[J]. 计算机研究与发展, 2019, 56(5): 1020-1033.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3804
相关话题/计算机 数据 网络 优化 概率