删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

一种小样本数据的特征选择方法

本站小编 Free考研考试/2022-01-01

许行1,张凯1,王文剑1,2
1(山西大学计算机与信息技术学院 太原 030006);2(计算智能与中文信息处理教育部重点实验室(山西大学) 太原 030006) (xuh102@126.com)
出版日期: 2018-10-01


基金资助:国家自然科学基金项目(61673249);山西省回国留学人员科研基金项目(2016-004);赛尔网络下一代互联网技术创新项目(NGII20170601)

A Feature Selection Method for Small Samples

Xu Hang1, Zhang Kai1, Wang Wenjian1,2
1(School of Computer and Information Technology, Shanxi University, Taiyuan 030006);2(Key Laboratory of Computational Intelligence and Chinese Information Processing(Shanxi University), Ministry of Education,Taiyuan 030006)
Online: 2018-10-01







摘要/Abstract


摘要: 小样本数据由于其特征维数相对于样本数目较多,且常包含不相关或冗余特征,使得常用的机器学习算法处理小样本数据时无法得到好的效果,通过特征选择来降低数据维数是解决该问题的一种有效途径.针对小样本数据,提出一种基于互信息的过滤型特征选择方法,首先定义了基于互信息的特征分组标准,该标准同时考虑特征与类别的相关性和不同特征之间的冗余性,根据该标准对特征分组后,在各组内选出与类别相关性最大的特征构成候选特征子集,保证了算法具有较低的时间复杂度,之后采用Boruta算法,在候选特征子集中自动确定最佳特征子集,从而大幅度降低数据的维数.通过与5种经典的特征选择算法比较,在标准数据集上采用3种分类器的实验结果表明提出的方法选出的特征子集具有较好的运行效率和分类性能.






[1]刘艳芳, 李文斌, 高阳. 基于自适应邻域嵌入的无监督特征选择算法[J]. 计算机研究与发展, 2020, 57(8): 1639-1649.
[2]郭亚庆,王文剑,苏美红. 一种针对异常点的自适应回归特征选择方法[J]. 计算机研究与发展, 2019, 56(8): 1695-1707.
[3]闫小强,叶阳东. 共享和私有信息最大化的跨媒体聚类[J]. 计算机研究与发展, 2019, 56(7): 1370-1382.
[4]綦小龙,高阳,王皓,宋蓓,周春蕾,张友卫. 一种可度量的贝叶斯网络结构学习方法[J]. 计算机研究与发展, 2018, 55(8): 1717-1725.
[5]王玲,孟建瑶. 基于特征变权的动态模糊特征选择算法[J]. 计算机研究与发展, 2018, 55(5): 893-907.
[6]姚晟,徐风,赵鹏,纪霞. 基于自适应邻域空间粗糙集模型的直觉模糊熵特征选择[J]. 计算机研究与发展, 2018, 55(4): 802-814.
[7]李峰,苗夺谦,张志飞,张维. 基于互信息的粒化特征加权多标签学习k近邻算法[J]. 计算机研究与发展, 2017, 54(5): 1024-1035.
[8]王珺,卫金茂,张璐. 基于保留分类信息的多任务特征学习算法[J]. 计算机研究与发展, 2017, 54(3): 537-548.
[9]董红斌,滕旭阳,杨雪. 一种基于关联信息熵度量的特征选择方法[J]. 计算机研究与发展, 2016, 53(8): 1684-1695.
[10]常青,刘中金,王猛涛,陈昱,石志强,孙利民. VDNS: 一种跨平台的固件漏洞关联算法[J]. 计算机研究与发展, 2016, 53(10): 2288-2298.
[11]杨昙,冯翔,虞慧群. 基于多群体公平模型的特征选择算法[J]. 计算机研究与发展, 2015, 52(8): 1742-1756.
[12]唐成华,刘鹏程,汤申生,谢逸. 基于特征选择的模糊聚类异常入侵行为检测[J]. 计算机研究与发展, 2015, 52(3): 718-728.
[13]段洁,胡清华,张灵均,钱宇华,李德玉. 基于邻域粗糙集的多标记分类特征选择算法[J]. 计算机研究与发展, 2015, 52(1): 56-65.
[14]张 维,苗夺谦,高 灿,岳晓冬. 邻域粗糙协同分类模型[J]. 计算机研究与发展, 2014, 51(8): 1811-1820.
[15]邓红霞, 相 洁, 游 雅, 李海芳,. 基于fMRI的思维数据分析方法研究[J]. 计算机研究与发展, 2014, 51(4): 773-780.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3799
相关话题/计算机 数据 信息 山西大学 网络

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 面向时序数据异常检测的可视分析综述
    韩东明,郭方舟,潘嘉铖,郑文庭,陈为(CAD&CG国家重点实验室(浙江大学)杭州310058)(dongminghan@zju.edu.cn)出版日期:2018-09-01基金资助:国家重点研发计划项目(2018YFB0904503);国家九七三重点基础研究发展计划基金项 ...
    本站小编 Free考研考试 2022-01-01
  • 大规模时序图数据的查询处理与挖掘技术综述
    王一舒1,袁野1,刘萌1,王国仁21(东北大学计算机科学与工程学院沈阳110004);2(北京理工大学计算机学院北京100081)(yishuwang@stumail.neu.edu.cn)出版日期:2018-09-01基金资助:国家自然科学基金优秀青年科学基金项目(61622202);国家自然科学 ...
    本站小编 Free考研考试 2022-01-01
  • 深度神经网络压缩与加速综述
    纪荣嵘1,2,林绍辉1,2,晁飞1,吴永坚3,黄飞跃31(厦门大学信息科学与技术学院福建厦门361005);2(福建省智慧城市感知与计算重点实验室(厦门大学)福建厦门361005);3(上海腾讯科技有限公司优图实验室上海200233)(rrji@xmu.edu.cn)出版日期:2018-09-01基 ...
    本站小编 Free考研考试 2022-01-01
  • 区块链数据分析:现状、趋势与挑战
    陈伟利,郑子彬(中山大学数据科学与计算机学院广州510006)(国家数字家庭工程技术研究中心(中山大学)广州510006)(chenwli9@mail2.sysu.edu.cn)出版日期:2018-09-01基金资助:国家重点研发计划项目(2016YFB1000101);国家自然科学基金优秀青年科学 ...
    本站小编 Free考研考试 2022-01-01
  • 数据中心网络流调度技术前沿进展
    胡智尧,李东升,李紫阳(并行与分布处理国家重点实验室(国防科技大学)长沙410073)(国防科技大学计算机学院长沙410073)(huzhiyao14@nudt.edu.cn)出版日期:2018-09-01基金资助:国家自然科学基金优秀青年科学基金项目(61222205)Thisworkwassup ...
    本站小编 Free考研考试 2022-01-01
  • 2018数据挖掘前沿进展专题前言
    尹义龙1,钱宇华21(山东大学软件学院);2(山西大学)出版日期:2018-08-01Online:2018-08-01摘要/Abstract摘要:在当前大数据时代,海量数据的挖掘和分析尤为重要,数据挖掘技术在媒体、金融、医疗、交通、电商等领域都取得了广泛的应用。但是,大数据的复杂多样性以及数据挖掘 ...
    本站小编 Free考研考试 2022-01-01
  • 基于网络节点中心性度量的重叠社区发现算法
    杜航原1,王文剑2,白亮21(山西大学计算机与信息技术学院太原030006);2(计算智能与中文信息处理教育部重点实验室(山西大学)太原030006)(duhangyuan@sxu.edu.cn)出版日期:2018-08-01基金资助:国家自然科学基金项目(61673295,61773247);山西 ...
    本站小编 Free考研考试 2022-01-01
  • 变熵画像:一种数量级压缩物端数据的多粒度信息模型
    朝鲁1,2,3,彭晓晖1,徐志伟11(中国科学院计算技术研究所北京100190);2(中国科学院大学北京100049);3(智能处理器研究中心(中国科学院计算技术研究所)北京100190)(chaolu@ict.ac.cn)出版日期:2018-08-01基金资助:国家自然科学基金重点项目(61532 ...
    本站小编 Free考研考试 2022-01-01
  • 基于卷积神经网络的左右眼识别
    钟志权1,2,袁进3,唐晓颖41(广东顺德中山大学卡内基梅隆大学国际联合研究院广东顺德528300);2(中山大学电子与信息工程学院广州510006);3(眼科学国家重点实验室(中山大学)广州510060);4(南方科技大学电子与电气工程系广东深圳518055)(zhongzhq9@mail2.sy ...
    本站小编 Free考研考试 2022-01-01
  • 一种最大置信上界经验采样的深度Q网络方法
    朱斐1,2,3,吴文1,刘全1,3,伏玉琛1,41(苏州大学计算机科学与技术学院江苏苏州215006);2(江苏省计算机信息处理技术重点实验室(苏州大学)江苏苏州215006);3(符号计算与知识工程教育部重点实验室(吉林大学)长春130012);4(常熟理工学院计算机科学与工程学院江苏常熟2155 ...
    本站小编 Free考研考试 2022-01-01