一种类内方差与相关度结合的特征选择算法
张晓光1,2, 孙正3, 徐桂云1, 阮殿旭1
1.中国矿业大学机电工程学院;2.哈尔滨工业大学现代焊接生产技术国家重点实验室;3.枣庄学院物理与电子工程系
摘要:
为了解决现有特征选择算法没有同时考虑特征之间以及特征与类别之间的相关性,且存在计算量大、适用范围窄等问题,从均方误差最小的分类训练准则出发,并借鉴线性鉴别分析的思想,提出了一种类内方差与相关度结合的特征选择算法,并使用核方法将其推广到可以解决非线性分类的特征选择问题.该算法不仅同时考虑了样本特征之间以及特征与分类标号之间的相关性,而且使得类内方差最小,有效地提高了分类器的性能.仿真实验表明:该算法适用于对特征数量多、特征相关性强的数据集进行特征选择,其选择的特征子集能够显著提高分类精度,具有较大的优越性.
关键词: 类内方差 相关度 特征选择 LDA 分类
DOI:10.11918/j.issn.0367-6234.2011.03.027
分类号:TP301.6
基金项目:现代焊接生产技术国家重点实验室开放课题研究基金资助;江苏省高技术研究资助项目(BG2007013)
A feature selection algorithm combining within-class variance with correlation measure
ZHANG Xiao-guang1,2, SUN Zheng3, XU Gui-yun1, RUAN Dian-xu1
1.College of Mechanical and Electrical Engineering,China University of Mining and Technology,221116 Xuzhou,China;2.State Key Lab of Advanced Welding Production Technology,Harbin Institute of Technology,150001 Harbin,China;3.Physics & Electronics Engineering Department,Zaozhang University,277160 Zaozhuang,Shandong,China)
Abstract:
To solve the problems of large calculation and narrow application scope of present feature selection algorithms which do not take the correlation among sample features and that between sample features and classification labels into account,a feature selection algorithm combining within-class variance with correlation measure was proposed based on the principle of the minimum mean square error for classifier and the idea of linear discrimination analysis,then the algorithm was expanded to solve nonlinear feature selection problems by using kernel technology.The proposed algorithm can not only consider both the correlation among the features and that between the features and classification labels,but also minimize the within-class variance,effectively improving the generalization performance of classifier.The experimental results show that the proposed algorithm can be used to select important features from these data sets with numbers of correlation characteristics,and effectively improves the classification accuracy.
Key words: within-class variance correlation measure feature selection LDA classification
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
一种类内方差与相关度结合的特征选择算法
本站小编 哈尔滨工业大学/2019-10-24
相关话题/实验 数据 物理 哈尔滨工业大学 机电工程学院
基于问题导向的生物信息学综合实验教学设计
基于问题导向的生物信息学综合实验教学设计霍颖异1,2,徐程2,吴敏1,2,陈铭2(1.浙江大学国家级生物实验教学示范中心,杭州310058;2.浙江大学生命科学学院,杭州310058)摘要:针对生物信息学相关课程的实验教学需求,结合前沿科研问题和成果,设计了基于问题导向的生物信息学综合实验。实验以宏 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05电极丝前置式射流电解加工仿真及初步实验研究
电极丝前置式射流电解加工仿真及初步实验研究李飘庭1,2,荆奇1,3,张勇斌1,李建1,傅波2(1.中国工程物理研究院机械制造工艺研究所,四川绵阳621900;2.四川大学机械工程学院,成都610065;3.复旦大学光科学与工程系,上海200438)摘要:射流电解加工技术在航天、仪器、电子和医疗设备等 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05桥梁伸缩缝跳车冲击荷载计算方法与模型实验
桥梁伸缩缝跳车冲击荷载计算方法与模型实验丁勇1,2,王佩1,游玖昂1,诸葛萍1(1.宁波大学土木工程系,浙江宁波315211;2.桥梁工程结构动力学国家重点实验室(重庆交通科研设计院),重庆400067)摘要:为实测移动车辆对桥梁伸缩缝的冲击荷载,防止桥梁伸缩缝在这种冲击荷载作用下发生早期损坏,制作 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05大气感应耦合等离子体炬管的设计与仿真实验
大气感应耦合等离子体炬管的设计与仿真实验余德平1,吴杰1,2,涂军1,张仕杨2,辛强2,万勇建2(1.四川大学机械工程学院,成都610065;2.中国科学院光电技术研究所,成都610209)摘要:为提高大气感应耦合等离子体射流加工装置的工作稳定性,设计一种依靠单一零件定位各层介质管的分体式炬管,并研 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05边界数据浸入法在弱可压缩流动中的应用
边界数据浸入法在弱可压缩流动中的应用赵体豪1,赵欣2(1.北京理工大学机械与车辆学院,北京100081;2.北京理工大学宇航学院,北京100081)摘要:受限于计算机的计算能力与计算的成本,实际的计算过程中,往往要对流体做出一些物理假设,如无粘流体、不可压缩流体等,但是这将给计算带来不同程度的误差. ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05分段自适应阈值小波的地铁塞拉门数据压缩方法
分段自适应阈值小波的地铁塞拉门数据压缩方法李城汐,蒋启龙,陆凡,刘东(西南交通大学电气工程学院,成都610000)摘要:针对地铁塞拉门进行PHM应用诊断时产生海量数据的压缩问题,提出一种基于分段自适应阈值的小波压缩算法,通过原始数据的自适应分段和自动调节各段阈值放大系数,实现了兼顾精度和大压缩比的数 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05社会物理学视角下的网络群体行为选择机理
社会物理学视角下的网络群体行为选择机理田贝达1,闫相斌2,王兆天3(1.哈尔滨工业大学经济与管理学院,哈尔滨150001;2.北京科技大学东凌经济管理学院,北京100083;3.哈尔滨理工大学电气与电子工程学院,哈尔滨150080)摘要:为研究当今社会网络群体行为选择的影响因素及演化机理,本文根据网 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2019-10-24Zr41Ti14Ni12.5Cu10Be22.5非晶合金冲击压缩行为理论与实验研究
Zr41Ti14Ni12.5Cu10Be22.5非晶合金冲击压缩行为理论与实验研究张云峰1,罗兴柏1,孙华刚2,施冬梅1,张玉令1,刘国庆1(1.陆军工程大学,石家庄050000;2.陆军装备研究院,石家庄050000)摘要:为研究Zr41Ti14Ni12.5Cu10Be22.5非晶合金的冲击压缩响 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2019-10-24有挠性驱动单元的双足机器人研制与步行实验
有挠性驱动单元的双足机器人研制与步行实验侯月阳,吴伟国,高力扬(哈尔滨工业大学机电工程学院,150001哈尔滨)摘要:为减缓机器人脚底冲击,设计、研制带有挠性驱动的10自由度仿人双足机器人,该机器人髋关节俯仰关节由FDU-II型挠性驱动单元驱动;搭建FDUBR-I型仿人双足机器人控制系统硬件和软件, ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2019-10-24虚拟时间及其在数据竞争检测中的应用
虚拟时间及其在数据竞争检测中的应用禹振,苏小红,王甜甜,马培军(哈尔滨工业大学计算机科学与技术学院,150001哈尔滨)摘要:为将虚拟时间机制应用于数据竞争检测,提出描述虚拟时间3种基本实现形式的统一模型.先建立分布式执行的抽象模型,在此模型下统一描述虚拟时间的3种基本实现形式,即标量时间系统、向量 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2019-10-24