删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

不平衡数据的关键因素筛选方法

本站小编 Free考研/2020-04-17

文献详情
不平衡数据的关键因素筛选方法
外文标题:Research on Variable Selection Methods of Imbalanced Data
文献类型:期刊
期刊名称:世界科学技术-中医药现代化
年:2019
卷:21
期:3
页码:389-394
ISSN:1674-3849
关键词:不平衡数据;SMOTE抽样;预测阈值;成组;Lasso
所属部门:统计学院
链接地址:http://d.oldg.wanfangdata.com.cn/Periodical_sjkxjs-zyxdh201903011.aspx
摘要:数据不平衡问题的存在,使得模型倾向于将测试样本判别为多数类,导致少数类的分类效果较差.可以从数据和算法两个角度解决数据不平衡带来的问题,本研究主要关注关键因素筛选时不平衡问题的处理,在数据层面使用基于SMOTE抽样的Group Lasso,算法层面使用了调节阈值的Group Lasso,包括分步调节参数和同时调节参数两种方法.最后在307例亚健康患者的问卷数据上使用三种方法建立“肝郁脾虚”诊断模型.从得到的结果来看,基于SMOTE的方法和同时调参的方法得到模型预测效果在灵敏度和特异度上较好.
DOI:10.11842/wst.2019.03.009
百度学术:不平衡数据的关键因素筛选方法
语言:中文
人气指数:1
浏览次数:1
作者其他论文



真实世界2型糖尿病使用参芎葡萄糖注射液的联合用药特征分析.高风, 谢雁鸣, 刘峘, et al. .中华中医药学刊. 2018, 2865-2869.
真实世界中参芎葡萄糖注射液治疗脊柱疾病的临床联合用药特征分析.陈冠敏, 谢雁鸣, 刘峘, et al. .世界中西医结合杂志. 2019, 14(2), 176-181.
我国首位有重大国际影响的统计学家:吴定良.袁卫, 李扬,.兰州财经大学学报. 2019, 35(5), 1-6.
脉血康胶囊治疗肾病中药联合用药特征的真实世界研究.吕健, 谢雁鸣, 王志飞, et al. .中国中药杂志. 2019, 44(8), 1668-1673.
基于医院信息系统的清开灵注射液治疗缺血性脑血管疾病的真实世界疗效分析.郝璐, 谢雁鸣, 章轶立, et al. .中医杂志. 2019, 60(13), 1123-1128.

相关话题/数据 中医药