摘要本文主要研究正态混合模型的贝叶斯分类方法.贝叶斯分类以后验概率最大为准则,后验概率需要估计相关的条件分布.对于连续型数据的分类,其数据由多个类别混合而成,仅用单一分布难以描述,此时混合模型是一个较好的选择,并且可由EM算法获得.模拟实验表明,基于正态混合模型的贝叶斯分类方法是可行有效的.对于特征较多的分类,不同特征对分类的影响不同,本文对每个特征应用基于正态混合模型的贝叶斯分类方法构建基本分类器,然后结合集成学习,用AdaBoost算法赋予每个分类器权重,再线性组合它们得到最终分类器.通过UCI数据库中实际的Wine Data Set验证表明,本文分类方法与集成学习的结合可以得到高准确率和稳定的分类. | | 服务 | | ![](http://123.57.41.99/jweb_yysxxb/images/arrow.jpg) | 加入引用管理器 | ![](http://123.57.41.99/jweb_yysxxb/images/arrow.jpg) | E-mail Alert | ![](http://123.57.41.99/jweb_yysxxb/images/arrow.jpg) | RSS | 收稿日期: 2017-05-10 | | 基金资助:国家自然科学基金面上项目(No.11971362),国家自然科学基金青年项目(No.11901581),中南财经政法大学中央高校基本科研业务费专项资金(No.2722020JCG064)资助. |
[1] | Breiman L. Random forests. Machine Learning, 2001, 45(1):5-32 | [2] | Xu B, Huang J, Williams G, Wang Q, Ye Y. Classifying very high-dimensional data with random forests built from small subspaces. International Journal of Data Warehousing and Ming, 2012, 8(2):44-63 | [3] | Féraud R, Clérot F. A methodology to explain neural network classification. Neural Networks the Official Journal of the International Neural Network Society, 2002, 15(2):237-246 | [4] | Zhang G. Neural networks for classification:a survey. IEEE Transactions on Systems Man & Cybernetics Part C, 2000, 30(4):451-462 | [5] | Burges J. A tutorial on support vector machines for pattern recognition. Data Mining and Knowledge Discovery, 1998, 2(2):121-167 | [6] | Cristianini N, Shawe-Taylor J. An introduction to support vector machines and other kerner-based learning methods. Cambridge:Cambridge University Press, 2000 | [7] | Hastie T, Tibshirani R, Friedman J. The elements of statistical learning:data ming, inference and prediction. New York:Springer-Verlag, 2001 | [8] | Mujalli R, López G, Garach L. Bayes classifiers for imbalanced traffic accidents datasets. Accident Analysis & Prevention, 2016, 88:37-51 | [9] | Nunzio G. A new decision to take for cost-sensitive Naïve Bayes classifiers. Information Processing & Management, 2014, 50(5):653-674 | [10] | Figueiredo M, Jain A. Unsupervised learning of finite mixture models. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2002, 24(3):381-396 | [11] | Thijs H, Molenberghs G, Michiels B, et al. Strategies to fit pattern-mixture models. Biostatistics, 2002, 3(2):245-265 | [12] | Chen J, Khalili A. Order selection in finite mixture models with a nonsmooth penalty. Journal of the American Statistical Association, 2008, 103(485):1674-1683 | [13] | Dempster A, Laird N, Rubin D. Maximum likelihood from imcomplete data via the EM algorithm. Journal of the Royal Statistical Society, Series B, 1977, 39(1):1-38 | [14] | Ranjan R, Huang B, Fatehi A. Robust Gaussian process modeling using EM algorithm. Journal of Process Control, 2016, 42:125-136 | [15] | Kadir S, Goodman D, Harris K. High-dimensional cluster analysis with the masked EM algorithm. Neural Computation, 2014, 26(11):2379-2394 | [16] | Friedman J. Greedy function approximation:a gradient boosting machine. Annals of Statistics, 2001, 29(5):1189-1232 | [17] | Friedman J, Hastie T, Tibshirani R. Additive logistic regression:a statistical view of boosting. Annals of Statistics, 2000, 28(2):337-407 | [18] | Freund Y, Schapire R. A short introduction to boosting. Journal of Japanese Society for Artificial Intelligence, 1999, 14(5):771-780 | [19] | Webb G, Zheng Z. Multistrategy ensemble learning:reducing error by combining ensemble learning techniques. IEEE Transactions on Knowledge & Data Engineering, 2004, 16(8):980-991 | [20] | Freund Y, Schapire R. A decision-theoretic generalization of on-line learning and an application to boosting. Journal of Computer and System Science, 1997, 55(1):119-139 | [21] | Schapire R, Singer Y. Improved boosting algorithms using confidence-rate predictions. Machine Learning, 1999, 37(3):197-336 | [22] | Zhu J, Zou H, Rosset S, Hastie T. Multi-class adaboost. Statistics & Its Interface, 2009, 2(3):349-360 | [23] | Wu C. On the convergence properties of the EM algorithm. The Annals of Statistics, 1983, 11(1):95-103 |
PDF全文下载地址:
http://123.57.41.99/jweb_yysxxb/CN/article/downloadArticleFile.do?attachType=PDF&id=14799
基于Hadamard算子的二维离散量子行走的概率测度估计韩琦,陈芷禾,殷世德,陆自强西北师范大学数学与统计学院,兰州730070EstimationofProbabilityMeasurefor2-DDiscreteQuantumWalkBasedonHadamardOperatorHANQi,CH ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27病例-队列设计下长度偏差数据的比例均值剩余寿命模型的统计推断徐达1,周勇2,31.上海财经大学统计与管理学院,上海200082;2.华东师范大学经管学部交叉科学研究院及统计学院,上海200241;3.中国科学院数学与系统科学研究院,北京100190ProportionalMeanResidualLi ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27相依随机保费风险模型的有限时间破产概率毕秀春1,张曙光21.安徽财经大学统计与应用数学学院,蚌埠233030;2.中国科学技术大学统计与金融系,合肥230026TheFinite-timeRuinProbabilityinaDependentRandomPremiumRatesRiskModelBI ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27失效原因缺失的加速失效时间模型下竞争风险数据的半参数估计何其祥1,2,林仁鑫31.上海财经大学数学学院,上海200433;2.上海财经大学浙江学院,金华321013;3.中国诺华生物医药研究院有限公司生物统计部,上海201203SemiparametricAnalysisforCompetingRi ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27基于右删失宽相依数据的Kaplan-Meier估计和风险率估计的渐近性质李永明1,2,周勇31上海财经大学统计与管理学院,上海200433;2上饶师范学院数学与计算机科学学院,上饶334001;3华东师范大学经济与管理学部,上海200062AsymptoticPropertiesoftheKapla ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27Case-cohort设计下多类型事件数据的一类有效估计刘君娥1,周洁21.淮北师范大学管理学院,淮北235000;2.首都师范大学数学科学学院,北京100048AnEffectiveEstimatingforCase-cohortDesignswithMultipleTypeEventDataLI ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27SEVIS方法的局部线性估计及其在超高维数据下的应用连亦旻1,陈钊2,舒明良31.中国科学技术大学统计与金融系,合肥230026;2.DepartmentofStatistics,PennsylvaniaStateUniversity,StateCollege,USA,PA16802;3.中国科学院 ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27带信息终止事件的复发事件数据的联合建模分析曹学锋1,曲连强21.黄冈师范学院数学系,黄冈438000;2.华中师范大学数学与统计学学院,武汉430079JointModelingAnalysisofRecurrentEventDatawithInformationTerminalEventCAOXu ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27带固定效应面板数据空间误差模型的分位回归估计戴晓文1,晏振2,田茂再1,3,41.中国人民大学应用统计科学研究中心,中国人民大学统计学院,北京100872;2.广西师范大学数学与统计学院,桂林541004;3.兰州财经大学统计学院,兰州730020;4.新疆财经大学统计与信息学院,乌鲁木齐83000 ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27多类型复发事件数据下一类Box-Cox转移模型郦博文1,张海祥21.中国科学技术大学统计与金融系,合肥230026;2.中国科学院数学与系统科学研究院,北京100190AClassofBox-CoxTransformationModelsforMultipleTypeRecurrentEventDa ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27
|