摘要本文主要研究分组数据分位数回归模型的变量选择和估计问题.为了充分反映数据的分组信息,需要假定每组数据的回归系数可以分解成共性部分和分组后的个性部分.为了进行变量筛选,本文提出分解系数的Lasso估计,并进一步提出了自适应Lasso估计.在处理相应优化问题时,采用了变换观测矩阵的方法简化问题求解.本文给出了自适应Lasso估计的Oracle性质证明,并且通过数值模拟研究展示了所提方法的有限样本表现.最后,将此方法应用到乳腺浸润癌致病基因的变量筛选上来展示所提方法的实际应用表现. | | 服务 | | | 加入引用管理器 | | E-mail Alert | | RSS | 收稿日期: 2020-02-25 | | 基金资助:国家自然科学基金(11801316,11971116),山东省社科规划项目(19BYSJ23,20DTJJ02)资助项目,山东省研究生教育创新项目优质课程《中级计量经济学》(SDYKC18038). |
引用本文: | 刘栋, 杨冬梅, 何勇, 张新生. 分组数据分位数回归模型的变量选择和估计[J]. 应用数学学报, 2021, 44(5): 722-739. LIU Dong, YANG Dongmei, HE Yong, HE Yong. Variable Selection and Estimation of Quantile Regression Model for Stratified Data. Acta Mathematicae Applicatae Sinica, 2021, 44(5): 722-739. | | | | 链接本文: | http://123.57.41.99/jweb_yysxxb/CN/或 http://123.57.41.99/jweb_yysxxb/CN/Y2021/V44/I5/722 |
[1] | Tibshirani R. Regression shrinkage and selection via the lasso. J. R. Stat. Soc. Ser. B. Stat. Methodol, 1996, 58:267-288 | [2] | Li G, Lai P, Lian H. Variable selection and estimation for partially linear single-index models with longitudinal data. Stat. Comput, 2015, 25(3):579-593 | [3] | Li G, Peng H, Zhu L. Nonconcave penalized M-estimation with a diverging number of parameters. Statist. Sinica, 2011, 21(1):391-419 | [4] | Fan J, Li R. Variable selection via nonconcave penalized likelihood and its oracle properties. J. Amer. Statist. Assoc., 2001, 96(456):1348-1360 | [5] | Zou H. The adaptive lasso and its oracle properties. J. Amer. Statist. Assoc., 2006, 101(476):1418-1429 | [6] | Koenker R, Bassett G. Regression quantiles. Econometrica, 1978, 46(1):33-50 | [7] | Zhang L, Wang H J, Zhu Z. Testing for change points due to a covariate threshold in quantile regression. Statist. Sinica, 2014, 24(4):1859-1877 | [8] | Zhang L, Wang H J, Zhu Z. Composite change point estimation for bent line quantile regression. Ann. Inst. Statist. Math., 2017, 69(1):145-168 | [9] | Li Y, Zhu J L 1-norm quantile regression. J. Comput. Graph. Statist., 2008, 17(1):163-185 | [10] | Wang H, Li G, Jiang G. Robust regression shrinkage and consistent variable selection through the LAD-Lasso. J. Bus. Econom. Statist, 2007, 25(3):347-355 | [11] | Wu Y, Liu Y. Variable selection in quantile regression. Statist. Sinica, 2009, 19(2):801 | [12] | Yuan M, Lin Y. Model selection and estimation in regression with grouped variables. J.R. Stat. Soc. Ser. B. Stat. Methodol., 2006, 68(1):49-67 | [13] | Simon N, Friedman J, Hastie T, et al. A sparse-group lasso. J. Comput. Graph. Statist, 2013, 22(2):231-245 | [14] | Voduc K. Breast cancer subtypes and the risk of local and regional relapse. J. Clin. Oncol., 2010, 28(3):302-304 | [15] | Gertheiss J, Tutz G. Sparse modeling of categorial explanatory variables. Ann. Appl. Stat., 2010, 4(4):2150-2180 | [16] | Ollier E, Viallon V. Regression modelling on stratified data with the lasso. Biometrika, 2017, 104(1):83-96 | [17] | Knight K, Fu W. Asymptotics for lasso-type estimators. Annals of Statistics, 2000, 28(5):1356-1378 | [18] | Pollard D. Asymptotics for least absolute deviation regression estimators. Econometric Theory, 1991, 7(2):186-199 | [19] | Smart C E, Wronski A, French J D, et al. Analysis of Brca1-deficient mouse mammary glands reveals reciprocal regulation of Brca1 and c-kit. Oncogene, 2011, 30(13):1597-1067 | [20] | Campos B, Balmaeña J, Gardenyes J, et al. Germline mutations in NF1 and BRCA1 in a family with neurofibromatosis type 1 and early-onset breast cancer. Breast Cancer Research and Treatment, 2013, 139(2):597-602 |
[1] | 刘艳霞, 芮荣祥, 田茂再. 部分线性变系数模型的新复合分位数回归估计[J]. 应用数学学报, 2021, 44(2): 159-174. | [2] | 解其昌, 孙乾坤. 带线性时间趋势的分位数回归协整模型检验[J]. 应用数学学报, 2020, 43(3): 555-571. | [3] | 解其昌. 一类协整模型的分位数回归及应用[J]. 应用数学学报, 2015, 38(5): 901-918. | [4] | 徐登可, 张忠占. 二项-泊松模型的变量选择[J]. 应用数学学报, 2015, 38(4): 708-720. | [5] | 王静. 分组数据情形下对数正态分布参数的最大似然估计[J]. 应用数学学报(英文版), 2003, 26(4): 737-744. |
|
PDF全文下载地址:
http://123.57.41.99/jweb_yysxxb/CN/article/downloadArticleFile.do?attachType=PDF&id=14936
基于样本次序统计量的总体分位数的非参数统计推断赵旭,程维虎北京工业大学理学部,北京100124Non-parametricStatisticalInferenceforthePopulationQuantilesBasedonOrderStatisticsofSamplesZHAOXu,CHENGW ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27针对面板数据的半参数变系数可加模型的估计和推断崔晓静上海财经大学统计与管理学院,上海200433EstimationandInferenceofaSemiparametricVarying-coefficientAdditiveModelforPanelDataCUIXiaojingSchoolof ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27偏正态数据下混合非线性位置回归模型的统计诊断曹幸运,聂兴锋,吴刘仓昆明理工大学理学院,昆明650093StatisticalDiagnosisofMixtureNonlinearLocationRegressionModelwithSkew-NormalDataCAOXingyun,NIEXingf ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27具有舍入误差微观结构噪音高频数据的杠杆效应分析蔺富明1,2,周勇31.上海财经大学统计与管理学院,上海,200433;2.四川轻化工大学数学与统计学院,自贡,643000;3.统计与数据科学前沿理论及应用教育部重点实验室华东师范大学统计交叉科学研究院,上海,200062AnalysisofLever ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27病例-队列设计下长度偏差数据的比例均值剩余寿命模型的统计推断徐达1,周勇2,31.上海财经大学统计与管理学院,上海200082;2.华东师范大学经管学部交叉科学研究院及统计学院,上海200241;3.中国科学院数学与系统科学研究院,北京100190ProportionalMeanResidualLi ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27失效原因缺失的加速失效时间模型下竞争风险数据的半参数估计何其祥1,2,林仁鑫31.上海财经大学数学学院,上海200433;2.上海财经大学浙江学院,金华321013;3.中国诺华生物医药研究院有限公司生物统计部,上海201203SemiparametricAnalysisforCompetingRi ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27基于右删失宽相依数据的Kaplan-Meier估计和风险率估计的渐近性质李永明1,2,周勇31上海财经大学统计与管理学院,上海200433;2上饶师范学院数学与计算机科学学院,上饶334001;3华东师范大学经济与管理学部,上海200062AsymptoticPropertiesoftheKapla ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27Case-cohort设计下多类型事件数据的一类有效估计刘君娥1,周洁21.淮北师范大学管理学院,淮北235000;2.首都师范大学数学科学学院,北京100048AnEffectiveEstimatingforCase-cohortDesignswithMultipleTypeEventDataLI ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27SEVIS方法的局部线性估计及其在超高维数据下的应用连亦旻1,陈钊2,舒明良31.中国科学技术大学统计与金融系,合肥230026;2.DepartmentofStatistics,PennsylvaniaStateUniversity,StateCollege,USA,PA16802;3.中国科学院 ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27带信息终止事件的复发事件数据的联合建模分析曹学锋1,曲连强21.黄冈师范学院数学系,黄冈438000;2.华中师范大学数学与统计学学院,武汉430079JointModelingAnalysisofRecurrentEventDatawithInformationTerminalEventCAOXu ... 中科院数学与系统科学研究院 本站小编 Free考研考试 2021-12-27
|