删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于CAT的在线标定:设计与方法

本站小编 Free考研考试/2022-01-01

张雪琴, 毛秀珍(), 李佳
四川师范大学教育科学学院, 成都 610066
收稿日期:2020-04-19出版日期:2020-11-15发布日期:2020-09-23
通讯作者:毛秀珍E-mail:maomao_wanli@163.com



Online calibration based on computerized adaptive testing: Design and method

ZHANG Xueqin, MAO Xiuzhen(), LI Jia
Institute of Educational Science, Sichuan Normal University, Chengdu 610066, China
Received:2020-04-19Online:2020-11-15Published:2020-09-23
Contact:MAO Xiuzhen E-mail:maomao_wanli@163.com






摘要/Abstract


摘要: 项目增补是题库建设和维护的重要手段, 而标定新题参数是项目增补的重要内容。在线标定设计和在线标定方法分别研究新题的施测方式和参数估计方法, 是计算机化自适应测验(computerized adaptive testing, CAT)情景下项目增补的核心技术。重点厘清在线标定设计与在线标定方法的发展思路和脉络, 并对它们的特点、联系和表现进行介绍和评价。未来应基于其他信息指标进一步研究在线标定设计, 可基于联合估计和误差校正的思路探究在线标定方法, 应加强研究认知诊断CAT和多维CAT的在线标定技术, 深入开展项目增补方法的实证研究。


表1已有的CAT中的在线标定设计
分类标准 方法 特点
项目视角:参数信息量 D-优化、序贯D-优化 自适应选取被试
D-TP、D-VR、ED
和D-c方法
自适应选取项目
考生视角:能力与样本量 OIRPI、SI指标

表1已有的CAT中的在线标定设计
分类标准 方法 特点
项目视角:参数信息量 D-优化、序贯D-优化 自适应选取被试
D-TP、D-VR、ED
和D-c方法
自适应选取项目
考生视角:能力与样本量 OIRPI、SI指标


表2CAT中项目参数在线标定方法
分类标准 方法 特点 适用情景
条件极大似
然估计
MethodA、MethodB、FFMLE-A和ECSE-A 简单、易操作,
需要大样本
传统CAT/MCAT
MLE-LBCI-A 传统CAT
CD-MethodA、MLE CD-CAT
MMLE/EM算法 OEM、MEM 计算复杂, 耗时, 不易收敛 传统CAT中二级和多级评分项目/MCAT
CD-OEM、CD-MEM、MMLE CD-CAT
贝叶斯算法 贝叶斯版本:方法A, OEM和MEM 精度高、计算复杂, 耗时 传统CAT/MCAT
联合极大似
然估计
JEA、SIE、SimIE、SIE-R、JEA-R、SIE-R-BIC、JEA-R-BIC RMSEA-N 联合估计Q矩阵和项目参数 CD-CAT

表2CAT中项目参数在线标定方法
分类标准 方法 特点 适用情景
条件极大似
然估计
MethodA、MethodB、FFMLE-A和ECSE-A 简单、易操作,
需要大样本
传统CAT/MCAT
MLE-LBCI-A 传统CAT
CD-MethodA、MLE CD-CAT
MMLE/EM算法 OEM、MEM 计算复杂, 耗时, 不易收敛 传统CAT中二级和多级评分项目/MCAT
CD-OEM、CD-MEM、MMLE CD-CAT
贝叶斯算法 贝叶斯版本:方法A, OEM和MEM 精度高、计算复杂, 耗时 传统CAT/MCAT
联合极大似
然估计
JEA、SIE、SimIE、SIE-R、JEA-R、SIE-R-BIC、JEA-R-BIC RMSEA-N 联合估计Q矩阵和项目参数 CD-CAT







[1] 陈平 . ( 2016). 两种新的计算机化自适应测验在线标定方法. 心理学报, 48( 9), 1184-1198.
[2] 陈平, 辛涛 . ( 2011a). 认知诊断计算机化自适应测验中在线标定方法的开发. 心理学报, 43( 06), 710-724.
[3] 陈平, 辛涛 . ( 2011b). 认知诊断计算机化自适应测验中的项目增补. 心理学报, 43(07), 836-850.
[4] 陈平, 张佳慧, 辛涛 . ( 2013). 在线标定技术在计算机化自适应测验中的应用. 心理科学进展, 21( 10), 1883-1892.
[5] 谭青蓉 . ( 2019). CD-CAT广义在线标定方法开发研究(硕士学位论文). 江西师范大学, 南昌.
[6] 汪文义, 丁树良, 游晓锋 . ( 2011). 计算机化自适应诊断测验中原始题的属性标定. 心理学报, 43( 08), 964-976.
[7] 熊建华, 罗慧, 王晓庆, 丁树良 . ( 2018). 基于GRM的在线校准研究. 江西师范大学学报(自然科学版), 42( 01), 62-66.
[8] 游晓锋, 丁树良, 刘红云 . ( 2010). 计算机化自适应测验中原始题项目参数的估计. 心理学报, 42( 7), 813-820.
[9] Ali, U. S., & Chang, H. H . ( 2014). An item-driven adaptive design for calibrating pretest items, ETS Research Report Series, 2014( 2), 1-12.
[10] Ban, J.-C., Hanson, B. A., Wang, T. Y., Yi, Q., & Harris, D. J . ( 2001). A comparative study of on-line pretest item-calibration/ scaling methods in computerized adaptive testing. Journal of Educational Measurement, 38(3), 191-212.
doi: 10.1111/jedm.2001.38.issue-3URL
[11] Berger, M. P. F . ( 1992). Sequential sampling designs for the two-parameter item response theory model. Psychometrika, 57(4), 521-538.
doi: 10.1007/BF02294418URL
[12] Berger, M. P. F . ( 1994). D-Optimal Sequential Sampling Designs for Item Response Theory Models. Journal of Educational Statistics, 19( 1), 43-56.
doi: 10.3102/10769986019001043URL
[13] Buyske, S. ( 1998). Optimal design for item calibration in computerized adaptive testing: The 2PL case. In N. Flournoy et al.(Ed.), New developments and applications in experimental design. Lecture Notes—Monograph Series, 34. Haywood, CA: Institute of Mathematical Statistics.
[14] Chang, Y.-C. I., & Lu, H. Y . ( 2010). Online calibration via variable length computerized adaptive testing. Psychometrika, 75( 1), 140-157.
doi: 10.1007/s11336-009-9133-0URL
[15] Chen, P. ( 2017). A comparative study of online item calibration methods in multidimensional computerized adaptive testing. Journal of Educational and Behavioral Statistics, 42( 5), 559-590.
doi: 10.3102/1076998617695098URL
[16] Chen, P., & Wang, C. ( 2015). A new online calibration method for multidimensional computerized adaptive testing, Psychometrika, 81( 3), 674-701.
doi: 10.1007/s11336-015-9482-9URLpmid: 26608960
[17] Chen, Y., Liu, J., & Ying, Z . ( 2015). Online item calibration for Q-matrix in CD-CAT. Applied Psychological Measurement, 39( 1), 5-15.
doi: 10.1177/0146621613513065URLpmid: 29882531
[18] Cheng, Y. ( 2009). When cognitive diagnosis meets computerized adaptive testing: CD-CAT. Psychometrika, 74( 4) 619-632.
doi: 10.1007/s11336-009-9123-2URL
[19] Hassan, M. U., & Miller, F. ( 2019). Optimal item calibration for computerized achievement tests. Psychometrika, 84(4), 1101-1128.
doi: 10.1007/s11336-019-09673-6URLpmid: 31183669
[20] He, Y. H., & Chen, P. ( 2020). Optimal online calibration designs for item replenishment in adaptive testing. Psychometrika, 85( 1), 35-55.
doi: 10.1007/s11336-019-09687-0URLpmid: 31531789
[21] He, Y. H., Chen, P., & Li, Y . ( 2019). New efficient and practicable adaptive designs for calibrating items online. Applied Psychological Measurement, 44( 1), 3-16.
doi: 10.1177/0146621618824854URLpmid: 31853155
[22] He, Y. H., Chen, P., Li, Y., & Zhang, S. M . ( 2017). A new online calibration method based on Lord's Bias-Correction. Applied Psychological Measurement. 41( 6), 456-471.
doi: 10.1177/0146621617697958URLpmid: 29882532
[23] Jones, D. H., & Jin, Z. Y . ( 1994). Optimal sequential designs for on-line item estimation. Psychometrika, 59( 1), 59-75.
doi: 10.1007/BF02294265URL
[24] Kang, H. A., Zheng, Y., & Chang, H. H . ( 2020). Online calibration of a joint model of item responses and response times in computerized adaptive testing. Journal of Educational and Behavioral Statistics, 45( 2), 175-208.
doi: 10.3102/1076998619879040URL
[25] Kingsbury, G. G. ( 2009. Adaptive item calibration: A process for estimating item parameters within a computerized adaptive test. In D. J. Weiss (Ed.), Proceedings of the 2009 GMAC conference on computerized adaptive testing (pp.1-15). Retrieved from http://www.psych.umn.edu/psylabs/CATCentral/
[26] Makransky, G. ( 2009). An automatic online calibration design in adaptive testing. Paper presented at the 2007 GMAC Conference on Computerized Adaptive Testing, McLean, USA.
[27] Mulder, J., & van der Linden, W. J . ( 2009, June). Multidimensional adaptive testing with optimal design criteria for Item Selection. Psychometrika, 74( 2), 273-296.
doi: 10.1007/s11336-008-9097-5URLpmid: 20119511
[28] Ren, H., van der Linden, W. J., & Diao, Q . ( 2017). Continuous online item calibration: Parameter recovery and item utilization. Psychometrika, 82( 2), 498-522.
doi: 10.1007/s11336-017-9553-1URLpmid: 28290109
[29] Stefanski, L. A., & Carroll, R. J . ( 1985). Covariate measurement error in logistic regression. Annals of Statistics, 13( 4), 1335-1351.
[30] Stocking, M. L . ( 1988). Scale drift in on-line calibration (Research Rep. 88-28). Princeton, NJ: ETS.
[31] van der, Linden, W., J., & Ren, H. ( 2015). Optimal bayesian adaptive design for test-item calibration. Psychometrika, 80( 2), 263-288.
doi: 10.1007/s11336-013-9391-8URLpmid: 24407735
[32] Wainer, H., & Mislevy, R. J . ( 1990). Item response theory, item calibration, and proficiency estimation. In H. Wainer, N. J. Dorans, R. Flaugher, B. F. Green, R. J. Mislevy, L. Steinberg, & D. Thissen (Eds.), Computerized adaptive testing: A primer (Chap. 4, pp. 65-102). Hillsdale, NJ: Erlbaum.
[33] Wang, C., & Chang, H. H . ( 2011). Item selection in multidimensional computerized adaptive testing-gaining information from different angles. Psychometrika, 76( 3), 363-384.
doi: 10.1007/s11336-011-9215-7URL
[34] Xiong, J., Ding, S., Luo, F., & Luo, Z . ( 2020). Online calibration of polytomous items under the graded response model. Frontiers in Psychology, 10( 1), 3085.
doi: 10.3389/fpsyg.2019.03085URL
[35] Xu, X. L., Chang, H. H., & Douglas, J . ( 2003). A simulation study to compare CAT strategies for cognitive diagnosis. Paper presented at the annual meeting of National Council on Measurement in Education, Montreal, Canada.
[36] Zheng, Y. ( 2014). New methods of online calibration for item bank replenishment (Unpublished doctoral dissertation). University of Illinois at Urbana-Champaign, Champaign, IL.
[37] Zheng, Y. ( 2016). Online calibration of polytomous items under the generalized partial credit model. Applied Psychological Measurement, 40( 6), 434-450.
doi: 10.1177/0146621616650406URLpmid: 29881063
[38] Zheng, Y., & Chang, H. H . ( 2017). A comparison of five methods for pretest item selection in online calibration. International Journal of Quantitative Research in Education, 4( 1), 133-158.
doi: 10.1504/IJQRE.2017.086500URL




[1]唐倩, 毛秀珍, 何明霜, 何洁. 认知诊断计算机化自适应测验的选题策略[J]. 心理科学进展, 2020, 28(12): 2160-2168.
[2]高旭亮;涂冬波;王芳;张龙;李雪莹. 可修改答案的计算机化自适应测验的方法[J]. 心理科学进展, 2016, 24(4): 654-664.
[3]毛秀珍;辛涛. 多维计算机化自适应测验:模型、技术和方法[J]. 心理科学进展, 2015, 23(5): 907-918.
[4]陈平;张佳慧;辛涛. 在线标定技术在计算机化自适应测验中的应用[J]. 心理科学进展, 2013, 21(10): 1883-1892.
[5]唐小娟;丁树良;俞宗火. 计算机化自适应测验在认知诊断中的应用[J]. 心理科学进展, 2012, 20(4): 616-626.
[6]毛秀珍;辛涛. 计算机化自适应测验选题策略述评[J]. 心理科学进展, 2011, 19(10): 1552-1562.





PDF全文下载地址:

http://journal.psych.ac.cn/xlkxjz/CN/article/downloadArticleFile.do?attachType=PDF&id=5230
相关话题/心理 科学 设计 技术 计算

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 半个多世纪来中国人的心理与行为变化——心理学视野下的研究
    蔡华俭1,2(),黄梓航1,2,林莉3,张明杨1,2,王潇欧1,2,朱慧珺1,2,谢怡萍1,2,杨盈1,2,杨紫嫣1,2,敬一鸣1,21中国科学院心理研究所人格与社会心理研究中心,北京1001012中国科学院大学心理学系,北京1000493浙江省教育科学研究院普教所,杭州310012收稿日期:202 ...
    本站小编 Free考研考试 2022-01-01
  • 智能时代的工程心理学
    许为(),葛列众浙江大学心理科学研究中心,杭州310058收稿日期:2020-03-27出版日期:2020-09-15发布日期:2020-07-24通讯作者:许为E-mail:xuwei11@zju.edu.cnEngineeringpsychologyintheeraofartificialint ...
    本站小编 Free考研考试 2022-01-01
  • 心理与教育测验中异常反应侦查新技术:变点分析法
    张龙飞,王晓雯,蔡艳,涂冬波()江西师范大学心理学院,南昌330022收稿日期:2019-10-12出版日期:2020-09-15发布日期:2020-07-24通讯作者:涂冬波E-mail:tudongbo@aliyun.com基金资助:*国家自然科学基金项目(31960186);国家自然科学基金项 ...
    本站小编 Free考研考试 2022-01-01
  • 急性应激影响工作记忆的生理心理机制
    李婉如1,库逸轩2()1华东师范大学心理与认知科学学院,上海2000622中山大学心理学系,广州510006收稿日期:2019-10-31出版日期:2020-09-15发布日期:2020-07-24通讯作者:库逸轩E-mail:kuyixuan@mail.sysu.edu.cn基金资助:*国家社会科 ...
    本站小编 Free考研考试 2022-01-01
  • 气温与气温变化对心理健康的影响
    俞国良1,陈婷婷2,赵凤青2()1中国人民大学心理研究所,北京1008722郑州大学教育学院,郑州450001收稿日期:2019-12-11出版日期:2020-08-15发布日期:2020-06-28通讯作者:赵凤青E-mail:susanfair@163.com基金资助:*教育部人文社会科学研究项 ...
    本站小编 Free考研考试 2022-01-01
  • 计算模型在道德认知研究中的应用
    张银花,李红,吴寅()深圳大学师范学院心理学院;深圳市情绪与社会认知科学重点实验室,深圳518060收稿日期:2019-04-22出版日期:2020-07-15发布日期:2020-05-21通讯作者:吴寅E-mail:yinwu0407@gmail.com基金资助:*国家自然科学基金(3187278 ...
    本站小编 Free考研考试 2022-01-01
  • 瞳孔是心灵的窗口吗?——瞳孔在心理学研究中的应用及测量
    杨晓梦,王福兴(),王燕青,赵婷婷,高春颍,胡祥恩()华中师范大学心理学院,武汉430079收稿日期:2019-06-03出版日期:2020-07-15发布日期:2020-05-21通讯作者:王福兴,胡祥恩E-mail:fxwang@mail.ccnu.edu.cn;xiangenhu@mail.c ...
    本站小编 Free考研考试 2022-01-01
  • 心理治疗中的脱落
    何姣1,白宝玉2(),夏勉31武汉大学学生工作部大学生心理健康教育中心2武汉大学哲学学院心理学系,武汉4300723华中师范大学心理学院,武汉430079收稿日期:2019-09-30出版日期:2020-07-15发布日期:2020-05-21通讯作者:白宝玉E-mail:psy_bby@163.c ...
    本站小编 Free考研考试 2022-01-01
  • 行为贫困陷阱的心理机制与管理对策:基于认知与动机双视角
    徐富明1,黄龙2,3(),张慧4,相鹏5(),刘腾飞6,李亚红71南宁师范大学教育科学学院,南宁5302992皖南医学院人文与管理学院,芜湖3410023江西师范大学心理学院,南昌3300224华中科技大学社会学院,武汉4300745南京财经大学法学院,南京2100236广东医科大学人文与管理学院, ...
    本站小编 Free考研考试 2022-01-01
  • 稀缺对个体心理和行为的影响:基于一个更加整合视角下的阐释
    雷亮(),王菁煜,柳武妹兰州大学管理学院,兰州730000收稿日期:2019-05-13出版日期:2020-04-26发布日期:2020-03-27通讯作者:雷亮E-mail:leil@lzu.edu.cn基金资助:&国家自然科学基金面上项目(71972092);国家自然科学基金重点 ...
    本站小编 Free考研考试 2022-01-01