论文部分内容阅读
根据个体对项目的反应机制,项目反应理论(IRT)模型可分两大类:累积模型和展开模型,许多研究表明后者更适合人格测量,现有的展开模型都是单维模型,最具代表性的是拓广的等级展开模型(GGUM)。目前展开型数据的单维性检验主要有两条标准:一是因素分析的第一与第二因子特征值比是否符合Reckase标准(特征值比大于5)或Hambleton标准(特征值比大于3),二是因素分析结果是否与前人(如Davsion,1977;Andrich&Styles,1998)的研究结论(2个因子,因子负荷图呈“马蹄形”)一致,前者是直接借鉴能力领域的方法,后者是基于一定条件得出的结论,尚不清楚两种方法对各种展开型数据的单维性检验是否具有可行性。本文的研究一从项目位置参数分布、被试样本分布设计六种不同情形的展开型数据,对各类数据进行基于主成分分析方法的因素分析,研究发现:(1)前人(如van Schuur&Kiers,1994)质疑展开型数据并不满足线性因素分析的前提条件,研究一设计的六种展开型数据的KMO值与Bartlett球形检验表明这种说法并不成立。(2)当项目位置参数均匀分布且被试样本同质性强时,第一与第二因子的特征值之比要小于3,故展开型数据的单维性检验不能采用能力测验的Reckase标准或Hambleton标准;前人(如Davsion,1977;Andrich&Styles,1998)的研究认为理想的单维展开数据因子数有两个,研究一发现在被试样本同质性弱时,因子数有三个,故不能以因子个数来说明展开型数据的单维性。(3)遵循展开反应机制的李克特量表用主成分因子分析检验时,项目的两因子负荷图并不呈“马蹄形”,而是呈“括号”形状,极端项目主要聚集在“括号”的上端,偏向中间位置的项目聚集在“括号”的下端,这与“马蹄形”中的项目分布位置不同。(4)随着样本同质性减弱,两种项目分布情形下,因子分析的第一与第二因子特征值比增大。(5)直接用因素分析来验证展开型数据的单维性并不可行,建议先对展开型数据进行模型-资料拟合检验,对拟合良好的项目作答数据做因素分析,若因素分析结果与研究一的结论(根据项目位置参数分布和被试样本分布选择对应情形)类似,可佐证数据的单维性。计算机化自适应测验(CAT)是IRT的一个成功的运用,基于累积模型的CAT已经在许多大型能力测试中得到运用,且相关技术的研究有很多,然而,基于展开模型的CAT关键技术研究仍是空白。研究二对基于GGUM的CAT中的特质估计方法、选题策略两个环节进行模拟研究,结果发现:(1)若测验信息量定为25,极端被试的测试题量要多于中段被试,测验效率最高的是期望后验估计—最大Fisher信息量选题(EAP-MFI)的CAT设计,整个区间的被试平均题量约为6题,极端被试约为8题。(2)对于极端被试而言,期望后验估计—最大KL信息量选题(EAP-KLI)的CAT设计在测量标准误和返真性两个方面都要比其他五种CAT设计更差,但对于特质中段被试,六种设计基本无异。(3)变长CAT中,EAP-KLI测量稳定性、返真性表现最差;定长CAT中,EAP-MFI的测量稳定性、返真性表现最好。(4)建议在编制基于GGUM的CAT时,特质估计方法采用EAP,选题策略采用MFI。迄今为止,尚未有基于展开模型的真实CAT研究报告,为弥补这一领域的研究空白,自编基于GGUM的大学生人格内外向CAT(UIE-CAT),通过实测发现:(1)基于GGUM模型构建的人格内外向题库能够保留中间位置的项目,这有助于提高人格内外向中等位置被试的测量准确性。(2)采用李克特方法构建的量表对于反问项目要反向计分,而基于GGUM构建的反问项目的位置参数为负值,当采用IRT方法估计特质时,不必对其作答反向计分。(3)效标关联效度表明UIE-CAT比李克特式的E量表要更有效,不同终止规则下的UIE-CAT效标关联效度水平相当,证明CAT测试形式能提高测验效率。(4)UIE-CAT间隔四星期的重测信度在定长10题时达到了0.886,其余定长和变长各规则下的UIE-CAT重测信度均在0.9以上,UIE-CAT的测量稳定性良好。