论文部分内容阅读
考试机构的责任不仅仅是开发考试,还要证明对考试结果解释和使用的有效性,也就是效度。效度是评价考试开发质量的核心指标。论文以美国SAT考试作为研究对象,以SAT历次改革与效度的关系为基础展开研究。以2014年新一轮改革后的SAT考试为研究重点,通过凯恩(Kane)的基于论证的效度验证理论,对SAT考试开发进行效度验证。在总结SAT考试开发特征的基础上,思考对我国高考评价体系的启示。效度理论的发展对教育心理测量标准和考试改革都有影响作用。通过对SAT历次改革分析发现,当SAT考试的效度验证模式没有及时跟上最新的效度理论时,SAT考试结果的解释和使用就会引起质疑。2014年新一轮SAT改革的主要原因是,越来越多地高中毕业生没有为大学学习和职业生涯做好准备。本研究介绍大学学习和职业生涯准备和美国州际共同核心标准的形成路径和内涵,明确了对SAT考查目标的认识。然后通过介绍SAT考试的测量目标、考试内容和考试形式,论述SAT考什么和怎么考两个问题。并通过基于论证的效度验证理论的解释论证框架,梳理要实现大学学习和职业生涯准备目标,SAT考试要收集的证据。最后根据效度论证框架和SAT考试开发的逻辑过程,验证新一轮改革的SAT考试开发能否真正收集到考试分数预期解释的证据,也就是SAT考试能否有效测量大学学习和职业生涯准备这一目标。研究结果表明,新一轮改革后的SAT考试开发总体上是有效的。SAT考试的基于证据的目标确立,基于标准的考试开发和基于基准的分数报告,使得SAT考试从目标到结果呈现都有理有据,证据层层传递,形成了一个完整的评价体系。但是由于SAT是一个商业化的考试,成本—效益的追求导致其考查形式单一,能测量的学术能力相对有限。相比于SAT考试,我国的高考评价体系设计多了一层价值引导,考查内容更丰富,考查方式也更加多样,这同时也增加了我国高考开发的难度。但是,考试效度在我国还未引起足够的重视,这必然会影响高考评价体系的顶层设计落实的有效性。因此我国高考评价体系应加大教育测量理论和技术的应用,提高教育考试实证研究水平,以此提高考试开发的效度。通过加强考试机构专业化建设,提高考试评价的理论和实践能力。