【摘 要】
:
近年来广泛应用的网上阅卷系统为控制主观评分的误差提供了便捷。然而,在追求评分一致的过程中,评分者的打分可能存在保守趋势,考生的分数分布会出现明显的趋中趋势。本研究对某次国家级大型人事考试的主观评分结果进行分析。结果表明,各题得分离散程度偏小,考生能力并不能被很好区分。评分者所评分数的分布比较集中且处于低分段,体现出评分者打分时相当保守,同时分数全距缩小也降低了主观性试题的效用。各题均值和标准差都随
【机 构】
:
香港中文大学教育学院教育心理学系,香港 北京市应用心理重点实验室,北京师范大学心理学院,北京,10
论文部分内容阅读
近年来广泛应用的网上阅卷系统为控制主观评分的误差提供了便捷。然而,在追求评分一致的过程中,评分者的打分可能存在保守趋势,考生的分数分布会出现明显的趋中趋势。本研究对某次国家级大型人事考试的主观评分结果进行分析。结果表明,各题得分离散程度偏小,考生能力并不能被很好区分。评分者所评分数的分布比较集中且处于低分段,体现出评分者打分时相当保守,同时分数全距缩小也降低了主观性试题的效用。各题均值和标准差都随评分时间的增长而减小,体现了评分保守是一个"习得"的过程。多元概化理论分析显示,评分者的宽严尺度标准偏严,评分者之间的一致性被高估。为控制这种现象的发生,可通过优化误差监控的指标,插入标准卷,以及采用分步增值评分模式进行流程控制,这些方法均能在一定程度上减少分数的趋中趋势,在不降低评分一致性的前提下,进一步提升了评分的准确性。
其他文献
韦氏幼儿智力量表是测量2岁半至6岁幼儿的智力的量表.自从1967年提出以来,至今已经发展到第四个版本.与先前已经完成的WISC-Ⅳ以及WAIS-Ⅳ一起,成为智力测验发展历程中的又一个里程碑.今年发表的WPPSI-Ⅳ沿承了WISC-Ⅳ和WAIS-Ⅳ的成功改进,不仅修订了题目、增删了部分分测验,而且使测验的结构有了根本的改进,使WPPSI-Ⅳ的分测验能够更加清晰地测量幼儿的言语和非言语能力,对智力的测
雨果说:“开展纪念活动,如同点燃一支火炬。”纪念日是指发生过重大事情值得纪念的日子。在生活中,有些事情,有些日子,我们是永远不应该忘记的,纪念的范围比较广泛,国家有纪念日,家乡有纪念日,家庭有纪念日,甚至我们个人也有纪念日。纪念日可以使我们不忘过去,永远牢记那些值得我们记忆的事情,更好地面对未来,去创造美好的明天。本文主要针对民俗纪念日的启动效应进行了研究。启动效应是指由于之前受某一刺激的影响而使
职业价值观(Work Values)这一术语由Super(1957)于20世纪50年代在他的职业发展理论(CareerDevelopment Theory)中提出,而培养良好的职业价值观对大学生成功就业具有重要意义。因此为了解当代大学生的职业价值观现状,研究者依据相关理论编制了大学生职业价值观问卷,对包括985院校、211院校和普通院校的全国30所大学的5000多名学生进行了大规模调查,以期全面深
心理疾病污名是对心理疾病患者的消极态度,是个体在社会互动中对心理疾病患者存有的负面评价、消极情感体验和歧视.与外显指标相比,内隐心理疾病污名能更好的预测个体自动化的行为以及心理健康从业人员对患者病情严重程度的评估.SEB( Stereotypic Explanatory Bias)测量是一种内隐态度的测量方法,主要用于测量被试不愿意报告或没有意识到的态度.与传统的态度的外显测量相比,SEB测量基于
目的:探讨当代青年男性在网络“泛性化”条件下对青年女性的内隐态度,以期让青年男性更客观的认识自己的看法,同时期望引起网络媒体的关注,给网络媒体提出合理的有关网络泛性化的建议.方法:通过考虑上网时间,有没有女朋友或者是否曾经交过女朋友等因素,从山东某两所高校选择每天上网时间相当以及现在或曾经有过女朋友的的大一到大三的40名学生,学生年龄在19-25岁之间,对其进行进行内隐联想测验,测验通过调查选定的
为考察当前我国公众慈善倾向的现状和特点,采取分层随机抽样的方式,运用自编公众慈善倾向问卷对全国10个省市的1618名被试进行社会调查.结果表明:总体上,公众的慈善倾向处于中等水平,其总体得分为110.572±16.129,平均水平3.455,接近单个项目理论中值3.00,且一半以上的人愿意将个人收入和空余时间的2%~10%用于做慈善或参加志愿活动,表现出追求公开化和理性化的趋势.公众慈善倾向在不同
购买决策已成为消费领域研究的重要课题,引起了决策专家和心理学研究者的高度关注。随着我国旅游业发展规模的不断扩大,旅游商品已成为旅游业的一个重要组成部分。在旅游业中,“购”的需求和供给弹性较强,有广阔的发展空间,然而,旅游购物始终是我国旅游产业结构中的薄弱环节。研究在综合分析并借鉴国内外研究成果的基础上,以消费者购买决策理论为研究依据,通过实验探讨旅游商品的消费者购买决策行为,以期为提高消费者决策的
近年来,反生产行为( Counterproductive work behavior,CWB)引起了学术界和企业界的广泛关注,诸如故意缺勤、工作场所侵犯行为、偷窃、故意破坏和职场欺骗等反生产行为多有发生,并带来组织管理成本增加等问题。纵观国内外对于反生产行为的研究,既有对具体某个行为(如性骚扰、故意缺勤等)或某类行为(如职场欺负、服务破坏等)的研究,也有把反生产行为作为一个整体来加以研究。这些研究
目的:意志品质是意志的稳定因素,也是衡量一个人意志发展水平的重要尺度.从发展心理学角度来看,对初中生良好意志品质的培养一方面需要以了解他们的意志品质特点为基础,另一方面在课堂教学、拓展训练、挫折情境体验情境中对初中生意志品质的培养,其效果也需要进行有效评估.编制《初中生意志品质问卷》(AWQ),对其信度、结构效度等进行验证,为初中生意志品质的评定、意志品质的培养提供可靠、有效的测量工具.方法:结合
无领导小组讨论在人事测评中的应用越来越广泛,对其测评误差的研究将为无领导小组讨论技术的开发和应用提供科学参考.但是由于经典测量理论的局限性,仅能对评分者间的信度和测量内容的同质性信度进行分析,且经典测量理论中常用的Kendall和谐系数将比率数据压缩等距数据,很可能造成数据信息的损失.概化理论是逐渐兴起的现代测量理论之一,其"随机平行测验"的假设代替了经典测量理论中的"完全平行测验"假设,更为容易