论文部分内容阅读
目的(1)通过对试卷试题的分析,了解教师在试卷编制中存在的问题,寻求提高出卷质量、优化考试的途径,使试卷编制逐步由经验型走向理论指导型;(2)通过试卷分析发现教学方法中的问题及薄弱环节,为今后教学改革提供依据;(3)促进题库的建设和更新。积极引导试卷分析软件的开发应用,加快考试中心成立的步伐。方法通过搜集、阅读国内外有关试卷分析和教育测量学发展现状以及教育测量学在医学教育领域应用的文献资料,为本研究提供理论指导和科学依据。通过电话咨询、座谈访谈了解相关试题来源以及试卷组成方法。整理审核试卷资料后,将有效的数据输入Excel表格,在Excel表格内应用教育测量法常用的指标公式计算试题的信度、效度、区分度、难度,然后分别进行宏观以及微观的分析。用SAS9.1.3软件建立数据库,双人录入核对一致后,用SAS9.1.3软件进行数据处理分析。本研究统计描述部分采用题目数和分值构成比,进一步采用χ2检验或Fisher’s精确概率法以及非条件多因素logistic回归来分析试卷质量在年级之间和课程之间的差异。所有分析均为双测检验,并以0.05为检验水准。结果通过对南京医科大学五年制临床医学专业2003-2005级学生的病理学、药理学、妇产科学、内科学的试卷质量分析,结果显示:(1)四门课程三个年级的成绩均呈负偏态分布,偏度达到“-1”以上的试卷占了41.67%,而偏度在“0.5”以内的仅达15.38%;从三个年度的变化趋势来看,除了病理学,余三门课程均有偏度有变小的趋势。(2)所有所分析试卷的信度都达到了0.6以上,而且除2005级的妇产科学试卷信度为0.68外,其余的(占91.7%)信度均在0.7以上,说明信度较好;内科学的信度值最高,均达到了0.8以上,且三年来处于一个比较稳定的状态;但总体来看≥0.8的仅占41.7%,且没有一份试卷达到0.9或更高,说明还有进一步改进的空间。(3)四门课程的考核基本上都覆盖了所有章节的内容,但是在题量和分值分布上与教学大纲不完全吻合。(4)各门课程的试卷都兼顾了主观题和客观题,但基础医学课程和临床课程表现了不同的选择倾向:基础医学课程试卷的主观题所占比例大,其中病理学主观题与客观题的比例2004级为80:20,2003和2005级为60:40;药理学主观题与客观题的比例2003和2004级为65:35,2005级为70:30;而临床课程试卷则以客观题的比重为大:妇产科学和内科学三年的比例一样,主观题与客观题的比例为30:70。(5)所分析的12份试卷中都包含了“知识点的回忆、解释和问题解决”各认知层面的试题,但是比例不一。具体来看三个层面的分值在不同试卷中的比例,病理学2003级为74:9:17,2004级和2005级均为82:7:11;药理学2003级为85:13:2,2004级为89: 7:4,2005级为89:6:5;呈现基础医学课程更多地考核知识点的记忆倾向。妇产科学2003级为39:25:41,2004级为37:30:38,2005级为40: 32:33;内科学2003级为50:26:29,2004级为52:32:21,2005级为64:19:22,呈现临床课程相对较重视考核知识运用的倾向。(6)四门课程三年的试卷对“掌握,熟悉与了解”等不同大纲要求层面的内容均有考核。具体来看三种不同教学层面的分值在不同试卷中的比例,病理学2003级为75:22:3,2004级为84:15:1,2005级为84:12:4;药理学2003级为81:18:1,2004级为73: 22:5,2005级为91:7:2;妇产科学2003级为71:26:8,2004级为68:19:18,2005级为59:27:19;内科学2003级为70:26:9,2004级为80:17:8,2005级为74:14:17,较好地体现了教学大纲的要求。(7)四门课程的难度值偏高,即实际难度较低,41.67%的试卷难度大于等于0.80,且妇产科学有两年的试卷难度均达到了0.85以上;但从三年的变化来看,有难度加大的趋势。从课程之间比较来看,妇产科学与病理学、药理学、内科学均有统计学差异,内科与病理学、药理学有统计学差异,呈现妇产科学难度<病理学、药理学的难度<内科学难度的状态。(8)四门课程的区分度均不高,75%的试卷都在0.20-0.30之间,甚至于16.67%的试卷低于0.20,但从三年的变化来看,每门课程的区分度有逐步增加的趋势。从课程之间比较来看,在题目数分布上妇产科学试卷区分度较病理学、药理学和内科学试卷为差,区分度较好的试题偏少;在分值分布上,四门课程的试卷区分度呈现药理学优于病理学,病理学优于内科学,内科学优于妇产科学的状态。结论根据教育测量学的原理,南京医科大学2003-2005级五年制临床医学生的病理学、药理学、妇产科学、内科学的试卷总体来讲信度较高,难度较低,区分度不高,测量的效度有待于提高。虽然这四门课程的考核三年来有难度增加,区分度加大的趋势,但是作为临床医学专业的核心课程,四门课程的平均难度和区分度还存在统计学的差异,需要进行调整。四门课程的考核基本上都覆盖了所有章节的内容,但是在题量和分值分布上与教学大纲要求的学时分配不完全吻合;虽然各门课程的试卷都兼顾了主观题(名词解释,简答题,问答题和病例分析题)和客观题(选择题),“回忆,解释和问题解决”各认知层面以及“掌握,熟悉与了解”等不同大纲要求层面的考核,但是在分配比例上有不符合试卷编制原则之处,尤以代表基础课程的病理学与药理学最为突出。由上可得,在本校的教育现实中,学生学习和教学效果测定的方法还不够科学,考试试卷试题还存在一定的缺陷,还需要进一步提高质量。应用教育测量学对试卷进行量化的分析和科学的评价,可以提高试题的质量和试卷的测试水平,为教师进行教学实践和改革提供有力的依据;同时,只有在教育测量原理和方法指导下才能搞好试题库建设,实现科学、合理的教学效果评价。