计算机自适应英语能力测试系统设计与效度验证——以TEM4词汇与语法题为例

来源 :上海外国语大学 | 被引量 : 0次 | 上传用户：surtacohen1

【摘要】

：

【作者】

：

张一鑫

【机构】

：

上海外国语大学

【出处】

：

上海外国语大学

【发表日期】

：

2018年2期

【关键词】

：

计算机自适应语言测

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着测量理论和计算机技术的不断发展，计算机自适应语言测试系统(Computerizedadaptivelanguagetestsystem，简称CALT)的开发与应用是近年来国内外语言测试领域研究的核心热点方向。相对于传统的纸笔语言测试(Paper-and-pencillanguagetest，简称PPLT)或普通的计算机辅助语言测试(Computer-basedlanguagetest，简称CBLT)，CALT有更加人性化、更高的精确性、出题更加灵活、施考及评分更简洁、以及测试效率更高等优势。
　　本研究的主要目的是：1)完成计算机自适应测试的大型题库的构建，该题库包括以下三种题型：完形填空、语法选择题、词汇选择题。在内容方面，该题库涵盖英语专业四级考试(TEM-4)要求的所有语法知识点和考试大纲所要求的所有词汇。2)在题库的基础上设计一个计算机自适应英语测试系统，并采用“评估使用论证”(AssessmentUseArgument，简称AUA)对该测试进度效度验证。
　　针对第一个研究目的，采用的主要研究方法是对过对1996年至2008年(不含1998年和2002年)间的英语专业四级考生数据进行数据处理和分析，筛选出符合题库建设需求的题目，编写入题库。使用AUA框架对本过程进行效度验证，并回答本阶段研究所讨论的的四个有关研究中题目是否适合IRT理论的问题。采用以下分析方法对数据进行处理：1)使用SPSS20.0进行探索性因子分析，并用AMOS7.0进行验证性因子分析，以检验单维性假设；2)用Bilog2.0对项目局部独立性假设进行检验；3)使用Bilog2.0中的2PLM对二元计分项目进行分析，用GRM及GPCM对多元计分项目进行分析；4)使用Bilog2.0以及SIBTEST对项目进行性别DIF检验，然后对存在性别DIF的项目进行内容分析，以确定该项目是否需要从题库中剔除。
　　针对第二个研究目的，设计三个步骤：CALT设计、模拟、运行与效度验证。在CALT设计方面，采用以下方法：测试按照完形填空，语法选择和词汇选择的顺序进行；2)项目选择采用最大信息量选择法(MaximumInformation，简称MI)，并兼用内容平衡、曝光控制等措施；3)能力估计采用贝氏期望后验法(Expectedaposteriori，简称EAP)；4)终止原则同时采用标准误差控制原则和总题量控制原则。在模拟方面采用了Firestar与R软件进行四次模拟运行。针对CALT运行与效度验证，采用的数据分析方法包括：1)SPSS20.0进行配对T检验，用AMOS7.0进行验证性因子分析；2)使用AMOS7.0对计算机熟悉度、TEM4成绩、CALT成绩进行结构方程模型建模；3)使用AMOS7.0对以上模型进行多群组结构方程模型分析。
　　本研究不仅设计一个涉及语法与词汇测试的CALT，填补了国内语言测试领域的一个研究空白，而且在国内外语言测试领域中首次尝试对CALT进行了较为系统的效度验证。在计算机技术已经日趋完善并对语言测试带来变革的今天，本研究在理论和实践上均具有重要意义。
　　在理论方面，本研究的效度难不再局限于CALT与PPLT之间的等效性，而是倡导更好地理解CALT所考查的构念，理解计算机熟悉度、语言能力与CALT所考查的构念之间的关系。其次，本研究尝试在测试分数解释方面使用AUA框架，在一定程度上促进基于论据的效度验证方法在语言测试领域得到更广泛的应用。
　　在实践方面，本研究介绍了CALT开发过程中的详细步骤，指出了以往研究在CALT题库建设方面存在的不足，有利于扩展CALT开发方面的知识，并能给考虑开发CALT系统的机构提供实证依据。其次，本研究针对计算机熟悉度对考生在CALT中表现的影响的探讨有助于CALT开发者与使用者更积极主动地预测CALT实施过程中可能遇到的问题，以针对性地采取解决方案，并更适当使用CALT的测试结果。
　　不可否认，本研究存在一定的局限性，未来研究可以从以下几个方面着手：1)本研究采用了多元计分IRT模型解决了局部独立性假设违反的问题，但是此方法的一大缺陷是项目层次信息的丢失，未来研究可以考虑彩多维IRT模型，如双因素模型(Bi-factormodel)、题组反应理论模型(Testletresponsetheorymodel)，进行项目参数估计，从而保证项目层次信息的完整性；2)本研究采用的单独分析使同时参与分析的项目数量减少，在一定程度上加大了参数估计的误差，未来研究可以考虑彩双阶全信息项目因子分析模型进行参数估计，真正实现多维CALT创建；3)本研究仅从性别角度考查了CALT因子结构的一致性，未来研究可以从考生专业、生源地等角度着手；4)本研究主要基于定量分析研究CALT效度，未来研究可以采用定性分析方法研究考生在CALT中的认知过程，从而更好地探讨CALT的效度问题；5)本研究设计的CALT仅包括语法和词汇部分，而未涉及听力、阅读、写作与口语考试，随着自动评分技术的发展，未来研究可以尝试设计更全面的考查语言能力的CALT。

其他文献

接受美学视野下中式黑色幽默诗学特质研究——以王朔作品为例

20世纪80年代，黑色幽默在中国文坛开始了新的发展历程，中国当代作家将黑色幽默的表达手法纳入文学创作，开辟了中国黑色幽默小说的新局面。本文共分为四章,第一章论述黑色幽默在中国的接受与影响，一方面黑色幽默在中国的接受迎合读者的心理需求；另一方面黑色幽默传入中国后，促进了幽默文体的转型，作家在创作中打破和谐的审美追求，突出荒诞的主题。第二章讨论中西方黑色幽默的共同诗学特质，体现中国作家对西方黑色幽默的

学位

当代小说

形塑怎样的“大众”与“文化”--马修·阿诺德的思想及其影响

本文将马修·阿诺德的文化思想放入英国工业革命的时代背景下，从经济、文学、政治制度等方面对阿诺德文化思想进行研究。第一部分重点阐述“大众”与“文化”两个核心概念的意义与发展过程;第二部分分别从文化观、文学观和国家观等方面研究阿诺德的文化思想;第三部分聚焦于“大众”、“文化”概念的相互联系，通过梳理阿诺德文化思想对后世各文化学派的影响，考察“大众文化”概念的形成、流变及影响。文章最后联系当下社会发展现

学位

大众文化

我国高中生英语写作中词块使用的研究——以江苏省某中学高三学生为例

词块是整体储存和使用的程式化序列，是语言的记忆单位存在大脑中的预制短语，融合了语法、语义及语境的优势，在语言输出和二语写作中具有重要作用。为了提高英语学习者的写作水平，国内外学者对词块进行了大量研究，成就瞩目。研究发现，无论在口语还是书面语中，词块的使用都有助于提高学习者语言表达的准确性和地道性。　　然而，目前对词块的研究大多以理论为主，实证研究的对象也多局限于大学生，或二语与母语学习者词块使用的

学位

高中生

文学形式的认知功能：本土性与世界性——以魔幻现实主义及其在中国的变异为中心

二十世纪的文学评论中，形式一直是一个关键词，但却似乎从未名副其实地成为“关键”，形式的讨论始终脱离不了“内容与形式”的二元传统范畴，形式一直为内容或意义或情感服务着，成为一种约定俗成的理解。如何还其以真正的意味，需跳脱这种二元对立的思维框架，以形式为主体，探讨形式本身在文学中和在文学关系中的特殊作用，既有别于又超于内容的作用。本文拟从三个层面上来探讨文学形式的自主性和能动性，将核心放在文学形式与现

学位

文学形式

文化空间的重构——《德伯家的苔丝》与《边城》之比较阅读

托马斯·哈代和沈从文，虽然生活时代和写作题材各不相同，却有着共同的文学主题——文化空间的重构意识。在《德伯家的苔丝》与《边城》中，哈代和沈借助一个亦幻亦真的叙事空间来展开对文化空间的重构，威塞克斯和湘西分别代表着两位作家心中错综复杂的家园想象，承载着他们的文化理想。在现代性的浪潮中，面对传统与现代之间的碰撞，如何通过一种文本创造阐释、协调现代与传统之间的关系，从而更好的为文化续命，是两位作家在文化

学位

托马斯·哈代

文学想象中的世界主义——翁达杰小说研究

“世界主义”的哲学思想源远流长，从古希腊到启蒙时代直至现在，人们对其不断阐发，如今已囊括“文化根源”、“他者”、“移情”以及“悦纳异己”等多层次的概念。随着全球化的纵深发展，“日渐紧密”却又“分歧长存”构成了当今世界的内在矛盾，也使得“世界主义”这一概念再次活跃起来。加拿大著名小说家迈克尔?翁达杰(1943-)，凭借其个人的流散经历以及多元文化生活状况，在小说创作中超越了后殖民文学中如“文明与野蛮

学位

迈克尔·翁达杰

汪曾祺诗化小说中的伍尔夫因素

汪曾祺的诗化小说在中国现当代文坛具有重要的美学价值。作为诗化小说圣手,他同时也十分善于吸收外来因素，因此探析其诗化创作中的异质因素一直是学术界的一个研究热点。本文以约瑟夫·T·萧的文学借鉴视角来观照汪曾祺的诗化小说与伍尔夫诗学的直接和间接关联。本文基于文本细读和影响实证研究，旨在明晰汪曾祺的诗化小说在文艺理论层面对伍尔夫诗学的接受向度，并具体考察汪曾祺在1940年代如何利用伍尔夫因素尝试诗化小说的

学位

汪曾祺

图尔明理论及其在协商式辩论中的应用：以政府沟通为例

图尔明理论是分析为自己本身坚信的论断而提出论据的过程的一种工具。本论文试图在图尔明理论的指导下探讨辩论及其应用，并通过政府沟通中的案例加以验证。论文提出并讨论了三个具体问题：1)质疑者是否接受论断？2)数据、证据和限定词是否是做出一个好的论断的必要步骤？3)数据及论断是否应与对方的目标一致，尤其当你提出请求时？　　通过政府沟通的案例分析，论文证明了图尔明理论的有效性，并发现在现实中，最难的往往是怎

学位

协商式辩论

提问序列与学习空间拓展——基于英语专业精读课的行动研究

教师提问是启发学生思考的重要手段(Elder&Paul, 1998;Paul&Elder, 2008)，是最普遍的教学行为(Sadker, Sadker,&Zittleman, 2010)，是观测或检视课堂教学效果的一面镜子(Walsh&Sattes, 2005;Good&Brophy, 2008)。然而，国内专家在讨论我国高校英语课堂教学现状时却指出，教师提问存在‘思辨缺席’(黄源深,1998;

学位

英语专业精读课

天真与经验,象征与现实——华兹华斯与梅尧臣诗歌中的儿童意象对比研究

在现实生活中，儿童往往被视作一个家庭乃至一个社会的重要组成部分，因为它不仅指向日常生活中的儿童个体，也联系着每一个成年人的童年阶段。但在以诗歌为例的艺术创作中，无论中西方，对于“儿童”的关注和研究都经历了一段相当漫长坎坷的发展历程。其中对儿童意象的认识上又都有过一个关键性的过渡时期。在西方，儿童意象的转型可追溯到18世纪末19世纪初的英国浪漫主义诗歌。而在中国，尽管对于儿童的诗化描写可寻根至公元前

学位

华兹华斯

计算机自适应英语能力测试系统设计与效度验证——以TEM4词汇与语法题为例

其他学术论文