论文部分内容阅读
语料库是指一个由大量的语言实际使用的信息组成的,专供语言研究、分析和描述的语言资料库。它是在随机采样的基础上收集人们实际使用的、有代表性的真实语言材料而创建起来的。语料库是对语言进行定量分析与研究的便利工具,是语言学研究手段的技术进步,标志着语言研究思想的重大转变,使语言研究从传统的直觉经验方法转向量化的统计方法,提高了语言研究效率(谭键,2005:61-66)。多维度分析方法(Multi-Dimension/Multi-Feature Analysis Model,简称MDA)(Biber,1988:72)最初应用于口笔语语体变异研究,该方法利用大量语言特征所反映出的潜在模式来发现和阐释系统性的语体差异,认为统计意义上的语言特征共现模式可以揭示语篇深层的交际功能。随后的一系列基于MDA分析方法的语言变异研究均证明了这一模式的广泛适用性(曹雁&肖忠华,2015:5-9)。多维分析法不以单个语言特征为研究焦点,而是调查具有一定统计频率的、倾向于共现的语言特征组模式,即那些共同出现频率高于偶然性的特征。每一组共现特征构成一个“维度”,即一个语篇特征变化连续体。每一个维度反映了共现特征在语篇中的类似分布,标引和构建了语篇的部分共享意义和功能,因此对各维度的分析和阐释将揭示语篇的整体风貌(Biber,2003;Csomay,2015)。本文主要从SWECCL 2.0语料库(文秋芳,2008)中提取250篇英语议论文作为语料,然后根据人工评分和句酷在线评分的平均分,划分出高分组和低分组各125篇,然后分别把两组议论文输入到自然语言处理软件Coh-Metrix3.0中,分析议论文的局部衔接(例如:连接词),可读性以及句法特征(例如:句法类型密度)。根据Coh-Meteix 3.0和SPSS 21.0提供的数据,本文利用t检验探索高分组和低分组在文本特征上的差异,运用相关分析研究文本特征与作文分数之间的关系,以及通过线性分析来预测文本特征对作文水平的影响力。本研究突出了三个文本特征,即连接词、可读性和句法类型密度在英语议论文写作中的重要性,具有一定的现实意义。一方面,学生们可以根据研究结果和数据分析,调整和完善写作策略,例如,使用更多的时间连词,增加副词词组的使用密度,同时提高文章的可读性,以期写出更高质量的文章;另一方面,从事英语写作教学的老师,则可以结合以上方面,在英语议论文写作方面给学生提供更多有针对性的指导,提高学生写作教学水平;从事英语写作的研究者,可以依据本文的数据信息,对该研究做进一步的完善,或者运用Coh-Metrix对英语议论文的其他文本特征进行研究。