论文部分内容阅读
“基于网络的过程性创新人才评价与选拔系统”(简称“网络评价系统”)项目由清华大学招生办公室主办,目的是探索更加科学的考生评价测试模式。为提高“网络评价”的效度与信度,该项目专门开发了“网上风格识别系统”,目的是希望通过这一系统测试学生网上提交的作品的真实程度。本文以语料库语言学、数理语言学、语言风格学等知识为理论依据,运用归纳、演绎、定量、对比等研究方法,试图提取区别意义显著的言语特征,并通过对言语特征的分析和综合考察,建立可资利用的数据模型。从而对特定学生的语言风格进行识别,为“网络评价作文风格识别系统”提供有价值的参考。言语风格具有整体性和系统性。构成言语风格的语言项目本身及其适当的组合形成系统,才能构成具有区别风格特征作用的模型。MD/MF模型是贝博在研究口语和书面语两种语体的特征时建立的。该模型注重语体间整体的异同,从多个维度上对某文本的特征进行描述,强调维度的连续性,对于风格特征的描述更加具体和全面。因此,本文在进行个人风格的言语特征提取和作者身份认定研究时,借鉴了这一分析方法。本文也注意到,贝博的案例主要适用于区分不同“文体”的文本,而本文的研究目的是区分文本在文体上差异不大的情况下作者的言语风格特点。这就必须重点考察如何调整和选择各维度的语言项目、建立什么样的维度和维度体系,才能使之适应并可能最大限度地区分不同作者的个人风格。通过因素分析,本文为个人风格建立了六个维度。分别定义为:“语气张扬化/语气收敛化”维度,“表意繁复倾向/表意简约倾向”维度,“叙述性/交互性”维度,“表述求工倾向/表述求新倾向”维度,“书面化色彩/口语化色彩”维度,“侧重修饰限定性/侧重补充描述性”维度。每个维度都包含一组独特的语言项目,都定义了文体差别不大的前提下个人风格差异的一个方面,都具有独特的表达功能。验证过程是将指定文章代入已有的MD/MF模型,根据指定文本在模型中的分数是否介于其所在文集在该维度得分的区间范围内,从而对二者的作者是否相同做出参考性的判断。