论文部分内容阅读
本文基于NEW-JDEST语料库证据,系统地描述与概括学术英语文本中的短语序列,及其显著的形式、意义和功能特征。本研究以弗斯语言学为理论框架,是对Firth的语境论、Sinclair的扩展意义单位、以及Halliday的语言元功能的进一步探讨与实证研究。在数据处理上,本文从多词序列的内部粘着力着手建立新的方法实现计算机自动提取连续短语序列,并以NEW-JDEST语料库为测量对象,检验该方法的有效性。新的提取方法包括三方面内容:(1)以一阶马尔可夫模型为基点,发展“假拟二元序列转化”理论,将现有的两词序列统计方法应用于多词序列的计算和提取。(2)建立新的标准化算法“概率均值加权法”,对现有的统计手段进行调整,提高短语序列识别的准确率和召回率。(3)采用“频数阈值”和“局部最大值”相结合的方法,确定短语序列的长度。本文将新方法提取的短语序列与现有的统计手段(例如传统熵手段,Wordsmith 4.0软件)提取的数据进行抽样检验。结果表明新方法能够更加有效地识别短语序列,准确率达到79.8%。提取的数据更能够体现序列内部的语义与结构特征。在语篇功能分析层面上,本研究参照Halliday的语言元功能理论,提出短语序列语篇功能的三维模型──经验(experiential)、立场(stance)和组织(organizational)。这三类语篇功能并非互补而是相互独立,从不同的角度描述学术文本的短语学特征。实现经验功能的短语序列在学术文本中出现频数最多。这些序列是信息传达的主要载体,体现了学术文本高信息密度的特点。它们通常不具备完整的分句结构而是充当一种或多种分句成分。语义上,经验序列主要实现五类命题意义:(1)表达过程和行动。(2)指称实体、概念和活动。(3)表达属性意义。(4)表达时间和空间意义。(5)表达模糊概念。词汇-语法立场功能主要由短语层级序列和分句层级序列实现,后者是本文研究的重点。结构上,分句层级的序列可分为显性主语型式,It-外置型式和零主语型式。在系统功能理论框架下,It-外置型式立场在学术文本中表现为4类情态意义:认知(表示某种程度的可能与确定)、义务(表示义务与趋向)、动力(表示潜力和意愿)和评价(表示态度、观点与评价)。It-外置序列的高频出现说明,虽然研究的科学性和客观性要求学术文本中避免出现明显的主观情感标识,研究者仍然使用大量的隐性手段来表达其立场和态度,潜移默化地影响读者。组织序列的语篇功能体现为三个层面:实施语篇行为、组织篇章结构、表达一般逻辑语义关系。基于语料库证据,本文描述了学术文本中的六类突显语篇行为,分别是聚焦、呈述观点或事实、呈述结果、报道、篇章指示。本文还讨论了CARS模型语步3中用于实现“概述目的”和“宣布研究特点”的元语篇短语序列,并分析了它们在引语和摘要中的复现型式与意义。数据显示,学术文本的语篇行为和篇章结构都有其各自的典型词语实现方式,某些序列被频繁地用来实施具体的语篇组织功能。某种意义上,典型的复现序列成为了具体功能的标志。所有的数据与讨论都表明,共选(co-selection)是学术作者选择语言形式来实现经验、立场和组织意义的核心机制。规约性渗透至语言使用的不同方面,体现为多个层面上的形式共选。NEW-JDEST证据指向学术文本中的四类共选关系:词汇与词汇的共选、词汇与语法的共选、短语序列与话题的共选、以及短语序列与语篇结构的共选。这些共选关系反映出词汇、语法与意义的统一性。目前这一性质在语言描述和语言学理论中尚未得到足够的重视。另外,本文在短语序列的自动提取方法、意义单位的重新界定、共选关系的细化、传统语言描述理论、短语序列的语篇组织模式、以及中国EAP教学等方面都有一定的价值和启示。