论文部分内容阅读
回指是一种常见的篇章现象,在延续话题方面起着重要作用。当某个成分被引入篇章后,如再次提及,有可能重复使用原先表达,也可能使用其他语言形式来指称这一成分。一前一后两个成分之间的关系就被称为“回指”。常见的回指形式有名词回指(NA)、代词回指(PA)以及零形回指(ZA)。在具体的语境中,母语者往往可以凭直觉在诸多回指形式中做出合适的选择。然而,对于非母语者来说,由于其本族母语和目标外语中回指规则存在着系统性差异,在具体语境中正确理解语篇中回指语的指称对象、选择合适的回指语指称形式,则并非易事。回指形式的选择并非随机,而是受到诸多语境因素的共同影响。本文聚焦德语中不同回指形式的使用,通过自建语料库,从真实文本出发,探究德语中如何在名词回指(NA)、代词回指(PA)、零形回指(ZA)三种回指形式中进行选择。尽管目前针对德语回指的研究并不罕见,但前人研究主要集中于德语中两种可以相互替代的代词回指——人称代词er/sie/es和指示代词der/die/das,较少全面考察多种回指语形式。此外,大部分研究仅关注一个或几个可能影响德语回指形式的因素,少有研究全面考察多种因素的共同作用。本文将系统梳理针对德语回指形式的已有文献,对其中提到的可能影响德语中回指形式选择的因素进行整合。在此基础上,本文将运用统计算法,同时考察所有前人文献中提到的影响因素及其共同作用,明晰化德语中的回指选择机制,以期为回指研究提供一个更为全面、统合的视角,并尝试为外语教学与翻译实践提供启示。本文从以下问题出发展开研究:一是在已有文献中提到的所有可能影响德语回指形式选择的因素中,哪些因素起到了关键作用,二是这些关键因素如何影响德语中的回指形式选择,三是这些关键因素的重要性排序如何。为了回答以上三个问题,本研究将自建语料库,通过多因素标注和多元统计建模,探究德语回指语的选择机制。首先,按照布朗语料库的建库模式创建当代德语平衡语料库,共收集涵盖新闻、通用、学术、小说4大语体的语料60篇。从每篇语料中抽取前50个回指用例(共计3000个回指用例),根据文献梳理结果,对语义、形态句法、篇章语用维度的相关影响因素逐一进行手工标注。在标注数据的基础上,研究分别使用逻辑斯蒂回归算法与随机森林算法,拟合德语母语者在三种回指形式中的选择。通过建立逻辑斯蒂回归模型,可以找出所有可能影响因素中哪些因素起到了关键作用,以及它们如何影响德语中的回指选择。随机森林模型则以可视化方式呈现了关键因素的重要性排序。模型拟合的结果显示,在所有可能影响德语回指形式选择的因素中,九个因素起到了关键作用,通过它们建立的逻辑斯蒂回归模型对德语母语者的回指选择预测准确率高达84.24%。它们按照重要性从高到低排序依次为:回指距离>回指语所在小句类型>回指语位置>指称对象有生性>篇章类型>潜在竞争对象>平行关系>先行词句法功能>回指语句法功能。由此可见,作为篇章层面上的一种复杂语言现象,回指形式的选择无法仅仅通过单一因素、或者单个维度上的因素来解释。其中,篇章语用维度的影响因素在重要性排序中更为靠前(回指距离、回指语所在小句类型、篇章类型、潜在竞争对象)。此外,篇章类型这一因素和语体正式程度有关,而剩下的八个因素均与指称对象的认知突显度有关。因此,当在德语中的多种回指形式中进行选择时,总体需要遵守两条基本原则:1)指称对象的认知突显度越高,选择越简单的回指形式,如代词回指(PA)、零形回指(ZA);2)语体正式程度越高,选择越复杂的回指形式,如名词回指(NA)。此外,为了更有针对性地为中国德语学习者以及德汉译者提供启示,本文还在主体研究结束后附上了与汉语中回指形式选择的对比。结果显示,除了遵守前述两条基本原则外,中国德语学习者与德汉译者还应该特别注意两种语言在回指使用方面的差异:1)代词回指(PA)与零形回指(ZA)在德语中与汉语中恰好呈现出相反的分布趋势;2)德语与汉语虽然都遵从回指距离越远、回指形式越复杂的原则,但两种语言中名词回指(NA)、代词回指(PA)与零形回指(ZA)各自倾向出现的回指距离不同;3)德语与汉语虽然都遵从语体越正式、回指形式越复杂的原则,但两种语言中名词回指(NA)、代词回指(PA)与零形回指(ZA)各自倾向出现的文本类型存在差别。本文的贡献主要在于以下三点:1)首次系统梳理并考察了前人文献中提到的所有语境影响因素,探索性地在统合的框架下重新定义了诸因素的标注方式。2)确定了德语中影响回指形式选择的关键因素及其运作机制,实现了准确率高达84.24%的回指形式预测。3)以往基于用法的语境共选类研究多集中于词汇、句法层面,本文创新性地将其拓展至篇章维度。