论文部分内容阅读
向心理论(Grosz,Joshi and Weinstein,1986,1995;Walker etal,1998)是比较新的语篇研究理论,作为对语篇的连贯性和凸显性进行研究的理论,向心理论的提出对于推动语言学发展具有非常重要的理论意义,并已被广泛应用于回指消解等领域中。代词回指是自然语言中最为常见的一种回指现象,在阿拉伯语语篇中代词回指现象更是频繁出现,“重复”以及回指语意义的模糊性是回指的两个重要特征,语篇中概念实体的重复出现是语篇连贯性的突出体现,并成为研究语篇连贯性的重要手段,而向心理论则被认为是典型的解释实体连贯的理论体系(Poesio,et.a1.2004)。因此把解析代词回指语的消解过程作为研究对象,对于解释语篇连贯性差异以及宏观上语篇的整体理解都非常重要。论文将从计算语篇学入手,考察向心理论的相关规则及制约条件的跨语言适用性,探讨向心理论在阿拉伯语语篇代词回指消解过程中的运用,并对向心理论的核心概念进行重新界定,在此基础上提出一种关于阿拉伯语语篇自动处理的可行方案。且在具体的消解过程中对所需概念进行参数化分析。结合阿拉伯语的语言特点,确定阿拉伯语中的向心理论参数,最终尝试提出一种基于小型标注语料库,并与向心理论相结合的阿拉伯语代词回指消解模型,推导出阿拉伯语代词回指的消解算法。论文第一章介绍了向心理论基本运行模式中的规则、中心制约条件以及中心过渡类型等对代词使用的影响,并初步分析了阿拉伯语语篇中的中心分布规律和向心模型。第二章主要就阿拉伯语语篇的代词回指使用情况进行统计分析,探讨了不同形式的代词回指之间映现形式的反映差别,以及代词回指的语篇功能和制约因素。第三章提出了自然语言处理中代词回指消解的解决方案,探索其理论基础一句法、语义和中心,介绍了相关指导原则,并利用该理论就阿拉伯语语篇中的句内以及句间和长距离的代词回指现象进行消解算法的推导。向心理论提出者最初是想将其作为一种语篇语言学理论提出的,且具有跨语言的普适性,所以对该理论中的部分核心概念并没有做明确界定,这就使得后来的研究者由于各自对一些基本概念的理解不同,而使得出的结论有所差异,且无法进行横向对比。回指现象涉猎广泛,但论文所探讨的回指范围限定在代词回指上,论文的研究方法是建立在Poesioetal(2004)的C T理论参数化研究方法基.础上的,将之前提到过的未被界定的核心概念视为理论中的参数,并利用这种方法就代词参数的设定对阿拉伯语代词回指消解的影响做初步探讨。