语料库数据驱动的学术英语文本短语序列研究

被引量 : 8次 | 上传用户：hxhbj2009

【摘要】

：

本文基于NEW-JDEST语料库证据,系统地描述与概括学术英语文本中的短语序列,及其显著的形式、意义和功能特征。本研究以弗斯语言学为理论框架,是对Firth的语境论、Sinclair的

【作者】

：

李晶洁

【发表日期】

：

2010年01期

【关键词】

：

短语型式新的短语序列提取方法经验短语序列立场短语序列组织短语序列

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文基于NEW-JDEST语料库证据,系统地描述与概括学术英语文本中的短语序列,及其显著的形式、意义和功能特征。本研究以弗斯语言学为理论框架,是对Firth的语境论、Sinclair的扩展意义单位、以及Halliday的语言元功能的进一步探讨与实证研究。在数据处理上,本文从多词序列的内部粘着力着手建立新的方法实现计算机自动提取连续短语序列,并以NEW-JDEST语料库为测量对象,检验该方法的有效性。新的提取方法包括三方面内容:(1)以一阶马尔可夫模型为基点,发展“假拟二元序列转化”理论,将现有的两词序列统计方法应用于多词序列的计算和提取。(2)建立新的标准化算法“概率均值加权法”,对现有的统计手段进行调整,提高短语序列识别的准确率和召回率。(3)采用“频数阈值”和“局部最大值”相结合的方法,确定短语序列的长度。本文将新方法提取的短语序列与现有的统计手段(例如传统熵手段,Wordsmith 4.0软件)提取的数据进行抽样检验。结果表明新方法能够更加有效地识别短语序列,准确率达到79.8%。提取的数据更能够体现序列内部的语义与结构特征。在语篇功能分析层面上,本研究参照Halliday的语言元功能理论,提出短语序列语篇功能的三维模型──经验(experiential)、立场(stance)和组织(organizational)。这三类语篇功能并非互补而是相互独立,从不同的角度描述学术文本的短语学特征。实现经验功能的短语序列在学术文本中出现频数最多。这些序列是信息传达的主要载体,体现了学术文本高信息密度的特点。它们通常不具备完整的分句结构而是充当一种或多种分句成分。语义上,经验序列主要实现五类命题意义:(1)表达过程和行动。(2)指称实体、概念和活动。(3)表达属性意义。(4)表达时间和空间意义。(5)表达模糊概念。词汇-语法立场功能主要由短语层级序列和分句层级序列实现,后者是本文研究的重点。结构上,分句层级的序列可分为显性主语型式,It-外置型式和零主语型式。在系统功能理论框架下,It-外置型式立场在学术文本中表现为4类情态意义:认知(表示某种程度的可能与确定)、义务(表示义务与趋向)、动力(表示潜力和意愿)和评价(表示态度、观点与评价)。It-外置序列的高频出现说明,虽然研究的科学性和客观性要求学术文本中避免出现明显的主观情感标识,研究者仍然使用大量的隐性手段来表达其立场和态度,潜移默化地影响读者。组织序列的语篇功能体现为三个层面:实施语篇行为、组织篇章结构、表达一般逻辑语义关系。基于语料库证据,本文描述了学术文本中的六类突显语篇行为,分别是聚焦、呈述观点或事实、呈述结果、报道、篇章指示。本文还讨论了CARS模型语步3中用于实现“概述目的”和“宣布研究特点”的元语篇短语序列,并分析了它们在引语和摘要中的复现型式与意义。数据显示,学术文本的语篇行为和篇章结构都有其各自的典型词语实现方式,某些序列被频繁地用来实施具体的语篇组织功能。某种意义上,典型的复现序列成为了具体功能的标志。所有的数据与讨论都表明,共选(co-selection)是学术作者选择语言形式来实现经验、立场和组织意义的核心机制。规约性渗透至语言使用的不同方面,体现为多个层面上的形式共选。NEW-JDEST证据指向学术文本中的四类共选关系:词汇与词汇的共选、词汇与语法的共选、短语序列与话题的共选、以及短语序列与语篇结构的共选。这些共选关系反映出词汇、语法与意义的统一性。目前这一性质在语言描述和语言学理论中尚未得到足够的重视。另外,本文在短语序列的自动提取方法、意义单位的重新界定、共选关系的细化、传统语言描述理论、短语序列的语篇组织模式、以及中国EAP教学等方面都有一定的价值和启示。

其他文献

碳酸盐岩地层密度与纵波速度关系研究

密度与速度的关系是研究岩石物理性质的重要内容之一。针对HL地区碳酸盐岩地层密度与纵波速度的关系不能较好地用Gardner经验公式来表征,基于体积平衡原理,综合考虑岩石岩性

期刊

纵波速度密度Gardner公式碳酸盐岩曲线拟合

不同血液标本处理方案下生化检查结果的差异对比

目的：探讨对血液标本进行不同处理后产生的生化结果的影响。方法：将笔者所在医院90例进行血液检验的患者随机分为1组、2组、3组和A组、B组、C组,另选30名身体各项指标均健康的

期刊

血液标本不同处理方法生化检查

渠道成员间相互依赖性对关系绩效影响的实证研究

渠道成员间的相互依赖性具有不同的性质，表现为相互依赖性总额和非对称性。它们分别作用于渠道成员间关系行为，产生不同的结果，但环境不确定性（即环境多样性和环境动态性）对上述关

期刊

渠道成员相互依赖性关系绩效实证研究

耐甲氧西林金黄色葡萄球菌医院感染研究进展

抗生素的大量应用,以及新的广谱抗生素的不断问世,致使细菌耐药性日趋严重,已经成为世界关注的公共卫生问题。医院感染的重要病原菌-耐甲氧西林金黄色葡萄球菌(MRSA)临床感染

期刊

耐甲氧西林金黄色葡萄球菌医院感染耐药性青霉素结合蛋白金黄色葡萄球菌盒式染色体

未成年人刑事案件社会调查报告研究——以泉州市洛江区为例

本文通过分析洛江区办理未成年人刑事案件中社会调查的基本情况,指出存在社会调查的适用对象有限、社会调查的方式模糊、社会调查报告的性质定位不清、社会调查报告的质量有

期刊

社会调查报告主要问题对策建议

沥青混凝土力学模型参数研究及沥青心墙堆石坝三维数值分析

沥青混凝土心墙堆石坝是土石坝的主要坝型之一。大坝主体由堆石坝或砾石组成,起支撑作用,中间设置沥青混凝土心墙起防渗作用。沥青混凝土心墙具有良好的适应变形能力、抗冲刷

学位

沥青混凝土静三轴试验模型参数堆石坝应力应变

音乐批评的价值——基于对柏辽兹《幻想交响曲》的两篇批评文章所引发的思考

文章旨在对围绕柏辽兹《幻想交响曲》这部作品所引发的两篇批评文章的探讨为载体，引发对“音乐批评”的价值问题作出思考，认为：音乐批评对于受众深入理解具体音乐作品，引发对艺术

期刊

斐蒂斯舒曼李斯特标题音乐音乐描绘音乐批评

太原市西峪煤矿二水平采煤矿井涌水数值模拟研究

矿井涌水量是指在矿山建设和生产过程中单位时间流入矿井的水量。它是矿山设计部门确定排水设备和制定防治水措施的主要依据,也是确定矿床水文地质条件复杂程度的指标之一。

学位

西峪煤矿Visual Modflow涌水量水文地质条件数值模拟

遗失物法律问题研究

我国现行立法有关遗失物的规定主要倾向于保护原权利人的权利,为拾得人规定了一系列的义务,对权利却规定甚少,只规定了拾得人的必要费用请求权。我国法律这种规定是基于对拾

学位

遗失物遗失物拾得遗失物归属报酬请求权附条件取得所有权

Al-8.0Zn-2.1Mg-2.3Cu超高强度铝合金铸锭均匀化处理及其板材的三级时效处理的研究

Al-8.0Zn-2.1Mg-2.3Cu类型的超高强度铝合金是我国航空航天工业急需的高强轻质结构材料。但我国在这类超高强度铝合金的工业化生产仅仅是在起步阶段,生产的厚板经常出现达不

学位

超高强度铝合金半连续铸造均匀化处理固溶处理三级时效处理

语料库数据驱动的学术英语文本短语序列研究

其他学术论文