宏观篇章结构表示体系、资源建设和计算模型研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:blackfairy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
篇章结构分析是自然语言处理领域中的一个重要研究课题。篇章是由连续的话段或句子构成的语言整体,表达一个完整的语义信息。其特点是前后衔接、语义连贯,且具有一定的交际目的和功能。无论在形式上还是意义上,篇章都不是孤立存在的,而是每一个篇章单元各自承担一定的角色,相互作用,并通过篇章关系关联在一起,共同构成完整的篇章结构,表达特定的篇章语义和意图。篇章结构分析不仅有助于理解篇章结构和语义,而且可以为自然语言处理的应用,如问答系统、机器翻译、文本摘要等提供有力的支撑。
  篇章结构的研究分析可分为微观和宏观两个层面。在微观层面,篇章结构指的是子句与子句、句子与句子、句群与句群之间的结构与关系;在宏观层面,篇章结构指的是段落与段落、章节与章节、篇章与篇章之间的结构与关系。目前的篇章结构分析主要集中在微观层面,而宏观层面的分析与研究不够充分。主要存在的问题是,宏观篇章结构的理论描述较为抽象,难以转换为可计算的模型,并且尚未有相应的语料资源和计算模型。因此本文以宏观篇章结构为研究对象,重点研究了宏观篇章结构的表示体系、资源建设和计算模型。主要研究内容如下:
  1.本文提出了以主次关系为媒介的宏观和微观统一的篇章结构框架,并针对宏观篇章结构分别构建了逻辑语义结构和功能语用结构。在这个表示体系中,每个篇章都被表示为多层的篇章结构树,篇章单元与篇章单元之间通过篇章关系联系起来,并利用箭头的方向表示各级篇章结构间的主要和次要关系。
  2.以宏观篇章结构表示体系为依据,本文开展了宏观汉语篇章结构语料资源的标注工作,称之为宏观汉语篇章树库(Macro Chinese Discourse Treebank,MCDTB)。在标注过程中,本文迭代地修改了表示体系的定义和语料标注准则。经过近一年的时间,共完成了720篇新闻语料的标注。
  3.在表示体系和语料资源的基础上,本文重点研究了宏观篇章结构分析的两个子任务,篇章结构检测和主次关系判别。为了减少相关任务之间的错误传递,采用两个任务之间的联合模型,并提出了一种基于整数线性规划的优化方法,以实现给定约束条件下的全局优化。最后,本文实现了一个端到端的宏观篇章结构分析器。该篇章结构分析器采用线性链条件随机场和支持向量机分别作为篇章结构检测和篇章关系识别的基础分类器,自底向上地进行篇章结构树的构建,最终生成完整的篇章结构树。
  目前,宏观篇章结构分析还处于起步阶段,本文的研究是探索性工作,在宏观篇章结构表示体系、语料资源和计算模型上均有不同程度的创新,对该领域的相关研究具有重要的参考价值。
其他文献
煤燃烧过程产生的汞排放是大气汞污染的主要来源。吸附剂喷射吸附脱汞法是一种简单易行的燃后脱汞方式,效果较好的活性炭吸附法脱汞因其成本过高而不具有广泛可行性,因此有必要对非碳基吸附剂脱汞技术开展系统的研究。  本文利用实验室小型固定床以及沉降炉实验台架,以高岭土、沸石、石灰石及其改性吸附剂作为研究对象,进行了一系列的固定床吸附实验和沉降炉吸附实验研究。  固定床吸附实验主要考察了吸附剂改性、吸附温度、
学位
大气中氮氧化物的存在及演变对人类生产生活和自然环境均构成极大的危害,在我国,燃煤电站产生的Nox排放逐年增加,对燃煤电站NOx排放进行控制已经刻不容缓。本文采用多种改性方法对活性炭纤维(ACF)进行改性处理,在自制的小型吸附反应器上进行了改性ACF NO/SO2吸附试验。通过对比分析改性及吸附试验前后样品的表面结构和化学官能团的变化,探讨了其可能的改性吸附机理以及各种表面因素对活性炭纤维脱除NO性
学位
由于智能变电站网络工程日益被重视,智能变电站网络可靠性已成为影响变电站稳定运行的重要因素,特别是过程层网络采样值报文对间隔层设备的影响,间隔层设备之间联闭锁信号和跳闸信号的快速性和可靠性分析,以及变电站对故障的即使动作反映、诊断、分析等网络运维问题逐渐暴露出来。为了解决以上有关智能变电站网络可靠性的问题,课题组展开深入研究,取得了重要研究成果。  本文是在参考了诸多国内以及国外的相关文献的前提下,
Ba(MgTa)O3(简称BMT)陶瓷是A(B′B″)O(A=Ba,Sr;B′=Mg,Zn;B″=Nb,Ta)型复合钙钛矿结构化合物中的一种.它是低εr类微波介质陶瓷材料的最优秀的典型代表,可作为滤波器、谐振器上的介质材料应用在微波范围.但此种材料的烧结温度过高,达到1600℃,极易造成Mg、Ba等组分的挥发而使其介电性能恶化.因此,以改善其烧结性能,降低烧结温度,并提高其介电性能为主要目的的对B
该论文以(Zr,Sn)TiO系统为研究对象,讨论了实验因素(添加剂和工艺条件)对系统介电性能的影响,运用方差分析研究了这种影响的显著性,并运用回归分析对这种影响进行了定量描述.(ZrSn)TiO属斜方晶系、Pbcn空间群,是一种常用的微波介质陶瓷材料.本论文向系统中加入了CuO、ZnO、BaCO3、SrCO3和玻璃五种添加剂,以降低烧结温度,改善系统介电性能;并讨论了添加剂含量、预烧温度、烧结温度
学位
以力(或力矩)传递为核心的机床,对机床的精度、刚性要求都很高,运动件往往为了保证其刚性而具有较大的质量,从而传统机床的速度普遍都很低。激光切割则不同,对“飞行光路”结构的机床而言,由于工件不动,又没有切削力的存在,运动梁可以通过采用轻型结构,实现比较高速的运行。另外,激光传递的过程中,只对机床运行的直线性要求较高,而对机床的位置精度要求不高,这就是说,对传动件的累计误差不敏感,从而比较容易获得较宽
学位
该文对大容量CO2大气激光通信系统的总体构成进行了深入的研究,对实现机动式、大容量、高速率、远距离激光大气通信的基本原理和关键技术进行了探讨.文中重点对激光探测关键技术--浮动阈值和AGC技术做了详细论述.浮动阈值系统的核心是数据采集技术,文中介绍了核心芯片TLC5 540和TLC561 5,利用MCS51单片机控制整个系统,对HgCdTe传感器输出的原始信号进行检测,实现了智能浮动阈值控制;同时
高功率CO激光切割机床设备越来越广泛的用于工业加工中,激光切割成套设备供应商也越来越多.激光切割机床不同于传统的机床设备,传统的机床设备以力(或力矩)的传递为核心,而激光切割机床以光的传递为核心,因此,在机床设计方面也就存在着较大的区别.以力(或力矩)传递为核心的机床,对机床的精度、刚性要求都很高,运动件往往为了保证其刚性而具有较大的质量,从而传统机床的速度普遍都很低.激光切割则不同,对"飞行光路
学位
论文主要研究了红外阵列无源定位技术.首先介绍了组合定位系统的工作原理,并研究了具有抗反辐射导弹能力的多传感器系统结构,在此基础上主要进行了两方面的工作:1、分析了基于两站的三维定位算法,推导了定位误差公式,研究了各种因素对定位精度的影响,提出了基于三(多)站的三维定位算法:加权最小二乘法和极小化误差法,并分析了定位精度.2、对被动式多传感器多目标的数据关联进行了研究,提出了一种基于聚类的数据关联算
该论文结合翔鸟无人直升机飞行控制系统的研制工作,对无人直升机的飞行控制方案、控制规律、控制回路及其实现方法等进行了研究,并将研究结果应用于产际飞行控制系统.