面向突发事件的时序关系识别及其应用研究

来源 :安徽理工大学 | 被引量 : 0次 | 上传用户:jianming_zhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息爆炸的时代每天都会产生大量的新闻事件,而事件作为人类知识的基本单元,对其的相关研究也在逐渐受到人们的关注。事件往往不是孤立存在的,它们之间通过一定的时间顺序关联在一起。通过对新闻文本进行事件时序关系的识别,可以得到文本中事件在时间上的语义关系,帮助人们更快更好的理解文本内容。同时,通过对事件间的时序关系加以利用,在自动问答系统、自动提取等研究工作中都有着重要意义。本文面向中文突发事件,进行事件时序关系识别的研究。针对缺少用于识别中文时序关系识别研究的特征、传统特征对相隔较远的事件作用较弱、识别结果中会出现部分时序逻辑冲突等问题,提出了一种基于多特征和规则约束的事件时序关系识别方法,并在此基础上对基于事件时序关系的自动摘要应用行了研究。研究工作主要包括以下两个方面:(1)基于多特征和规则约束的事件时序关系识别。针对突发事件的时序关系识别研究,首先利用哈工大的语言处理工具LTP对语料库的文本预处理,将XML标注格式的文本还原后进行分词、词性标注、依存句法分析等步骤,在此基础上对文本中句子和词的基本特征进行获取;然后在针对中文语言表达的特点,进一步提取出事件要素、特殊词、因果标志词和触发词相似度等多种特征,并利用最大熵模型对事件间的时序关系进行识别;最后针对识别结果中会出现部分时序逻辑冲突这一问题,提出利用整数线性规划的思想,将事件对之间的连接词、事件类型以及时间信息等自定义规则作为约束条件,结合改进后的目标函数对识别结果进一步优化。实验结果表明,将多特征和规则约束相结合的识别方法对事件间的时序关系进行识别,可以很好的提高识别效果。(2)基于事件时序关系网络的自动摘要抽取。结合图模型的思想,提出利用事件间的时序关系构建事件时序关系网络来对摘要进行抽取。首先,使用语料库中已标注的事件触发词以及事件关系,并结合人工标注的事件时序关系,以事件触发词为节点,事件间的时序关系为边来构建事件时序关系文本表示模型;然后利用PageRank算法思想对网络中各节点对应事件的权重进行计算,并通过事件句与文本标题相似度以及有效词含量来对节点权重进行最终的加权调整;最后利用改进的MMR(最大边缘相关)算法进行冗余处理以增加摘要的多样性,选取MMR值最高的句子加入到摘要句集合当中,直到选取出目标数量的摘要句,并根据事件发展的时序关系,将摘要集合中的事件句进行最终的排序,得到文本的。相关实验表明,基于事件时序关系网络的自动摘要抽取方法在ROUGE评测中取得了较好的实验效果。图[9]表[15]参[60]。
其他文献
学位
鲁迅一生用熔铸着民族传统经验和个体生命体验的思想,为20世纪中国文学发展提供了不可取代的精神资源,而"海洋"元素也可视为理解其创作与精神的新思路。从地域空间来看,浙江绍兴、南京、日本仙台、厦门、广州、上海等地都留下了鲁迅的足迹,面海而居的环境与对生命人生的思索相遇,使其精神世界更加敞开,作品中多样的"海洋"物象更是开拓了他的创作视野。从精神层面来看,鲁迅有着开放探索、追求个体自由与独立的思想,正与
学位
学位
数控机床是现代工业发展的重要设备,为加深科研和操作人员对数控机床的认识,通过搭建实验平台来模拟验证数控机床各种运行状态及性能,因此迫切需要研制数控机床模拟实验装置。目前市场上各种数控机床模拟实验装置的数据采集主要采用有线连接方式,容易产生信号衰减和相互干扰,大多无法实现网络远程监控。因此论文以一维工作台为对象,研制了基于ZigBee和LabVIEW的多物理量无线远程测控系统综合实验装置,实现对数控
炸药爆破法作为破碎岩石、拆除建筑的主要手段在工程爆破领域内得到广泛应用,但是一般的工业炸药在爆破作业中会产生严重的爆破有害效应,其使用受到限制,不依靠炸药爆破的破岩方法为工程爆破研究开辟了新的途径。相比炸药爆破破岩法,不依靠炸药爆破的破岩方法更加安全环保,无抛掷飞石,产生的爆破振动与噪声更低,拓展了工程爆破技术的应用范围。本文主要研究破碎剂破岩法中可控破碎剂的热安全性,一般的可控破碎剂主要由金属氧
最佳测量区是机床在机测量系统实现高精度测量的关键指标,针对不同测量对象,机床在机测量系统在整个测量空间内存在不同的最佳测量区,但现有研究成果缺乏面向圆面测量的机床在机测量系统最佳测量区的研究。为了提高机床在机测量系统测量精度和实现高效测量,以沈阳机床VMC850E型立式加工中心和雷尼绍测头组成的在机测量系统为研究对象,提出了一种新的基于球杆仪的数控机床几何误差辨识与建模方法。利用三平面圆弧轨迹测量
无线传感器网络(Wireless Sensor Network,WSN)作为本世纪最热门的科技之一,其能够对特定区域进行实时数据监控,极大拓展了人类的感知能力,从而被广泛应用于各个领域之中。但由于用来监测的节点常常位于复杂且险恶的环境之中,节点能量难以进行人为补充或者补充能量花费代价过大,因此WSN网络能量严格受限。由于移动代理MA(Mobile Agent)自主性强可独立处理信息,其在网络通信中
近年来,伴随着城市地下空间的开发利用与地上高架桥交通路网的不断延伸完善,新建桥桩邻近运营地铁隧道的工程日益增加。近距离桥桩施工势必会引起土体扰动和变形,导致邻近地铁隧道产生附加变形和内力,对隧道结构的安全性构成了极大威胁。基于此,本文依托杭州市风情大道改建工程,通过理论计算与数值模拟方法探究了桥桩施工对既有地铁隧道纵、横向变形以及管片性能的影响。主要研究成果及创新点如下:(1)建立桥桩施工简化力学
氚增殖包层是聚变堆装置的核心部件之一,其主要功能之一是氚的增殖和提取,以及尽可能的实现氚自持。氚增殖包层采用球床的形式来盛装和堆积颗粒小球,并且球床所处的聚变堆环境极端恶劣,部分颗粒可能会因为受到多重复杂载荷的影响而发生破碎。因此,研究颗粒的破碎行为以及破碎颗粒对球床性能的影响十分重要。论文主要内容如下:1.基于颗粒破碎准则和颗粒破碎形式提出一种模拟球床颗粒破碎的方法,探究增殖包层球床在单轴压缩状