【摘 要】
:
突发事件会对生命财产安全、公共秩序以及社会环境造成伤害,因此亟需对突发事件建立信息抽取体系,从非结构化的文本中提取出事件的结构化信息和蕴含的关系,以快速认识突发事件的信息和演化过程,为应急决策领域提供数据和技术支持。本文根据突发事件特点将其分为事件发生类、事件描述类、事件影响类和事后处理类四类,提出了一种适用于描述突发事件的事件表示框架,并基于该框架对突发事件的抽取和演化关键问题展开研究。主要研究
论文部分内容阅读
突发事件会对生命财产安全、公共秩序以及社会环境造成伤害,因此亟需对突发事件建立信息抽取体系,从非结构化的文本中提取出事件的结构化信息和蕴含的关系,以快速认识突发事件的信息和演化过程,为应急决策领域提供数据和技术支持。本文根据突发事件特点将其分为事件发生类、事件描述类、事件影响类和事后处理类四类,提出了一种适用于描述突发事件的事件表示框架,并基于该框架对突发事件的抽取和演化关键问题展开研究。主要研究内容如下:(1)提出一种基于未知触发词的事件句识别方法。为提高对语义特征的学习效果,采用BERT预训练模型将中文句子中的字映射成字向量,并加入句法和词性特征作为输入,通过CNN提取词级特征,Bi-LSTM和注意力机制提取整个句子序列的语义特征来提高事件句的识别率,通过对比实验验证了本方法的事件识别效果。(2)提出了一种融合实体特征的事件要素抽取方法。利用实体与事件要素间的关系,在字向量的基础上加入实体特征向量作为输入,通过Bi-LSTM和CRF提取序列特征来标注事件句中的要素。(3)基于句法分析和事件表示框架,对事件要素抽取不完整的情况提出了补全算法。根据事件句中的要素间依存句法关系,设计要素补全规则和算法,为事件的联合分析及演化分析提供了更完整的信源。(4)针对突发事件领域的事件间关系,提出了一种融合事件句间关联特征及关系模式信息的抽取模型。将两事件句按顺序拼接后进行联合编码提取两事件句间的关联特征,然后融入事件对的关系模式特征帮助关系分类,突破了独立地对两个事件句做特征提取的局限性,进一步提升了事件关系抽取的效果。(5)为弥补事件关系在突发事件演化分析中的不足,提出了一种基于双注意力的突发事件演化关系抽取模型。分别对情景要素和事件与其所在句做注意力计算,捕捉情景要素与事件的关联特征,分析情景要素对突发事件的影响作用,以更全面地分析事件演化发展方向和机理,为事件发展趋势预测提供依据。最后完成了验证系统的设计与实现,融合多种针对事件文本的模型结果,实现数据的可视化,帮助人们更直观地看到事件信息和演化过程。
其他文献
随着目前数据体量的急剧增长,数据中心对于算力的需求也日益增大,诸如加密解密计算、深度学习在线推理、云VR、云游戏业务等各类应用的算力需求已远远超过了通用处理器的能力所及。此时采用异构计算技术来增加系统的算力的方案已经成为业界趋势。但是异构计算系统中的各类异构计算单元存在差异性,用户直接使用异构计算资源需要接触异构计算系统底层细节,最终导致异构计算系统产生客制化成程度高、难于开发及部署等问题。本文诣
地面移动通信系统的飞速发展,使万物互联不再是遥远的祈愿。目前,对于第五代移动通信技术(Fifth Generation,5G)的研究愈来愈多,5G商业化的推进也发展迅猛。然而地面移动通信系统仍有其自身无法解决的问题,譬如远距离传输、全球覆盖等问题都需要依靠卫星系统进行弥补。因此,卫星通信也是近年来通信领域的热点研究内容,但因卫星的功率受限、带宽受限情况以及卫星通信间两点传输距离极远所引入的时延差等
通信领域发展迅速,电磁环境日渐繁杂,频谱资源越发珍稀,解决提高频谱效率问题迫在眉睫。变换域通信系统(Transform Domain Communication System,TDCS)拥有动态频谱共享接入特性及抗干扰通信方面的独特优势。而自适应编码技术,能够依据信道环境与服务质量要求,经过动态切换发射端的参数数值,进一步提升系统资源利用率。将变换域通信系统与自适应调制编码技术相融合,可以发挥自适
随着数据的高速增长和云存储服务的快速发展,云计算依靠其诸多的优点,如高效性、便捷性、支持按需付费、高扩展性等不断吸引着用户,致使越来越多的组织和个人用户倾向于将自己的数据迁移到云环境中进行存储,并且对于一些较为重要的文件,用户可以采取存储多个备份的形式来提高文件的安全性,但是云存储在给人们带来了诸多方便的同时也带来了一系列的安全问题。本文对云环境下数据安全的关键技术进行了学习和分析,并着重于研究云
随着5G以及未来6G的到来,网络的用户数越来越多,通信速率越来越高。地面移动通信系统已经不能满足通信需求时,需要卫星通信系统来增加通信的容量。同时,地形条件恶劣及人迹罕至地区的通信,由于基站建立成本过高,也需要卫星通信系统来拓宽通信覆盖面积。另外,为了提高军事通信的保密性和抗截获能力,卫星通信网络体系的构建也就显得特别重要。为了充分满足上述需求,大型低轨卫星星座群的构建已经成为一种发展趋势。而随着
因为无线频谱资源的短缺,毫米波通信在近年来得到了重视与广泛研究。毫米波通信可以拥有更宽的带宽,同时也可以降低天线的尺寸,具有很好的应用前景。毫米波通信与大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)系统都属于第五代移动通信技术(5th-Generation,5G)的关键技术。信道估计是进行无线通信的第一步。在传统的MIMO系统中,由于天线数目不多,不同
新兴无线系统旨在结合更多功能并符合更多的电信标准,为此无线系统越来越需要更小尺寸、更低成本以及更高性能的电路,在这种复杂的系统架构中,振荡器是最关键以及当今商用无线系统中体积较大的模块之一,因此对于缩小此类模块的需求很大。薄膜体声波谐振器(Film Bulk Acoustic Resonator,FBAR)具有高品质因数和低尺寸的特点,相较于传统的SAW等器件有了很大的性能提升,这就使其成为替代片
多输入多输出(MIMO)技术可以成倍地提升通信系统的频谱利用率,在应对现今社会呈指数式增长的无线接入需求上发挥着重要作用。自MIMO技术问世以来,低复杂度高性能的信号检测算法一直是科研工作者和工程师们的研究热点。期望传播(EP)是一种专门解决后验概率估计的算法,在解决通信系统信号检测上有广泛的应用。本文的研究重点为基于期望传播的MIMO信号检测算法。期望传播算法是一种迭代更新的确定性概率近似算法,
随着移动互联网的发展以及在社会生产与生活中深入而广泛的应用,用户对于数据传输的速率提出了更高的需求。而无线通信技术自一开始发展以来,直到当前的5G时代,电磁波的传播环境就一直被视为随机的且不受控制的,其中的阴影衰落和多径效应等深刻地影响着移动网络通信的效率和用户的服务质量。而近年来所出现的由大量低成本的被动式反射单元所构成的可编辑智能反射面,其上的各被动式反射单元能独立地对入射信号的幅度或相位进行
自相似集是最基本最重要的分形集类,对于该集类的研究非常广泛而深入。本论文研究自相似集的两个基本问题:有限多个区间并的自相似性以及类自相似集的性质。论文的第一部分讨论了有限多个区间并的自相似性。分形几何中一个基本的问题就是如何由已知的自相似集构造出新的自相似集,其中一个典型的问题就是两个相同长度的闭区间的并是否还是一个满足开集条件的自相似集,进一步地,有限多个闭区间的并是否还是满足开集条件的自相似集