警备案事件信息提取与可视化方法研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:qb54223322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术多年的快速发展,我国已建成比较完善的国家级、省级和地方综合公安信息系统。公安应急指挥体系由传统的层级结构,逐步过渡到以各级公安指挥中心为核心的协同式系统。原本孤立的多个公安业务系统组合成一个有机的人机应急指挥系统,部门林立、条块分割的公安业务系统实现扁平化和网络化,产生了巨大的社会效益。   事件抽取是指将非结构化文本中的事件信息形成结构化形式的过程,在自动文摘,自动问答,信息检索等领域有着广泛的应用。本文在分析中文文本中案事件信息表达特点的基础上,探讨案事件术语发现方法和自动分类算法,借助地理信息系统(GIS)平台,开发了案事件信息抽取及可视化系统,为警务指挥的辅助决策提供依据。主要工作内容包括:   1.案事件信息的表达方式:介绍了案事件信息源的描述特点。阐述了案事件信息的应用目的并根据应用目的提出了案事件信息的结构化表达方式。构建了针对案件串并的案事件信息关系数据表结构。讨论了案事件信息的分类体系并提出了案事件信息的10种分类类别。   2.案事件信息提取方法的研究:改进了Bootstrapping算法应用于扩展触发词。算法通过触发词和上下文相互学习来扩展触发词,不仅可以跨领域扩展触发词,而且大大减少了人工处理的工作量,是一种自适应很高的算法。实验表明改进后Bootstrapping算法的扩展效果明显,但正确率有待进一步提高;提出了一种基于触发词的案事件分类算法,该算法以同义词词林为分类体系对触发词在语义级别进行分类。算法不仅有效分类而且解决了案事件多类别问题;提出了一种基于位置关系的事件信息提取算法,算法以触发词驱动,通过比较事件信息要素和触发词的相对位置距离筛选候选事件信息。算法解决了单个警务案件文本包含多案事件信息的问题:提出一系列应用领域语言规则提高提取正确率。实验结果表明应用规则后,案事件信息正确率有30%以上的提高,正确率在60%以上。   3.案事件信息的可视化及原型系统实现:本文借助地址解析和地址匹配技术根据案事件信息的应用需求提出了四种案事件信息可视化方法。并在案事件信息提取方法的基础上设计并实现了原型系统。原型系统实现了语料管理、触发词扩展、触发词分类和案事件信息提取四个功能。
其他文献
随着网络融合、通信市场的开放,电信市场上形成了激烈的竞争格局。这些都要求能够快速、灵活提供业务的网络管理能力。在这种情况下,网络管理系统需要由固化、面向结构、面向
随着科学技术的发展和人类社会的进步,人类从对自然的研究发展到对社会的研究,又发展到对人脑思维的研究,而脑电的信息处理研究正是这方面的典型领域。小波分析作为一种新的
随着信息技术尤其是Internet相关技术的发展与成熟,人们已经进入一个信息海量、高速化的时代。这就对人们传统的上网方式提出了挑战,即能否更快更全的找到并接收你感兴趣的信息
无线传感器网络的主要任务是采集环境数据,但是由于其通常部署在敌对区域,网络信息容易遭到敌对方的恶意篡改和伪造,因此如何保证网络收集到的数据的完整性、可靠性与新鲜性
基于机器学习的信息抽取方法性能依赖训练语料的质量和数量。然而标注数据在不同语言分布不均衡,阻碍了中文的信息抽取研究。针对这一问题,研究人员提出跨语言信息抽取方法,
网络与数字技术的发展在促进社会发展的同时也带来了许多负面影响,数字产品的版权保护已经成为了一个需要迫切解决的问题。叛逆者追踪的研究成果对在广播加密领域(如付费电视
移动自组织网络(Mobile Ad-Hoc Network,简称MANET)是一种移动通信和计算机网络相结合的网络,是移动计算机网络的一种。它因为组网灵活、不需要地面设施、无严格的中心节点、
无线Mesh网络是一种新型的无线网络,它是由无线链路、路由器和终端设备组成。它有着多跳、自组织、自愈、高容量、高速率特点,具有很好的应用前景。路由协议研究是目前无线Me
近年来,数据呈爆炸式增长,数据中心已经成为处理大数据的核心基础设施。为了能够快速有效地分析和提取数据中有价值的信息,研究人员提出了分布式计算框架,如Hadoop、Dryad等
随着软件工程技术的不断发展,软件开发的中心任务由过去的代码实现为主变为现在以需求分析为主,软件需求的获取与建模成为软件工程中的研究重点。然而在需求分析的过程中存在着