属性约简算法和文本相似度计算在智能分析系统的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:zwj306041732
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息化的发展无疑对当前公安工作产生了深远的影响,其最直接的表现就是促进了当前公安工作运行模式的转变。公安的行为由行政行为和侦查行为构成,其中侦查行中的案件现场记录、物证获取和保存、确定或排除嫌疑犯等均是公安的重要职责。为了更好的履行这些职责的需要,在对案件进行分析时,公安部门对应用现代的信息技术的需求越来越迫切。比如:智能分析是办案过程中一个很重要的过程,但是以往的办法是人工分析,耗费了大量的人力物力,而且效果并不显著。基于以上原因本文力图为公安系统的案件现场智能分析的串并案分析方面做出技术分析和实现。其中使用的技术主要是不完备信息系统下基于粗糙集的属性约简技术和基于分词的知网文本语义相似度计算技术。首先,研究了在不完备信息系统下的属性约简算法。基于改进的相容关系,提出了一种属性约简的方法,并通过实例分析说明该算法是可行且有效的。并设计了一个基于本文提出的基于相容关系的属性约简算法的原型系统,目的是对公安系统的智能分析系统提供一种新的决策支持方法,进一步提高案件分析的及时性和准确性。本文设计的知识获取模型主要是解决案件串并问题。该模型可扩展,具有一定的普遍性。在中文信息处理中,文本相似度的计算广泛应用于信息检索、机器翻译、自动问答系统、文本挖掘等领域,是一个非常基础而关键的问题,长期以来一直是人们研究的热点和难点。本文分析比较了现有的文本相似度计算方法,然后提出了一种新方法,它基于知网语义相似度计算的文本相似度计算方法,随后利用此方法结合分词算法,给出了中文文本相似度计算的计算机系统实现过程,并以IT文本为例进行了测试,对所用方法进行了验证。这一课题的研究及其成果对于中文信息处理中的多种领域尤其是科技类文本相似度的计算比较,都将具有一定的参考价值和良好的应用前景。本文在对上诉两种技术做了介绍和改进后,针对公安的实际需求,实现了智能分析的串并案智能分析子系统,并通过实验验证了其正确性。
其他文献
目前,在作者学院内使用的题库系统是基于C/S模式的。主要工作流程是:在客户端输入要生成的试题科目,点击搜索,查询信息会递交给题目服务器,经若干等待时间后,题目服务器将符
随着大数据时代的来临,对海量数据进行分类的需求日益增加,各种分类算法被应用在不同领域。然而,面对信息时代数据的急剧增长,单一的分类算法通常存在弊端,不能很好地满足需求。大
说话人识别,也叫声纹识别,是利用话音对说话人进行区分,从而进行身份鉴别与认证的技术。说话人识别能够广泛的应用到各种身份认证、安全保密、电话购物等系统中。会话语音,是
网格是当前并行与分布式计算技术的一个重要发展方向,其目标是实现对地理上广泛分布的大量异构资源进行共享。资源管理是网格的关键技术之一,但是由于网格固有的异构性、分布
普适计算是适应计算机及相关技术发展的新型计算模式,它使人们能够随时随地地使用计算资源和信息服务。无线传感器网络是普适计算的重要研究领域。集成了传感器、微机电系统和
现在的许多大学都拥有自己的高性能计算资源,通常情况下,这些资源都是分散的,无法让广大的科研工作者统一使用,以解决长期困扰他们的大规模计算问题。本文提出一种应用网格计算技
上世纪90年代提出的格子波尔兹曼算法(LBM)是计算流体力学中最常用和最容易实现的并行算法之一。但是,该算法目前还存在着明显的局限性:在高速流动情况下,经典LBM算法不能适用。
集成了传感器、嵌入式计算、网络和无线通信四大技术而形成的无线传感器网络是一种全新的信息获取和处理技术,它是一种新型的无基础设施的无线网络,能够协作地实时监测、感知
新一代的网络技术Ad hoc网络,是一种没有有线基础设施支持的无线网络。由于其动态网络拓扑结构、无中心控制等特点,使得移动Ad hoc网络的安全问题成为关键问题之一。当前移动Ad
随着Internet和Web技术的发展,Web应用系统在Internet上的使用也越来越广泛。特别是互联网进入Web 2.0时代,Web应用以内容为中心,转向以个人为中心、以内容为媒介。那么个人学习