分布式非结构化文本数据安全分析系统研究与设计

被引量 : 0次 | 上传用户:nimabe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网作为一种重要的传播媒介,在带来发布、传递和获取信息自由便利的同时,各种危及社会稳定、涉及国家重大利益等内容的信息所引发的问题也日益突现。传统的网络监管方式已无法适应不断发展内容安全需求。互联网监管部门在对网络数据进行分析,检索过程大多只关注结构化文本数据。但互联网上绝大部分数据是非结构化数据,从而造成了对这类数据监管能力受到极大限制,特别是在发现和跟踪日益严重网络黑客的各类攻击行为上,缺乏完善的系统进行网络数据的分析和处理。为解决非结构化文本数据分析中关键词设定及数据库索引方面的不足,本文围绕上述网络内容安全的数据分析技术展开研究,主要工作有:(1)在深入研究了网络数据安全分析的相关技术基础上,针对非结构化数据关键字匹配问题,提出一个改进的KMP算法。通过算法理论分析和检验,改进后的算法、比较次数约为KMP算法60%。(2)根据非结构化文本数据的特点,设计了一套非结构文本数据分析检索系统。该系统采用分布式技术,是在Windows平台上建立了一套以任务分发服务器为中心,运算终端为任务处理单元,带有反馈和容错机制的分布式非结构化文本数据安全分析系统。(3)给出了文中设计系统的各个功能部件的详细设计,完成了系统实现,并对系统的整体功能、运算速度以及各模块故障进行了测试。测试表明,系统在设置有效的模式串规则后,能够正常的检测出可疑数据,达到了预期的设计目标。同时,进行了针对性的系统仿真实验,结果表明在部分模块出错的情况下系统运行稳定,能满足在实际工作中的需求。本文的研究工作不仅为我们今后在网络内容安全领域中的研究工作提供了可靠的理论、技术依据,而且具有较好的工程应用价值。
其他文献
正电子发射断层扫描(Positron Emission Tomography)是一种非侵入的成像技术,可以提供活体内放射性示踪剂分布的3D断层图像。探测器的设计是PET系统开发中一个极为重要的环节
本文通过对阿伦特公共领域思想的分析,试图揭示公共领域对于现代人积极生活方式的意义。阿伦特对公共领域问题的反思,以人的现代性存在方式为核心,并始终贯穿着对于人的条件、人
英文广告普遍使用各种修辞手法,以增强广告语言的生动性、艺术性和感染力,从而起到更好地宣传产品的作用。该文通过实例,分析了英文广告中常用的修辞手法对于实现广告劝购功
目的探讨CT影像学诊断应用于临床确诊和治疗肺部真菌感染具有的价值,是否可以为临床确诊和治疗肺部系统真菌感染提供理论依据。方法在我院2017年1月~2018年1月接受治疗的肺部
海南陵水的新村镇是海南疍家人的主要集聚地,其拥有海南独特的疍家渔排文化,极具品牌开发价值。其文化品牌建设方面既具有地域优势明显、文化资源丰富的优势,也存在着有资源
个体与共同体关系问题是人类所要解决的一个基本问题,这也是一个基本的政治哲学问题,即构建怎样的以及怎样构建一个良性的公民与政治共同体关系。西方关于这一问题的实践探索和
<正>由于静脉留置针有操作简单、留置时间长、减少反复穿刺的痛苦、保护血管等优点,已经被广泛使用在儿科病房中。留置针一般可保留3d~5d,小儿活泼好动,不会很好合作保留留置
目的探讨分析重庆市非结核分枝杆菌(NTM)的流行趋势和耐药情况。方法对2016年1月至2017年12月该中心结核实验室分离培养的NTM相关结果进行统计分析。结果 2016-2017年分离培
<正>中国科学院亚热带农业生态研究所2018年10月16日正式发布一种水稻新种质,其亩产可达800公斤以上,水稻长得比人高,株高可达2.2米,具有高产、抗倒伏、抗病虫害、耐淹涝等特