基于信息采集和全文检索的Intranet网络信息监察系统的研究

来源 :南方医科大学 | 被引量 : 1次 | 上传用户:zjlyqgf888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络技术的发展和信息化建设的不断深入,单位和部门内部的网络应用水平不断提高,网络发展、建设的重点已经由网络建设初期的Internet应用服务转移到单位内部Intranet网络应用的拓展上。各单位普遍以本部门的业务工作为基础,依托Intranet网络建立了多项网络环境下的应用系统,在这些应用系统中,Web成为应用开发的主流平台,随着Web环境下的动态脚本技术、数据库技术开始成为Web应用开发的主流技术,Web环境下的信息发布能力大大增强,包含各种信息的交互式网站如雨后春笋般涌现。伴随着这种建设重心的转移和新技术的应用,各单位的网络应用水平和信息发布能力提高到了一个新的层次,随之而来的是Intranet环境下网络信息的爆炸性增长,如何对这些信息进行有效的监督和管理成为各单位网络管理部门面临的新问题。同Internet上的公共信息不同,Intranet应用中的信息同本单位内部的工作、业务、生活等各个方面息息相关,随着网络这一新生媒体在日常生活中扮演的角色越来越重要,这些网络信息的重要性和影响力也变得越来越大,因此对其进行有效的监管成为网络管理者迫切需要解决的问题,而网络信息的海量特征及其形式的多样性则增加了解决这一问题的技术难度。本文针对这种情况,提出了一种基于信息采集和全文检索技术构建Intranet网络信息监察系统的方法,通过使用计算机技术来实现对目前Intranet网络内Web信息的有效采集和信息的初步筛选,为网络管理者有效地对Intranet内的网络信息进行监管提供了一个可行的解决方案。通过使用目前搜索引擎技术中的爬网机器人技术(Web Crawler、Web Spider),系统的数据采集模块可在较短的时间内完成对Intranet网络内Web信息的数据采集和整理,然后通过数据库的全文检索技术对采集到的大量数据进行初步的检索和筛选。在系统开发过程中,结合Intranet网络内信息的特点,对爬网机器人技术进行了有效的改进,采用了“逐站式搜索”和设定“搜索规则”等技术思路来提高信息采集的准确性和效率。系统提供了基于B/S结构的用户接口,以搜索引擎的方式向用户提供服务,一方面为Intranet内用户提供了实用、方便的网络搜索服务,另一方面通过扩大系统的使用范围来提高系统对敏感信息的识别能力,通过对用户使用时的产生的历史关键字进行记录和分析,结合SQLServer数据库内全文检索引擎的相关技术参数设置,进一步完善系统对敏感信息的覆盖范围和覆盖程度。论文首先对目前Intranet网络信息管理所面临的形势和困难做了简要分析,对Intranet环境下网络信息的特点进行了归纳和总结,在此基础上,提出了一种利用计算机软件技术对网络信息进行有效监管的技术思路,针对系统构建中的一些技术难点提出了相应的解决方法,并对系统软件结构、具体实现方法进行了简要阐述,最后对当前系统已实现的目标和存在的问题以及有待改进的方面进行了总结。
其他文献
从当前的实际情况上看,伴随着教育改革的不断推进,小学课堂中的方法和模式也发生了非常大的转变,需要教师在教学中结合实际的教学现状,引入新型的思想观念,为教学行为的开展
在全球化的进程下,英语发挥着越来越重要的作用,继而萌生出大量幼儿英语培训机构,然而幼儿英语培训效果差强人意,有待进一步提高.本文主要以广州市为例,着重研究幼儿英语培训
《羚羊木雕》是人教版九年义务教育实验课本七年级上册的一篇课文,反映了当前家庭生活中父母与子女之间的矛盾,深受师生喜爱.但教师教学参考书中对父母的行为贴上“重财轻义
对于小学生,班主任应抽出更多的精力,与之交流沟通,加深了解,做好班级良性建设管理工作.对小学班主任班级良性建设管理中的沟通艺术开展探讨,有望改善小学生班级管理现状,给
对于高中阶段的学生来说,已经正处于学习生涯的重要阶段.在这个时期的教学活动中,教师要借助有效的教学方法完成对学生的生涯规划教育.引导学生明确发展的目标,促使学生主动
学位
现今社会有很多父母虽然与孩子生活在一起,但每天早出晚归,与孩子的相处时间几乎为零,常常缺席孩子的成长,疏于对孩子的教育,很多孩子被迫成为“类留守儿童”.陪伴的缺失造成