基于主题策略的Web信息监测系统研究与实现

来源 :重庆大学 | 被引量 : 0次 | 上传用户:db8533
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术快速发展及其普及范围不断扩大,互联网已经逐渐深入到人们的日常生活之中,并成为人们学习和工作生活中的重要组成部分。然而,由于互联网采用自由、开放式的组织结构,随着人们在网络上活动的日益频繁,网络上的信息也日益复杂起来,一些暴力、色情甚至反动等非法信息开始在互联网上传播。这些不良信息,特别是那些事关国家安全以及社会稳定的敏感信息地传播对社会危害极大,因此,如何从大量的网络信息中监测和识别这类信息成为互联网安全领域的一个重要研究课题。目前该领域内很多研究都集中在网关、端口和用户客户端信息地过滤与屏蔽上,其中基于用户客户端信息地过滤与屏蔽对Web信息地监测效果并不理想,而基于网关和端口的信息监测手段通常需要使用端口镜像或分光器,其截取的数据量巨大,对监测系统软硬件需求较高,系统规模和开销都比较大,因而需要一种轻型、高效的信息监测系统。因此,本文研究并提出一种基于主题策略的Web信息检测系统,本文主要工作和成果如下:①通过对Web页面及网络爬行技术地研究,提出一种基于主题策略的Web信息监测系统模型。该模型以主题爬行技术为基础,结合在实际工作中对Web信息监测系统具体使用需求地研究与分析,给出主题策略Web信息检测系统的基本结构。②根据系统研究的需要,通过对主题网络爬行算法地研究与分析,提出一种启发式主题爬行算法,以此算法作为本文监测系统的基础与核心。该算法根据常用主题爬行策略的特点,通过页面辐射空间地引入将主题策略中基于链接分析和基于内容分析的方法相结合,并嵌入启发式算法,从而提出一种基于启发式的主题爬行算法。实验结果表明,该算法较常用爬行算法有较好的爬行效率。③为将研究成果与实践应用相结合,本文研究实现了基于主题策略Web信息监测系统的原型系统并通过校园网实际部署应用进行实验研究与验证,其结果证明本系统可以有效发现所部署的网络环境中包含特定主题的页面,并且可以长时间稳定运行。最后,本文对所做工作进行了总结并对未来工作进行了展望。
其他文献
话题检测与跟踪(TDT)作为一项帮助人们解决信息过载问题的研究,它通过对新闻流中新话题的识别和追踪,将某个话题相关的报道聚集并呈现给用户。但新闻话题的浏览不应该局限于扁
现代密码技术作为信息安全的基础受到了广泛的关注和高度的重视,提出能适应各行各业且安全性较好、成本较低廉、结构较简单的认证加密工作模式已成为现代密码技术研究的热点
自从1991年Internet上万维网公共服务的首次亮相,各种各样的信息就以指数级的增长速度充斥于Internet中,人们寻找信息的方式也随之发生了变化。从最原始的手工查找,到书签服务,再
随着信息技术的迅猛发展,人机交互也越来越成为日常生活中一个不可缺少的部分,人机接口技术的发展也越来越快。传统的鼠标键盘等人机交互手段虽然越来越向方便快捷性方向发展
动态三维面形测量技术是三维面形测量技术的一种动态的、实时测量方法。利用动态三维面形测量技术能简单、方便、快捷地对被测物体进行测量,例如:产品的在线检测、铁路钢轨表
近些年来,随着各种火灾事故和紧急事件频繁的发生,人群聚集的公共场合中突发事件的安全疏散仿真模拟越来越受到重视。对于人员密集和流动性较大的场所如学校、化工厂、旅游景
语音合成也称为TTS(TexttoSpeech)是近年来语音技术研究的热点之一。随着人机交互智能化的日益发展,语音合成技术也日趋成熟,其合成出的语音的可懂度和清晰度都达到了不错的效
作为高性能计算平台,多计算机系统能够为我们提供高速计算服务,这在密集型计算应用中显得尤为重要。随着多机系统结点数目大量增加,系统中出现故障结点的概率随之增大。因此,为维
无线传感器网络被认为是能对二十一世纪产生巨大影响力的技术之一,而感知数据管理与处理技术是实现以数据为中心的传感器网络的核心技术。该技术包括感知网络数据的存储、查询
随着计算机和网络技术的发展,将印刷体文档通过光学字符识别技术(Optical Characters Recognition, OCR)转化为电子格式进行存储和管理已经成为重要的信息流通方式。传统的OC