同构语义日志知识库上频繁Web访问模式发现的研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:joyuan100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁Web访问模式发现是Web使用挖掘的关键内容,能够从海量Web数据中发现有用的用户访问信息,从而帮助企业改善站点和服务器设计,提升用户服务质量。语义Web为当前Web上的内容赋予了计算机可以理解并解释的语义,能够有效提升Web使用挖掘的效率。语义Web中,本体和规则的结合能够扬长避短,相互弥补不足。对于进一步改善频繁模式发现的效果具有重要意义。本文从语义Web本体和规则出发,着重研究日志本体之上本体和规则的结合以及同构语义日志知识库上的频繁Web访问模式发现。主要工作如下:1.提出了一种日志本体形式化描述的改进。将日志本体七元组的形式改为六元组,采用应用规则表示日志本体中的领域关系,并完善了日志本体的分层形式化描述。这种改进不仅可以避免在日志本体中出现较为复杂的领域关系,也更加符合Web使用挖掘领域的要求。2.改进了本体翻译算法并应用于日志本体,引入DL-safe规则将日志本体知识库和Datalog规则库取并构建同构日志知识库。在现有研究的基础上结合日志本体的特征改进了本体翻译算法,将日志本体知识库转换为选言Datalog规则库。这种方法转换的日志本体可以和在DL-safe规则限制下的网站应用规则同构形成语义日志知识库。在一定程度上实现了日志本体和规则的统一。3.基于FARMER算法提出一种频繁Web访问模式发现的方法。在FARMER算法的基础上,给出了一种同构日志知识库之上的频繁模式发现算法。可以从日志本体基准事件出发构建可接受谓词集,在扩展trie树节点的同时通过模式有效性验证和支持度计算发现频繁访问模式频繁访问模式发现。4.设计和实现了一个同构日志知识库频繁Web访问模式发现系统。综合前面的研究成果,开发和实现了一个用于频繁Web访问模式发现的系统实现了日志本体和应用规则导入,在满足DL-safe安全约束的条件下,翻译日志本体为选言规则生成同构日志知识库,并在基础上实现本文提出的深度优先频繁访问模式发现算法。对该系统进行实验测试验证了理论研究的可行性。
其他文献
近年来,时间序列数据挖掘的研究技术在很多领域得以应用。合适的时间序列模型是对序列特性的一种反映,由于基于模型的时间序列数据挖掘方法能够发现序列的内在规律,因此这种
面向服务架构(Service-OrientedArchitecture,SOA)代表一种新的架构模型,它旨在提高一个企业的敏捷度与成本效率,降低一个组织中的整体IT负担。它通过把服务定位为表示方案逻
学位
Ad Hoc是一种不依赖任何基础设施且能进行自治的网络。由于该网络拓扑结构的变化莫测、无线信道的不稳定等特性,使得Ad Hoc网络中路由协议的可靠性问题十分突出。因此,在研究和
学位
随着计算机技术、信息处理技术和网络通信技术的迅速发展,信息安全技术也在不断地更新和完善。信息隐藏技术作为信息安全的一项重要技术,它利用人类视觉掩蔽特性和数字图像信
随着便携设备上高画质视频处理等需求的日益增长,高性能编解码等相关问题的研究逐渐成为热点。H.264作为新一代视频编解码标准,具有高压缩率和高画质等特点,但同时它的计算复
学位
随着信息技术的飞速发展,语音合成技术越来越受到研究者的重视。随着各种新技术的出现与应用,特别是基音同步叠加算法的提出,使语音合成技术有了新的发展,语音合成的自然度和
学位
在网络普及的今天,网络安全问题日益严重。入侵检测系统已经成为防火墙之后的第二道安全防线,在一定程度上维护了网络安全,但是在入侵检测系统中存在严重的误报和漏报现象,无
随着互联网络的高速发展和广泛应用,web服务作为一种新兴的web应用模式也得到了长足的发展,其数量与日俱增,如何提高服务的查准率与查全率,最大限度的满足用户的需要成为迫切
学位
安全协议是在开放网络中借助密码体制达到密钥分配、身份认证、信息保密等特定目标的通信规范,其正确性对网络应用的安全至关重要。安全协议的手工分析十分困难,容易出错,因此,使
自IB方法提出以来,IB理论及其算法在各领域的应用不断地加深,随之也暴露出一些问题,其中之一是:IB理论所定义的相关变量必须与源变量以共现数据的形式出现,即IB算法需要事先得