基于用户浏览兴趣度的WEB挖掘

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:udbnny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着WWW上信息的爆炸性增长,在如此海量的数据中发现有用的信息变得越来越困难。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。本文首先论述了WWW发展的基本现状以及当前存在的一些问题。随后,简要介绍了数据挖掘技术的基本概念、原理,接着对Web使用模式挖掘的数据采集、用户浏览兴趣的度量和表达两个方面进行了研究,主要的工作有: 1.分析了现有Web使用模式挖掘的数据采集方式,指出了当前数据采集方式的不足,如由于HTTP协议的无状态连接而难以在Web日志中得到准确的用户浏览信息。提出了一种综合利用服务器日志文件和客户端数据获取用户浏览信息的方法。2.本文针对Web使用模式挖掘领域,首先分析了已有的度量用户浏览兴趣方式的不足之处,如度量方式过于简单而导致不能更好地区分用户感兴趣类与不感兴趣类; 没有考虑页面信息量对用户浏览时长的影响等。在此基础上,提出了一种基于用户浏览行为度量用户浏览兴趣的方法。3.如何有效地表达用户浏览兴趣是Web使用模式挖掘研究的方向之一。本文在分析了现有的表达用户浏览兴趣方式的基础上,提出了一种基于树形结构表达用户浏览兴趣的方式。本文提出的基于用户浏览行为度量和表达用户浏览兴趣的方法改进了原有的度量和表达方式在数据采集、兴趣度量、兴趣表达几个方面的不足,以便更好地为进一步的挖掘做准备。
其他文献
无线传感器网络,尤其是移动无线传感器网络,以其感应数据高保真性,节点位置可调整,节点移动可控制,网络部署灵活等优点,被广泛应用于无人值守现场、灾难发生现场、紧急救援现场、医
随着计算机应用领域的迅速扩大,软件规模及复杂性的不断提高,软件危机日益严重,提高软件的生产效率和质量成为软件产业的当务之急。近些年来面向对象技术的发展成熟和Interne
随着计算机、多媒体技术的快速发展和普及应用,数字产品信息的交流变得更加的快捷和方便了,而在信息交流快捷的情况下,信息的获取也变得更加容易了,由此就引发了很多的问题,图像、
在实际生活中,我们经常会遇到各种各样的网络系统,如计算机网络、电网和铁路交通网等。为了方便用户监控这些网络,我们常常会提供一个人性化的图形用户界面,用户可以通过它来
近年来,随着以因特网为主体的信息高速公路不断普及和发展,信息技术已经渗透到我们社会生活的每个角落,它正在以前所未有的速度和能力改变着我们的生活和工作方式,因特网上的
以太网技术在二十多年的发展过程中,从单一的数据网变成了混合的应用网,目前已经包括了诸多典型应用,并得到广泛使用。以太网供电技术使以太网能够为设备提供直流电源,从而能够简
随着计算机的日益普及、因特网的迅猛发展,网上信息呈指数级增长。同时,信息资源的共享度愈来愈高,给人们的日常生活带来极大的便利。目前,人们每天面对大量的信息,如何从海量数据
计算机自动化管理系统在图书馆的应用使图书馆的工作面貌发生了本质的变化,面对大量的从日常管理中产生的数据,图书馆管理者迫切希望从中获取有效信息来指导管理决策。传统的图
随着信息时代的加速发展,智能手机已经成为今后人们移动通信的重要工具。所谓的智能手机不仅应该具有传统手机的通话功能,它还应该具有足够的屏幕尺寸和带宽、信息及数据处理能
UML模型是软件开发早期产生的一种中间产品,它虽然在不是软件的最终产品,但是它的质量高低极大的影响后续阶段产品的品质,如实现代码。为此UML模型的质量度量研究一直是当前