【摘 要】
:
一个网站由许多个网页组成,网站上的信息分布在这些网页上,而不同用户对不同网页上的信息感兴趣,现在随着网络技术的高速发展,网络上的信息呈指数增长,所以人们要想在众多的信息资
论文部分内容阅读
一个网站由许多个网页组成,网站上的信息分布在这些网页上,而不同用户对不同网页上的信息感兴趣,现在随着网络技术的高速发展,网络上的信息呈指数增长,所以人们要想在众多的信息资源中找到自己需要的信息越来越困难。如何通过使用挖掘技术来了解用户的兴趣和爱好,分析用户的浏览模式,并如何根据用户的当前访问需要,自动实时地为用户提供推荐页面,成为了一个热点研究课题。
本文主要研究如何利用Web挖掘分析日志得到用户对网站的访问模式,据此提出一种能帮助站点所有新老用户提高访问效率的推荐技术,完善站点拓扑结构,以提高站点访问效率。为此,本文主要做了以下几个方面的研究工作:
1)概述了Web挖掘的有关研究内容,探讨了关联规则数据挖掘的研究现状。
2)从Web日志文件内容向各种挖掘算法提供准确的数据源,对Web日志挖掘数据进行预处理工作,并对其中的问题进行了讨论。
3)介绍了经典的Apriori算法和FP—growth算法,结合FP—growth算法中FP树的生成,提出了一种新的类FP—growth算法对频繁路径进行挖掘,并对传统FP—growth算法进行改进,用于对目标页面的挖掘。
4)设计了一个个性化网站定制服务系统。
本文的研究工作是对挖掘关联规则的FP—growth算法的切实可行的改进,对研究关联规则的挖掘算法具有一定的参考价值。而对用户访问模式的研究有利于提高站点信息服务质量,促进智能信息处理领域的发展,在理论和实践上都有重要的研究意义。
其他文献
Rootkit是一种新型的恶意程序程序或程序集,设计的目的是用来秘密的控制被攻占的计算机的行为。通过隐蔽后门程序或其他类似的工具程序,使得这些工具程序能在指定计算机上长
本文以海尔的中网发展战略为背景,通过对家庭网络中间件技术的研究,设计了家庭网络中间件系统,从而为下一步提供更加方便智能的家庭网络服务打下了坚实的基础,主要工作包括以
传统的家电已经无法满足现代家庭的需要,人们需要能够自动获取外界信息、能与其它家电协同合作并具有智能化的信息家电(IA),因此信息家电智能化的发展是未来家庭发展的必然趋
XML自1998年由W3C提出之后,已经成为因特网上数据表示和数据交换的新标准,各行各业都在使用XML描述本领域信息,随着XML文档的急剧增加,如何有效存储、管理和查询这些XML数据
随着Internet迅猛发展,接入Internet的用户数量剧增以及服务网络固有的延迟,造成Web服务器负载和用户访问延迟严重等一系列问题,用户的服务质量得不到很好的保证。缓存技术能
随着计算机系统性能的不断提高、存储数据量急剧增加以及信息越来越复杂,用户如何高效组织和管理信息成为信息技术的重要课题。文件系统作为操作系统中存储和管理信息的主要构
随着Web服务技术鉴于其封装性、松耦合等特点获得了的广泛应用,众多的服务提供商将他们的服务以Web服务的形式封装并发布。相应的,消费者对于服务的功能、反应速度、服务质量
随着我国经济体制和行政体制改革的深化,社会正处于转型期,在这种形势下,要求政府及时主动公开政府信息,加强与公众之间的沟通,为公众提供高效便捷的服务,履行公共服务的职能
随着通讯与计算技术的不断发展,无线传感器网络正在发挥越来越重要的作用。无线传感器网络通过传感器节点收集并传输观测数据,最终将观测数据交付观察者。它跟传统无线网络最
数据挖掘是指从大量的、不完全的、有噪声的、模糊的数据中提取出隐含在其中的、人们事先不知道的但又潜在有用的知识的半自动化的方法,它是解决“数据丰富、信息贫乏”的有