【摘 要】
:
Web挖掘是数据挖掘的一个重要的研究方向。Web挖掘突破传统意义上的数据格式的限制,随着Web的发展,它会变得越来越重要,成为web用户更好的获得信息的一个有效的途径。 如
论文部分内容阅读
Web挖掘是数据挖掘的一个重要的研究方向。Web挖掘突破传统意义上的数据格式的限制,随着Web的发展,它会变得越来越重要,成为web用户更好的获得信息的一个有效的途径。 如何对网上用户分类是web挖掘领域应用最多的任务之一。对网上用户分类可以使网站针对不同的用户提供不同的服务,这样,用户就能方便快捷的获得自己所需的信息。如何有效的找出关于web用户的分类模式知识是web挖掘研究的热点问题,具有重要的理论意义和实用价值。 本文针对数据挖掘技术在web挖掘中的应用进行了研究工作。在第一章绪论中介绍了本论文的研究背景、研究意义,以及论文的主要工作。第二章对数据挖掘技术的定义,结构,过程以及一些分析方法进行了综述。第三章分析Web挖掘当前研究现状,指出了Web挖掘的困难,着重讨论了Web内容挖掘技术。第四章讨论了Web使用挖掘的过程,模式发现的常用算法,详细分析了日志预处理的各个过程。 第五章中对关联规则的经典算法Apriori进行分析,并指出它的一些缺陷,存在的问题,同时,也讨论FP-growth算法,指出用FP-growth算法来挖掘频繁项集可以避免产生大量候选集,并且算法效率有很大的提高。在此基础上,分析了传统分类关联规则挖掘算法产生的问题,提出一种用于web挖掘的分类关联规则挖掘算法。 第六章运用不同的方法来对web用户兴趣预测。试验表明用于web挖掘的分类关联规则挖掘算法是有效的。在全文的分析基础上,提出一种基于web挖掘的网站个性化推荐系统结构。 第七章是全文的总结和研究工作展望。 论文主要做了以下工作: ● 通过对经典关联规则挖掘算法Apriori进行分析,同时,也讨论FP-growth算法,指出用FP-growth算法来挖掘频繁项集可以避免产生大量候选集,并且算法效率有很大的提高。在此分析基础上,分析了传统分类关联规则
其他文献
近年来互联网的迅猛发展带动了各种网络产业的兴起,多样的通讯模式,繁多的网络应用应运而生。P2P网络对等通信的独特性使得其广泛应用在网络数据下载、网络通讯等各个方面,因此
在信息时代,市场环境变化剧烈。面对全球日益激励的市场竞争,企业特别是中小企业应该充分利用各个方面的资源为自己服务,以提高自己的核心竞争力。而在网络化制造模式下,资源
在软件安全领域,软件故障树分析法是一种重要的软件危害分析方法,但是,软件故障树的建模和分析是非常繁琐费时的,因此,本文将计算机辅助技术引入软件故障树的建模和分析之中,提出了
本文主要是对编钟乐舞动作编排技术进行了研究.简述了面向编钟乐舞的虚拟角色的动作库的制作过程.着重分析了舞蹈文法下的动作归类及其对应关系.探讨了基于情感模型下的动作
互联网技术和移动通信技术的迅猛发展和相互逐步融合,已使“IP协议将成为统一的网络平台”成为业界的共识。人们渴望通过自己手中的移动终端设备接入互联网络,并且享受像固定
本课题来源于大庆采油一厂电能量智能监控及计费系统。该系统基于GPRS数据传输技术,它是电力部门进行电量实时传输,智能监控,进行电量、线损、网损计量和统计分析,以及电费核算的自动化工具。从应用目的,采集数据,功能指标等各方面来看,它都有别于传统的SCADA系统和MIS系统。 本论文以大庆采油一厂为研究对象,详细讨论了系统开发中所使用的技术:GPRS、面向对象技术、数据库技术;并且探讨了系统开发
智能计算机辅助教学(Intelligent Computer Assisted Instruction,简称ICAI)以认知学和思维科学为理论基础,通过研究人类学习思维的特征和过程,将人工智能技术应用于计算机辅
随着全球经济一体化和计算机网络的发展,需要处理的印刷英文材料也在不断增长,传统的键盘输入已经远远不能满足需要,如何解决大批量文字资料的输入成为模式识别领域一个急需解决
中文分词技术属于自然语言处理技术范畴,它是中文信息处理中的一个主要组成部分,是中文语言理解、文献检索、机械翻译以及语言合成系统中最基本的一部分。对于中文搜索引擎,
Web数据库技术属于当前研究热点,是Internet技术与数据库技术的共同发展方向,也是Internet应用研究的关键。如何在Web上发布数据库、实现访问,已成为具有理论研究和实际应用