论文部分内容阅读
21世纪的今天,随着计算机科学技术的不断发展,计算机网络在今天得到了普及,其规模日趋扩大。那些曾经以信息获取和交流沟通类为主要业务的基础网络服务商们正逐渐朝着以休闲娱乐、电子服务、电子商务三大类服务为主的业务扩展网络服务,现如今网络用户的行为变得也越来越复杂,伴随着用户行为所产生的网络数据量巨大无比。各类商业网站以及公共事业网站等等都需要利用网络用户行为产生的这些数据来挖掘出具有价值的数据。一方面,商业网站为了追求利润,需要去分析用户的行为及爱好。因此,了解互联网络,实现对网络中用户的行为的分析变得越发重要紧迫。本文主要研究的内容:建立了网络用户行为的概念与分类体系,并在此基础上对用户进行了分类;对网络行为分析系统的信息源进行了深入分析,通过分析网络用户行为的数据,寻找出隐藏其中的规律和模式。探讨建立网络用户行为分析系统的需求、步骤和体系框架,以及设计和实现系统过程中所面临的一些关键技术,接着在上述基础上提出几种常用的网络用户行为分析系统模型或思想。通过对比聚类分析、关联规则算法等相关的数据挖掘算法后,选择了Apriori算法作为用户行为数据挖掘系统的核心算法,并对该算法做了进一步的改进和优化。本文依据数据挖掘算法所具有的一些自身的特点以及基于网络中用户行为的数据挖掘系统的功能需求提出了一种数据挖掘的模型,系统主要功能模块包括数据获取模块、数据预处理模块、兴趣挖掘模块等内容,通过利用Apriori算法这个核心算法实现了基于网络用户行为的数据挖掘,并对Apriori算法做了相关的实验研究,通过对实验结果进行分析,总结出了基于网络用户行为以及用户好友关系的相关规律。