论文部分内容阅读
随着Internet技术的迅速发展与不断普及,企业间的竞争变得日益激烈。谁能够深入了解用户的上网习惯、兴趣特征与浏览路径等,就能在市场竞争中占据更加有利的地位。如何进行精细化的市场定位,如何为客户提供更加个性化的服务,越来越受到互联网企业的重视。基于互联网用户的上网行为日志数据,发掘数据背后的用户上网行为模式,能够为企业的精确化营销策略提供指导和建议,并提高企业的市场竞争力。而分析不同用户群的上网兴趣特征,可以向同一用户群推荐更适合交流的好友,能为扩宽交际提供依据。文章详细介绍了数据挖掘的概念、数据挖掘的相关流程和任务、Web挖掘的概念和流程、Web挖掘的分类和商业价值、K-means聚类算法和预测强度、我国互联网发展现状、互联网用户行为的分类和特点以及数据挖掘在用户行为分析中的应用等。文章采用统计学和数据挖掘相关技术对互联网中的用户行为数据进行分析和挖掘,发现数据中隐藏的用户行为规律与模式。基于网络日志的互联网用户行为分析实证部分分为数据说明、数据预处理、模型建立和结果分析四个模块。其中数据预处理和建立模型的相关算法均由R统计软件进行编写和实现。文章利用Web日志对网站和客户端进行归类、统计与分析,以及引入预测强度作为K-means聚类算法中的K值选取标准建立模型。根据模型总结不同用户群的上网行为习惯和兴趣特征,并对各个用户群进行精细化分析,寻找感兴趣的模式,为企业的个性化营销活动提供数据支持。