Web使用挖掘与网页个性化服务推荐研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:hongxingdehong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是计算机科学、人工智能和数据库研究方向的一项重要课题,它是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web页面包含复杂的、无结构的、动态的数据信息,如何对Web上的海量信息进行分析,针对用户的需求,提供个性化推荐服务,是当今数据挖掘技术一项重要的应用。本文在总结前人研究成果的基础上,针对Web使用挖掘进行了研究,主要内容归纳如下:(1)对数据挖掘的基本理论知识和分类进行了总体研究,详细分析了Web使用挖掘的数据源,数据预处理的基本流程。(2)对关联规则相关理论进行了详细的介绍,分析了经典Apriori算法的性能,对其进行了改进。在自然连接产生候选集以前先进行一个修剪过程,减少参加连接的项集数量,因而减小生成的候选项集规模,减少了循环迭代次数和运行时间,同时在连接判断步骤中减少多余的判断次数。(3)详细的介绍了K-means聚类算法的基本思想以及流程,分析了它的优缺点,提出了一种改进的K-means算法,即MFA算法。针对K-means算法中每次调整簇中心后确定新的簇中心需要大量的距离计算,提出一种利用簇中心的变化信息来确定新簇中心的方法,通过从动态簇中心集中选取候选集的方法减少了过滤算法的计算复杂度。(4)对校园网网站的日志数据进行分析处理,利用改进的挖掘算法进行数据挖掘,发现用户的访问模式,最后利用挖掘结果,给网站添加个性化推荐功能,主动为用户推荐其可能感兴趣的信息。
其他文献
随着经济的发展社会生产技术的飞速进步,数据密集型企业处理生产数据时需要很大的计算量。使得数据处理在管理中得到更加广泛的应用。而在制造业普遍采用“敏捷制造技术”的
逆向工程中的曲面重建是三维空间数据场可视化的重要方向。曲面重建作为逆向工程中的重要环节之一,其处理的质量与处理的效率制约着CAD的后续再设计等流程。细分曲面具有任意
本文首先介绍了一些网络安全方面的知识,说明了防火墙的重要性,讨论了防火墙规则优化的一些研究成果。防火墙规则优化问题是当前研究的热点,也有许多优秀的研究成果,本文只针
人脸识别一直是模式识别和人工智能领域的研究热点,而且正在逐渐进入安保防护、网上支付、银行业务和智能家居等人类生活的各个方面。随着稀疏表示理论的不断深入研究和发展,
随着互联网的快速发展,互联网上的数据呈现几何级数态势增长,大量的多媒体数据充斥在网络中,网络上海量数据的增长给传统的存储系统技术带来了严峻的挑战,基于P2P网络的存储
随着工业设计的飞速发展,曲面造型技术现已和人们的生活密不可分。传统的曲面造型技术存在着分裂速度快,曲面的求交与剪裁困难,以及尖锐特征处理等问题,因此,为了构造完美的
近年来,伴随着图像处理技术的迅猛发展,利用图像的不同形态成分(如平滑成分、边缘、纹理等)来进行自适应图像分解已成为很多图像处理任务,如图像压缩、重构、去噪、修补和特
本课题来源于国家“十一五”863计划重点项目“面向流程管理的软件生产线”的子项目“可视化表单工具系统”。   表单的主要任务是数据采集,表单设计工具提供了表单页面的
学位
作为Web 2.0时代的典型代表,微博在近年得到了迅猛的发展和广泛的应用。作为一个基于用户关系的信息分享、传播以及获取的社交网络平台,它不仅可以扩大人际圈实现社会交往,更