蚁群算法研究及其在Web挖掘聚类上的应用

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:zjk130
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今的人类社会是信息化的社会。在科学技术尤其是网络技术的推动下,万维网不管是在深度还是广度方面都在高速发展。互联网在前所未有地改变我们生活的同时,带来的还有几何级数的数据。在这些海量的、异构的信息资源中,蕴含着具有巨大潜在价值的知识,怎样从这些数据源中提取出可信的、有效的、对人们有用的信息成为当今社会的一大研究热点,数据挖掘技术正是在这种背景下产生并发展起来的。本文主要研究蚁群聚类算法在Web聚类挖掘分析中的应用,通过对现有的蚁群聚类算法的改进,使得算法有更好的性能,从而更适用于Web挖掘聚类分析中,主要内容包括:首先是数据挖掘和Web挖掘概述,对数据挖掘和Web挖掘的一些基本概念、数据挖掘系统等数据挖掘的一些基础知识进行介绍,然后对数据挖掘中的聚类分析技术进行了阐述,介绍聚类的基本概念,聚类技术的研究现状,并比较分析了当前比较重要的几类聚类方法。其次介绍蚁群聚类算法的基本模型和建立在基本模型基础上的LF蚁群聚类算法,深入分析了LF算法的优缺点并在其基础上加以改进,提出一种改进的蚁群聚类算法,通过仿真实验证明了改进算法比LF算法有更好的性能,解决了LF算法收敛比较慢、迭代周期长的缺点,并且使得改进后的聚类算法更适用于Web挖掘聚类分析上。最后在改进后的聚类:算法的基础上建立一个小型的Web挖掘聚类系统。
其他文献
下一代互联网为用户带来了丰富多彩的用户体验,但同时庞大的网络流量也给网络管理人员及服务提供商带来了巨大的挑战。流量监测是保障网络可控性的基础。目前传输速率为10Gbp
专利的技术方案信息是专利信息的重要组成部分,是专利作者创新精髓,是专利保护的主要对象。然而技术方案信息是以自由文本的形式存在,因此如何将技术方案信息转化为计算机可处理
流媒体点播(Video-on-Demand)系统的应用随着宽带技术的日益成熟而得到越来越多的关注。系统的结构也由最初的C/S架构转为现在流行的P2P(Peer-to-Peer)模式,因为P2P模式可以更
随着信息技术的飞速发展,人们从信息匮乏时代过渡到了信息过载时代,用户很难从海量的数据中找到自己感兴趣或对自己有价值的信息。推荐系统是应对信息过载问题的一个有效的解
随着互联网服务提供商提供的服务越来越多,互联网结构也变得越来越复杂,网络测量在互联网管理和服务质量保证方面扮演着重要的角色。由于互联网管理范围非常宽广,对作为运营
本文研究卷积神经网络在入脸-背景二分类识别、手写数字识别、多类图像分类识别和景物标记中的应用。本文采用具有不同特征抽取过滤层的卷积神经网络与其他优化模型相结合的
随着软件系统复杂度的不断增加,对软件需求的抽象变得越来越困难。在一个复杂的软件系统中,需要对用户场景进行充分描述,并对系统结构进行形式化建模。在软件工程中,构件可以
随着Internet的迅速发展和不断普及,越来越多的人开始关注信息安全领域。可信计算(Trusted Computing)作为信息安全领域中最为热点的问题,直接关系着软件或系统是否能够正常
流量监测对网络管理和分析具有重要的意义,它为网络优化、故障发现、异常预警、流量特征提取、流量建模等提供了必不可少的依据。当今的网络环境规模大、结构复杂、主干速度高
近年来,随着社会网络、通信网络、生物网络等在各领域应用的快速发展,其产生的图模型数据更是呈现出快速增长的态势。图作为一种数据结构具有本身其特有的表示方法和信息,一