模糊聚类算法应用研究

被引量 : 0次 | 上传用户:mutaozhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘的重要分支之一,引入模糊理论的模糊聚类分析为现实数据提供了模糊处理能力,在许多领域被广泛应用。在本文中,总结了模糊聚类的原则和通用的方法,讨论了常用的模糊聚类算法,讨论了这些算法的优缺点、存在的问题以及前景展望。 模糊C-均值聚类算法是目前广泛使用的模糊聚类算法。但它也存在一些缺点,例如模糊C-均值(FCM)聚类算法受初始化影响较大,在迭代时容易陷入局部极小。本文从引入隶属度函数、引入消息熵和类中心的约束出发,研究了模糊C-均值的改进方法。 在此基础上,提出了一种改进的模糊C-均值聚类算法。其基本思想是:通过对数据对象的模糊隶属度增加一个加权值,以及在算法中引入模糊聚类有效性函数对聚类数目c进行优选。为了证明改进FCM算法的实用性,我们将该算法应用于两个领域:网络入侵检测和Web日志挖掘。 入侵检测是网络安全的第二道防线。在本文中,分析了入侵检测技术的要点,提出了一种基于改进FCM算法的网络入侵检测方法。该方法的优点是不需要标示或训练数据集。文中使用KDD99数据集作为实验数据,实验结果显示该方法检测未知入侵检测是有效的,而且它提高了入侵检测系统的检测率和误警率。 最后,我们使用改进的模糊聚类算法来分析Web日志数据,以实现Web用户聚类,即根据用户的浏览行为,发现相似的用户组;以及Web页面聚类,即根据Web页面被用户访问的情况,发现相关页面组。实验证明,采用该改进的模糊聚类算法对Web日志挖掘效果良好。
其他文献
目的验证工作场所空气中金属加工液(MWF)浓度的测定方法。方法用37 mm和40 mm的聚四氟乙烯滤膜分别采集工作场所空气中的矿物油类、水溶性、合成、半合成等4种类型的金属加工
文章从我国高职院校旅游管理专业人才培养模式现状入手,阐述了我国高职院校旅游管理专业人才培养模式存在的问题,分析了问题存在的原因,并提出了完善我国旅游管理专业人才培
目的:我国面临着巨大的养老压力。老龄化和超前老龄化使老年人的生活照料、医疗保健、康复服务、精神文化等需求日益凸显,对经济发展造成较大负担。因此,加强对养老问题的探
信息披露有助于缓解资本市场参与者之间的信息不对称并促进资本的有效配置。从会计管制的角度看,上市公司信息披露的内容可以分为强制性披露和自愿性披露。作为与强制性信息
学习策略是影响学生学习的一个重要因素。自从20世纪70年代起,对学习策略的研究已经成为语言教学最热门的课题之一。研究的问题涉及很多方面,即包括学习策略对学习者学习成绩
万事万物都会有更新替代,建筑再利用也不是件新鲜事情了。城市飞速发展,新旧更替也在不断进行。城市中的旧建筑已经不适合城市的发展需要,但作为城市文化的载体,它仍然有其存
随着嵌入式实时操作系统在通信领域的广泛应用,嵌入式软件开发也越来越受到众人瞩目。大量的通信产品采用了诸如VxWorks、pSOS、Linux等嵌入式操作系统进行开发。由于嵌入式
本文在对J大学的学生语言文字应用状况进行调查的基础上,分析了目前大学生中语言文字应用反映出的现象和问题,并针对这些问题,提出了相应的意见和建议。文章共分三部分:(一)
清代,安庆水旱为害甚剧,广大民众开展了种种抗灾自救活动。社仓与义仓是两种民办备荒仓储。康乾之时,安庆各地兴建了社仓,其谷本来自捐输或调拨常平仓谷等,民间自为管理,官府
裂缝是水工混凝土中最常见的缺陷之一,但是,由于水泥的一些与生俱来的特性,以及各种辅助材科以及施工方法等原因的影响,大体积混凝土的裂缝一直是难以避免的,而且是造成混凝土破坏