一种大数据环境下的新聚类算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:songyuyue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种新的聚类算法NGKCA,该算法克服了经典聚类算法检测率和稳定性的不足,适用于解决大数据环境下的聚类问题。NGKCA聚类算法包括4个阶段:首先利用谱聚类NJW算法对大数据集进行列降维和数据归一化处理,其次引入对初始值不敏感的粒子群算法对数据集进行行降维从而选出临时的聚类中心集,接着通过全局Kmeans算法对最佳聚类中心集进行聚类以获取聚类中心点,最后使用粒子群算法对聚类中心点进行调整进而获取最终的聚类划分。在一些著名的机器学习数据集和国际标准的网络安全数据集KDDCUP99上进行实验,结果表明:提出的算法比谱聚类、Kmeans、粒子群、全局Kmeans等常见算法具有更好的稳定性和更高的检测率,与全局Kmeans算法相比具有更优的时间复杂度。
其他文献
<正>在现今高中数学竞赛以及高考中,构造法有着广泛的应用。构造法就是依据某些数学问题的条件或结论所具有的典型特征,用已知条件中的元素为"元件",用已知的数学关系为"支架
<正>历史于时序更替中前行,梦想在砥砺奋进中实现。当时间叩响2015中考的大门,2014那一个个充满激情的时刻定格为难忘的历史记忆,汇成涌动的课改大潮,澎湃着2015的新期待和新
提出了一种融合多模传感器的室内实时高精度轨迹生成方法,亦即将室内Wi-Fi定位与传感器定位结合起来,生成用户在室内移动的实时轨迹。首先由Wi-Fi定位出用户的初始位置,然后
随着GIS、LBS技术和移动互联网技术等核心技术的发展,服务于普通大众的个人导航系统成为应用热点。室内行走引导是个人导航系统的核心之一,其中涉及的室内定位技术一直是研究
近10余年来,一批学者在对《诗经》篇章写作时代的考订上进行了集中而持续的工作,有较大进展。该项研究的总体趋势表现为研究成果数量日益丰富、研究范围日益拓宽、对年代的推
影视课教学的积极意义已得到广泛的认可,但影视课的课堂教学应当怎么安排,还存在着争议。在"i+1"理论视角下,以词汇的习得为切入点,开展实证研究,证明了双字幕电影对学习的积
针对OpenFlow协议报文交换机制里所有非数据报文均需要通过PACKET_IN报文上传控制器的弱点,提出一种不停查询未知转发地址从而造成SDN网络控制层面资源耗尽的新型DoS攻击方式
要使学生物理语言表达更科学、准确、更符合逻辑,那就需要物理教师必须注重物理语言表达的专业化,为学生做好示范作用;在对学生进行语言表达能力的培养中,教师要努力营造民主
从用户产生和消费Feeds的角度分析社交网络变得不活跃的原因,通过分析人人网某大学社区用户长周期的Feeds行为来探讨该社区用户活跃度的变化。通过对用户活跃性周期和Feeds时
20世纪80年代的先锋小说的先锋性有别于以往小说,在艺术表现上体现在小说叙事的多重性上。苏童小说《罂粟之家》是该类小说的典型作品。表现为:以平行的方式从不同的角度展现