一种不确定数据流聚类算法UStreamUKm

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:shengyu0128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着对流聚类研究的深入,许多研究者提出了对不确定数据流的聚类,这是由于生活中不确定数据存在着重要的应用价值。不确定数据流既保留数据流无限,快速的特性,又存在不确定特性,这对聚类算法提出了更高的要求。在分析不确定数据流聚类问题的基础上,对经典的不确定数据流聚类算法进行比较。本文提出了一种不确定数据流聚类算法UStreamUKm (Uncertain StreamUncertain K-means),算法针对不确定数据流的特点,构造不确定数据流核集减小数据规模,减少了算法的执行时间;同时,通过优化初始聚类中心提升了算法的聚类质量。主要工作如下:(1)采用桶策略处理不断到达的不确定数据流,适应了不确定数据流的应用环境,对不确定数据流构造核集,为后一阶段聚类提供高信息量,小规模的采样点。(2)采用最大最小类间距离即(Max-min Cluster DistanceAlgorithm)MCDA初始聚类中心选择方法,提升了聚类质量。(3)聚类算法中引入了异常点处理机制,降低异常点对聚类结果的影响。实验结果表明算法在保证了执行效率和内存占用率的前提下能够有效的进行不确定数据流聚类。
其他文献
本文以电子商务平台供应链云预研项目的研究开发为应用背景,对基于搜索框/资源池的云计算模型进行了研究,在分析当前集中式搜索引擎系统的基础上,总结了现有系统的优缺点,针对现有
学位
特征选择是统计模式识别中的一个基本步骤和重要任务,并被广泛的应用于图像处理、文本挖掘、计算神经学以及生物信息学等诸多领域。在这些实际应用中,研究对象的观测值(即样
人脸识别是计算机视觉和模式识别领域研究热点之一,具有广泛的应用前景。本文对人脸识别技术进行深入学习和研究,结合当前人脸识别领域中的优秀算法,采用基于肤色检测和AdaBoost
目前,大部分构件的动态组装方法的研究都着眼于软构件模型和运行时软构件的互操作,而很少将其关注点融入整个业务系统的抽象到实现的过程中。复用和组装层次也大都集中在软构件
三支决策理论(3WD)由三种决策规则组成,分别是接受决策、拒绝决策和不承诺决策。在传统的二支决策的基础上,三支决策增加了一个不承诺决策选项,即表示人们可以在信息不充分的
门限代理重签名不仅能防止代理者签名权利过分集中而被滥用,还可保证重签名密钥的安全性和完整性。目前,门限代理重签名方案大多是基于证书或者基于身份的,不可避免的存在密钥托
随着信息技术的不断进步,现实领域产生了海量的数据。传统简单的分类器无法对海量数据准确地进行分类,而已有的研究表明,集成学习方法是一种有效的解决海量数据分类的方法。
数字签名作为密码学的一个重要分支已经被广泛应用于提供安全的电子通信。数字签名具有身份认证、不可否认和数据的完整性等特质适合解决某些任务的安全问题,例如电子交易系
近年来,随着网络通信的快速发展和无线通信技术的逐步成熟,手机、PDA、数码相机等微型化便携设备以其在不经PC中转的情况下就可以进行互联、通信的优势迅速普及。与此同时,车辆