基于近邻传播的分布式数据流聚类算法

来源 :计算机应用 | 被引量 : 5次 | 上传用户:speed07
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对分布式数据流聚类算法存在的聚类质量不高、通信代价大的问题,提出了密度和代表点聚类思想相结合的分布式数据流聚类算法。该算法的局部站点采用近邻传播聚类,引入了类簇代表点的概念来描述局部分布的概要信息,全局站点采用基于改进的密度聚类算法合并局部站点上传的概要数据结构进而获得全局模型。仿真实验结果表明,所提算法能明显提高分布式环境下数据流的聚类质量,同时算法使用类簇代表点能够发现不同形状的聚簇并显著降低数据传输量。
其他文献
针对传统文本表示模型忽略词项关系的弊端和话题追踪过程中产生的话题漂移问题,提出了结合词语关系的自适应话题追踪算法。通过挖掘词语间的互信息和关联词信息,继而更新传统文本表示模型,通过相似度计算来判断是否为热点话题的后续话题,最后通过更新热点微博话题向量来避免话题漂移问题。实验证明了所提算法针对微博热点话题追踪是有效的。
应用层组播在不同业务领域的性能要求不完全相同,而应用层组播的网络环境也更加复杂,如:组播节点多元化、通信信道复杂化、节点规模庞大化、数据通信量扩大化等,因此需要结合已有应用层组播技术,针对特定业务的优化目标,对组播方案进行优化改进。通过分析应用层组播评价指标,将应用层组播优化方法分为编码特性优化、分层分簇优化、节点性能优化、选择最优父节点优化、路由信息维护优化,比较了不同类型优化方法的性能指标,给
党的十九大报告强调,新时代党的建设要以党的政治建设为统领,把党的政治建设摆在首位.《中共中央关于加强党的政治建设的意见》,对新形势下党的政治建设进行了全面系统的部署