面向海量数据流的基于密度的簇结构挖掘算法

来源 :软件学报 | 被引量 : 0次 | 上传用户:xiaoxiao_666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于密度的簇结构挖掘算法(mining density-based clustering structure over data streams,简称MClu Stream),以解决数据流密度聚类中输入参数选择困难和重叠簇识别等问题.首先,设计了一种树拓扑CR-Tree索引结构,将直接核心可达的一对数据点映射成树结构中的父子关系,蕴含了数据点依赖关系的CR-Tree涵盖了一系列sub Eps参数下的基于密度的簇结构;其次,MClu Stream算法采用滑动窗口的方式更新CR-Tree,在线维护当前窗口上的簇结构,实现了对海量数据流的快速演化聚类分析;再次,设计了一种快速从CR-Tree提取簇结构的方法,根据可视化的簇结构,选择合理的聚类结果;最后,在真实和合成海量数据上的实验验证了MClu Stream算法具有有效的挖掘效果、较高的聚类效率和较小的空间开销.MClu Stream可适用于海量数据流应用中自适应的密度聚类演化分析.
其他文献
新生代农民工素质成为制约我国产业转型升级的重要障碍,新生代农民工职业教育是实现农村劳动力转移的重要途径,也是推进新型城镇化的关键因素。我国新生代农民工职业教育存在
<正> 日本川崎钢铁公司新近开发出铁素体不锈钢新品种,其物理性能基本与奥氏体或镍—铬不锈钢相当,但成本较低,它分为两种,一种是P430UD,其深冲性相当于304或SUS304不锈钢.抗
为增强企业竞争力、提升产品质量,云南新立有色金属有限公司(以下简称新立公司)引进了乌克兰全流程海绵钛生产技术,成功实现了熔盐氯化技术、铝粉除钒技术、7.5 t"I"型半联合
离心式压缩机在国民经济各部门中有着重要的地位,相对于容积式压缩机而言,其具有流量大、工艺性能好、结构简单等特点,因此在化工、能源以及冶金等领域有着广泛的应用。近年
电子政务是政府在国民经济和社会信息化的背景下,以提高政府办公效率,改善决策和投资环境为目标,将政府的信息发布、管理、服务、沟通功能向网络进行迁移的系统解决方案。北
研究目的本研究在对我国公共卫生服务特别是农村公共卫生服务供给的现状及存在的问题、效率等全面了解的基础上,借鉴比较成熟的国内外关于私立机构参与公共卫生服务供给的理
柔顺控制技术是针对工业生产中与外界环境接触的任务提出的,为机器人配备高精度的力觉传感器以及力反馈控制系统,可使机器人具备对外界环境柔顺控制的能力,大大提高产品的生产效
随着社会不断的向数字化和网络化发展,以及人们安全意识的普遍提高,视频监控行业得到了极其迅速的发展,而高清IP Camera具有图像清晰、交互性好、可进行智能分析等先进功能,
"两级传播"理论自20世纪40年代诞生以来一直争议不断。从其理论形成的逻辑起点考察:它研究的重点不是以媒介为中心的信息传播,而是以受众群为主体的个人影响,媒介对受众一般
公元前4世纪雅典的陪审法庭不但行使最高司法权,而且干预立法,行使大部分监察机和部分行政管理权,实际上处于国家最高权力机关的地位。违法法令诉讼对于陪审法庭的政治权力有着