【摘 要】
:
本文提出一种新颖的基于密度的簇结构挖掘算法(MCluStream),以解决数据流聚类中对输入参数选择困难和重叠簇识别问题.首先,设计了一种树拓扑CR-Tree索引结构,将直接核心密度
【机 构】
:
北京科技大学,计算机与通信工程学院,北京,100083
【出 处】
:
第十一全国博士生学术年会——信息技术与安全专题
论文部分内容阅读
本文提出一种新颖的基于密度的簇结构挖掘算法(MCluStream),以解决数据流聚类中对输入参数选择困难和重叠簇识别问题.首先,设计了一种树拓扑CR-Tree索引结构,将直接核心密度可达的一对数据点映射成树结构中的父子关系.蕴含了数据点依赖关系的CR-Tree涵盖了一系列subEps参数下的基于密度的簇结构.其次,提出的MCluStream挖掘算法通过对CR-Tree的在线维护,完成对数据流中簇结构的更新,实现对新增数据的快速聚类.再次,设计了一种快速从CR-Tree提取簇结构的方法,根据可视化的簇结构,选择合理的聚类簇结果.最后,大规模实际和合成数据集上的实验,验证了MCluStream算法的有效挖掘结果和较高的聚类效率.MCluStream适用于面向海量数据流中基于密度的自适应聚类分析应用.
其他文献
In this paper, we firstly introduce the definition of uniformly similar, and revise the adiabatic theorem of the Schr(o)dinger equation in Ref.[7] which is
近年来,随着移动互联网技术进一步完善,大数据的发展趋势已经是时代的潮流.大数据时代的网络传播中,传统的传者和受者、传统的信息传播方式等发生重大改变.在这种改变中,滋生
凉水塔作为循环水的冷却装置,被广泛应用于化工、石油化工、电力等工业部门。70年代起,许多科研、设计和生产单位对凉水塔的塔型、填料、配水、收水器以及风扇等做了大量的技术
伴随着经济的快速发展,人类肆无忌惮的开采以及工业废水的过度排放,包括生态系统和人类健康等环境问题变得越来越严重;其中造成最大的危害就是工业废水的大量排放,如果不及时
胶质类芽孢杆菌(Paenibacillus mucilaginosus)作为微生物肥料广泛应用的功能菌种之一,在农业生产中表现出提高土壤速效钾与速效磷含量、促进作物生长、提高作物产量和品质等
几年来,在参与老年大学器乐教学实践和教学管理工作中,笔者切身感受到,虽然多数老年学员通过学习能够掌握一定的弹奏技法和技能,但却未能很好地掌握演奏技能,弹奏出的音乐过
Users are inclined to share sensitive data in a remote server if strong security mechanism is in place.Searchable encryption satisfies the need of users to
舞蹈是审美教育重要的组成部分,它在创造美、传递美的过程中,强烈吸引着观众参与到这个过程中去,并逐步影响其审美观.可以说舞蹈是互动性的艺术,之所以群众可以参与到舞蹈表
铁介电材料在信息存储、红外传感、通讯以及压电传感等方面有着广阔的应用前景。对于大部分铁介电材料,在相变点附近,会出现明显的介电异样和热学性质的异样变化。为了寻找具
山水画是中国画史上的主流画科,法度完备,宗派林立,画家、作品多如繁星,备受世人关注.因此对于山水画的学习和研究,前人费了不少心思.随着我国老年教育的迅速发展,老年大学山