一种基于距离支持度的离群数据挖掘算法

来源 :全国第18届计算机技术与应用学术会议(CACIS) | 被引量 : 0次 | 上传用户:wangjj167
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有离群数据发现算法大多是针对低维数据的,这些算法在处理高维海量数据时存在效率问题,而且要求输入参数较多,影响了结果的客观性。针对不同要求下离群数据发现任务,利用距离支持度来改变离群数据的约束范围,提出了一种基于距离的高维海量离群数据挖掘算法DB-HDLO ,该算法与传统的最短距离系统聚类算法SL具有相同聚类结果。以恒星光谱数据为数据集,实验验证了该算法能够高效准确地对高维海量数据聚类,并根据不同要求发现离群数据。
其他文献
可达性是Petri网的最基本的动态性质之一。它是研究Petri网其它动态性质的基石,许多Petri网的其他问题都可以通过其可达性来表述。已有文献提出通过解petri网的状态方程并判
膜联蛋白属于依赖Ca2+的磷脂结合蛋白,组成了一个多功能、多基因的蛋白家族.膜联蛋白家族成员之间序列保守性高,功能结构域相似,一般具有四个保守的内膜联序列区域.植物膜联
多数对人群中烟草及相关问题的研究采用问卷调查方法进行 ,这类研究能够证实吸烟有害健康 ,也能提出一些健康教育措施 ,然而 ,这些措施的实用性需要在人群中验证。众所周知 ,
本文应用C-模糊集合理论,基于对Zadeh模糊集合理论存在的缺陷的修正而进一步修正统一集理论。使综合了经典集合、模糊集合、可拓集合、Vague集合、粗糙集合、集对分析、FHW(
根据手写体汉字字模的特点,通过动态聚类ISODATA算法与基于边缘概率密度函数算法结合使用,使汉字样本距离在聚类过程中动态地变化,使某汉字最后得到的样本模最能反映人们对本
本文分别介绍了基于BP神经网络和基于RBF神经网络的短时交通流量预测模型,研究两种网络模型的预测性能,确定了关键参数的最优值。最后应用两种模型对济南经十路实测交通流数
会议
针对海量日志信息的分析处理,应用了数据挖掘中的DBSCAN聚类算法,并加以实验验证,从而提出了一种海量日志信息分析处理的技术方法。实验结果表明,这种方法能够发现联系紧密的
以粗糙集理论为基础,分析了一般属性约简修正方法的不足,提出直接处理不一致系统的分类规则约简算法及基于粗糙集的数据分类预测规则。实证分析结果表明运用上述算法及规则能
根据虚拟现实系统的特点及软件体系结构设计方法,设计了一个虚拟空间系统。文章详细叙述了虚拟空间的数据组织、提出了系统的软件体系结构并设计了系统的功能,最后实现了一个
分析了J2EE平台的构架和各个组件模型。采用EJB结合Servlet的方法来设计了推理机和知识获取的方法;获取的知识规则以XML文件的形式被保存;用JSP产生动态的用户交互页面。设计