高维空间的数据聚类与异常检测方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:goddesslee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库应用的普及,人们逐步陷入"数据丰富,知识贫乏"的尴尬境地.而近年来互联网的发展与快速普及,使得人类第一次真正体会到了数据海洋无边无际.面对如此巨大的数据资源,人们迫切需要一种新技术和自动工具以便能够利用智能技术帮助我们将这巨大数据资源转换为有用的知识与信息资源,从而帮助我们科学地进行各种决策.数据挖掘技术因此应运而生.该文就数据挖掘中的数据聚类和异常检测技术进行了深入地研究和讨论.大部分的数据挖掘的实际应用都是高维空间中的,设计对高维空间中的数据对象,特别是对高维空间稀疏和怪异分布的数据对象,能进行较好聚类分析的聚类算法和异常数据检测算法已成为数据挖掘研究中的一项挑战.针对现有的数据聚类算法在高维数据聚类上的弊端,该文提出了一种基于超图模式的聚类方法,把数据集中的数据及其间关系表示在一个超图中,通过划分超图来得到数据的聚类.该方法相对于传统方法最大的优势是不需要降维,能够高效的产生高质量的聚类结果.到目前为止,提出的异常检测算法对高维数据异常检测效果都不理想.该文就布尔属性的高维数据提出了一种异常检测方法.它通过定义反映数据稀疏程度的覆盖系数,搜索其低维子空间里的异常模式来检测异常,在该方法中,我们使用到了遗传算法来优化我们的搜索过程,并取得了较好的效果.
其他文献
在音乐信息检索领域中,基于内容的音乐识别和基于内容的音乐推荐是极具市场价值的两个应用。在本文中,这两个问题将在一个统一的、基于音频音乐字模型的音乐表示框架下被讨论。
当前时态地理信息系统TGIS(Temporal GIS)的研究已经成为GIS理论界和数据库团体关注的前沿研究热点之一,而TGIS的核心是时空数据模型.目前学术界提出的时空数据模型存在许多
近些年,在辅助教学领域,平板电脑和手机等手持智能设备越来越流行。利用触摸输入,这些设备为交互式图形查询提供了新的机遇,同时也为复杂图形识别带来了新的挑战。在平面几何教学
图像增强技术在计算机视觉上有着重要的应用价值。通常,对于智能监控、户外对象识别、海洋工程等任务,都假设获得的图像是足够清晰的,具有理想的能见度和亮度的图像。然而,由于极
网络的飞速发展使得对高质量的Web文本信息检索的需求变得空前迫切。在大多数信息检索任务中,用户的需求描述模糊而简短,而已知文档信息的描述空间则非常大且内容复杂。因此信
现代电子计算机与通信技术的应用和发展,极大地促进了世界范围内人类知识的传播和文化的交流。特别是Internet的产生和发展,使全人类的交流更加方便和快捷。WWW(World Wide Web
本文首先对数字图像处理技术的发展现状、应用范围和发展趋势作了简要综述,对球团粒度的计算机在线检测系统作了简要介绍;介绍了球团图像预处理的各种方法;深入的研究了球团
本企业是某集团公司的全资子公司,属于外贸行业,主营轻工、机电、机械等各类贸易品的进出口.业务涵盖各类进出口业务,多种贸易类型:包括自营进出口、代理进出口、投标招标项目管
权利重放攻击是DRM领域最难防御的一种攻击,也是一直困扰DRM技术提供商的严重问题,它严重损害了数字内容提供商的利益。现有的能够有效防止权利重放攻击的方法分为两类,第一类依
推荐系统旨在根据用户的历史行为数据、物品内容等,通过一定推荐算法,自动帮助用户筛选、过滤信息。自从上世纪九十年代推荐技术诞生以来,学术界已经对推荐系统的各个层面问题进