移动对象聚类和空间离群点检测算法研究

被引量 : 0次 | 上传用户:loughtjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为重要的数据挖掘任务和数据分析技术,聚类分析和离群点检测已被广泛研究,取得了丰硕的成果并应用到众多领域,引起学术界、工业界和各国政府及军队等部门的密切关注。目前,数据挖掘的研究主要针对简单和结构化的数据集。但是随着数据收集技术、计算机网络和数据库技术的迅速发展,各种复杂类型的数据有了爆炸性的增长,因此迫切需要对复杂数据类型探索新的数据挖掘技术。本文从改善轨道聚类效果、提高算法时间效率和屏蔽输入参数敏感性等角度对轨道聚类和空间离群点检测中亟需解决的问题进行了研究,主要工作如下:(1)在已有的轨道聚类算法TRACLUS和基于密度的聚类等相关技术基础上,引入了一种基于邻域的机制,提出了一种基于邻域的轨道聚类改进算法NBTC。NBTC解决了TRACLUS由于使用两个全局参数Eps和MinLns,存在不能从大的、稀疏的轨道聚类中识别出小的、稠密的邻近轨道聚类这一缺陷。在真实和合成轨道数据集上的实验结果表明,NBTC在保持TRACLUS时间效率的同时改善了轨道聚类效果。(2)将取样技术引入轨道聚类,提出了一种快速轨道聚类改进算法FTCS。FTCS根据基于极大连通子图的合并原理,对核心线段的Eps邻域以及与该Eps邻域相重叠的所有轨道聚类进行合并,避免了TRACLUS中核心线段Eps邻域内线段的不必要邻域查询,解决了TRACLUS的线段聚类模块需要对划分后的每条线段进行邻域查询的问题。实验结果表明,FTCS显著降低了邻域查询操作次数,在保持TRACLUS轨道聚类质量的同时提高了轨道聚类的时间效率。(3)根据对象的邻域、反邻域和局部密度构造了基于邻域的局部密度因子,提出了一种屏蔽输入参数敏感的离群点检测方法ODINP。ODINP一个非常显著的优点就是只需要一个输入参数k并对k不敏感,解决了大多数基于密度的离群点检测算法需要设置两个输入参数并对输入参数很敏感的问题。大型、任意形状和高维数据集的测试结果表明,ODINP在保持已有基于密度的离群点检测算法高效性的同时,离群点检测结果的覆盖率和纯度都很高。(4)为了提高离群点检测的时间效率,提出了一种基于空间单元邻域和密度的快速离群点检测算法NDOD。NDOD吸收基于网格方法的思想,首先将数据划分到若干个空间单元,然后利用广度优先来扩张空间单元邻域,可快速排除非离群点,并避免了ODBSN算法用随机方法来扩张方形邻域所带来的方形邻域重叠,最后根据基于影响空间的局部离群因子进行离群点精选,解决了ODBSN在离群点检测结果方面的缺陷。测试结果表明,NDOD是有效的、高效的。
其他文献
上海因早已被洋化,一直被误认为民歌资源缺乏,其实不然。1986年首届华东六省一市民歌会演中,上海曾经涌现过一批优秀的民歌改编创作歌曲。例如《啥鸟飞来节节高》、《晴采桑
<正>信托作为一种极具弹性的财产管理制度,数百年来被广泛运用于民商事领域。然而该制度在中国本土化过程中几经沉浮,甚至被推倒重塑。当我国信托业在《中华人民共和国信托法
在我国社会主义发展进程中,加强地方立法工作,提高地方立法质量已经成为我国立法工作的当务之急。近年来,随着立法行为在社会的需求中的增大,虽然制定了大量的地方性法规,取
"互联网+"使各产业深度融合,产业边界变得越来越模糊,在给现行税制带来挑战的同时,也使得传统的税收管理面临着思维、手段及内容等方面的重大调整。作为税务部门应对数字经济
越来越多的企业面临人员匹配与提升公司绩效的管理挑战,员工个人如何与组织更好的匹配就成为组织关注的焦点。员工个人与组织的价值观匹配是人与组织匹配的重要方面,对提高员
本文通过对在我国国民经济中占据着重要地位的中小企业的融资效率进行研究,为如何提高中小企融资效率提出一些对策和建议。希望通过本文对中小企业融资效率的研究,为创业板上
班组是企业的细胞,企业的发展战略、管理思想、管理目标最终都要落实到班组。企业的执行力要在班组中体现,企业的效益要通过班组实现,企业的安全要由班组来保证,企业文化要靠
近年来,工效设计已成为民用飞机维修性设计的重要内容之一,受到飞机设计人员和工程技术人员的高度重视。本文结合维修性工程和工效学理论,将维修性设计与人机工效设计进行综
目的:培养合格的审方药师,确保患者合理用药。方法:分析我国审方药师的现状,提出培养合格审方药师的具体建议。结果:目前,我国审方药师队伍普遍存在学历、职称偏低,专业知识
采用韩礼德的系统功能语法及语用学的观点分析英语广告实例,可以总结出广告英语中实现人际意义的各类语言手段和规律。通过研究发现,情态动词、非陈述语气、人称代词、模糊语