自然邻居相关论文
聚类分析是数据挖掘的常用技术之一,它旨在将数据集划分为若干个小簇且保证簇内对象的相似度尽可能高于簇间对象的相似度。聚类分......
在现实生活中存在大量廉价易获得的无标记样本,具有指导性作用的有标记样本获取十分昂贵且耗时,为了充分利用有标记样本和无标记样......
建筑业劳动密集型粗放式发展已经不适应时代潮流,建筑智能化技术发展迅速。尤其是近几年来,三维(3D)扫描技术应用于工程项目,受到工......
密度峰值算法是一种近几年流行的聚类算法,其算法简洁高效、所需参数少并且能够识别非凸数据集。因此被广泛专家学者关注,并被应用......
针对密度峰值聚类算法存在数据集密度差异较大时,低密度区域聚类中心难以检测和参数敏感的问题,提出了一种新型密度极值算法.引入......
传统聚类方法往往无法避免邻域参数和聚类数量的选择问题,而这些参数在不同形状的数据中的最优选择也不尽相同,需要根据大量先验知......
密度峰值聚类算法是一种基于密度的聚类算法。针对密度峰值聚类算法存在的参数敏感和对复杂流形数据得到的聚类结果较差的缺陷,提......
数据挖掘是从大量数据中发现潜在的有价值的知识,其主要任务包括回归分析(Regression)、关联分析(Association rule learning)、分......
入侵检测系统是继防火墙技术之后的新一代安全保护措施,它通过对计算机系统或网络关键节点信息的采集、分析,从中发现与正常模式不......
数据挖掘是在大量的数据中提取出人们可理解的、存在潜价值的知识、模式、规则或规律的过程。离群检测与聚类分析是数据挖掘领域中......
近年来,随着科学技术的进步,数据收集与数据存储的能力也得到了进一步的发展,从而使人们可以获取海量数据,如何从海量的数据中寻找......
随着互联网的快速发展,各行各业都有源源不断的数据产生,从这些数据中发现有价值的信息并为相关人员提供决策支持,是当前数据挖掘......
随着信息技术的迅猛发展,网络信息量呈爆炸性的增长。以互联网为载体的海量数据蕴含着大量信息,有效的分析并挖掘这些信息中的价值......
为确定数据集真实类数目,降低参数对于密度峰值算法的影响,本文基于自然邻居思想提出了密度峰值(DP)算法的新内核,以摆脱参数的限......
等距映射算法(ISOMAP)是一种典型的非线性流形降维算法,该算法可在尽量保持高维数据测地距离与低维数据空间距离对等关系的基础上......
流形排序算法被广泛地应用到半监督学习领域中,然而其性能紧紧依赖于底层图结构。针对现有的流形排序算法效果欠佳的现状,提出了一......
在文本分类中,传统的KNN算法面临K值不确定,数据集分布不平衡等缺点的影响。基于此提出自然邻的思想,并将其应用到文本分类中,很好......
传统的DBSCAN算法对邻域阈值MinPts与邻域半径值ε两个参数敏感,当数据集中存在密度分布不均匀的类别时,传统DBSCAN算法难以设定两......
标记分布是一种新的机器学习范式,能很好地解决某些标记多义性问题,可看作多标记的泛化。传统的单标记学习和多标记学习均可看作标......
实现自然人机交互是虚拟现实技术发展的目标之一,虚拟手技术是实现该目标的重要手段,是当前的研究热点。基于虚拟手交互应用的不断......
近些年来,最近邻居的概念与对应的邻居搜索算法在数据挖掘、图像处理以及模式识别等多个领域中有着广泛的应用基础并取得了许多令......
实例约简是基于实例的学习算法中的一个比较关键的任务。基于实例的学习算法使用整个训练集来构造决策面,如果训练集中包含过多的......