基于密度系数和共享近邻的谱聚类

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:wilson168168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对self-tuning谱聚类算法采用自适应高斯核计算相似度的方法对一些复杂结构的数据集无法正确聚类的问题,提出一种基于密度系数和共享近邻的谱聚类算法.首先计算每个样本点的密度系数,由密度系数阈值计算样本点的权值和加权的自适应核参数;然后根据密度系数阈值优化互为K近邻图并计算样本点之间共享近邻点的个数;最后根据核参数和共享近邻点的个数计算所有样本点之间的相似度并进行聚类.分别在人工数据集和真实数据集上进行实验,结果表明本文方法在处理一些复杂结构的数据集时可以得到更优越的聚类效果.“,”The self-tuning spectral clustering algorithm uses the adaptive Gauss kernel to calculate the similarity cannot get correct results on complex datasets,a spectral clustering based on density coefficient and shared nearest neighbors is proposed in this paper.Firstly,the density coefficient of the points are calculated and the adaptive kernel parameters are calculated based on the weight.Then,the mutual K nearest neighbor graph is optimized based on the threshold value and the number of shared nearest neighbors are calculated.Finally,the similarity is calculated based on the number of shared nearest neighbors and kernel parameters and clustering.Experiments on artificial and real-world datasets show that the proposed algorithm can obtain a better clustering result in dealing with the complex datasets.
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
广西对虾养殖面积超过30万亩,全区产量约23万吨,产值80亿-100亿元,是广西区水产行业重要的支柱产业,长年以来排名全国第二位.但近年来广西对虾养殖形势严峻,成功率屡创新低,
随着信息化不断发展,PDM系统已经成为国防军工企业战略发展的重要组成部分。在PDM系统建设逐步成熟的背景下,PDM的安全性(身份鉴别与数据安全)也成为摆在国防军工企业面前的一大难题。为解决PDM系统安全性问题,这里以国际通用先进的信息安全技术为参考,以国内信息安全标准为依据,结合PDM系统业务应用的现状,提出了采用PKI公钥基础设施为PDM系统提供安全支撑的技术思路。从而利用PKI完善灵活的接口和
随着近年来我国社会经济发展水平的不断提升,城市化的进程也在不断的深化推进,这就直接促进了建筑行业的繁荣发展,对于建筑工程来说,项目管理是其中一个很重要的部分,因为建
本文通过对荣华二采区10
期刊
我国生产安全的诸多问题rn在党中央和各级政府的高度重视和全社会的努力下,数十年采,我国安全事业有了长足的发展,具体表现在:安全立法初建体系;安全监管逐步加强社会安全观
近年来,在水产品出口领域,各种认证得到了实施和推广,国外销售商和消费者越来越认可这些认证企业或产品。采购商在以前要采购你的产品,看重的是你的产品质量、价格、服务和产
工程管理是影响建设企业经济效益和发展规模的关键性因素.而在建设工程的施工管理中,除了要实现施工方和监理方对于施工各环节、各要素的现场管理与技术把控之外,还要达到建
用 1 8 1条 1 0碱基随机引物扩增感病亲本豫麦 1 3号和含Pm6基因的抗病亲本Tim galen ,有 37条引物在Timgalen中检测到多态性片断 ,经多次重复和F2 验证 ,引物S1 38仍能在Tim