基于结构相似性和压缩变换的聚类方法

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:hanxianzhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对聚类分析在处理任意形状、任意密度和具有一定结构特征的数据集时存在的不足,首先在数据空间中建立离散拓扑流形,通过在此结构上定义邻域密度相似性和邻域密度变化光滑性两个相对性度量标准,并利用可达性给出样本结构相似性和类结构的定义,证明类结构关系是一个等价关系.然后将结构相似性当作吸引力,设计基于压缩变换的聚类方法,该方法具备处理任意形状、任意密度和解释性好等许多优点.最后在人工数据集和标准数据集上的比较实验结果表明,该方法在聚类效率和有效性上都明显优于其它聚类算法. To deal with the shortcomings of clustering in dealing with data sets with arbitrary shape, arbitrary density and certain structural features, a discrete topological manifold is first established in data space. Based on this structure, the definition of neighborhood density similarity and neighborhood density We use the reachability to give the definitions of sample structure similarity and class structure and prove that the class structure relationship is an equivalence relation.Secondly, we use structure similarity as attraction and design based on compression Transform clustering method, the method has many advantages such as arbitrary shape, arbitrary density and good interpretability.Finally, the experimental results on artificial datasets and standard datasets show that the proposed method has the advantages of both clustering efficiency and validity Obviously superior to other clustering algorithms.
其他文献
The social evolution and demo-cratic reform in the Muli Tibetan area was a typical case of the democratic reform conducted in the Ti-betan areas of Sichuan and
钢铁厂产生的矿渣中很大一部分来自氧气顶吹转炉(LD转炉)和吹氧转炉工序.LD工序的主要目的是将熔融的铁水和废钢转化为优质钢.在印度,每年产生的熔融钢渣超过400~450万t.总体
鉴于目前污水处理设施建设运营中出现越来越多的安全事故,本文就当前安全事故的特点,总结了污水处理设施建设前、施工中和运营中安全控制的要点,希望能通过本文的经验总结,给
催化燃烧反应较低的活化能容许反应在贫碳氢化合物浓度下发生,因此绝热反应的温度低于NOx形成的限制,并完全氧化,不形成CO和未完全燃烧的碳氢化合物,燃烧发生在常规气相易燃
提出了村镇绿化需要明确的几个问题,并探讨了村镇绿化的发展趋势及模式.
目前,牡丹江有关噪音扰民的投诉在不断增加,超标噪音污染,严重影响着老百姓的生活质量和精神质量,已经成为牡丹江一个重要的城市问题。只有掌握牡丹江市区声环境质量状况并分析其特征,才能有针对性地提出治理意见,使城市居民,不受噪音的"迫害",使他们能够在紧张的工作之余得以良好的修整。
目的 了解自贡市大安区5岁以下儿童死亡的主要原因及相关因素,并提出相应的干预措施.方法 对2001-2010年大安区妇幼卫生监测点上报的417 例5岁以下儿童死亡监测数据及死因构
介绍了一起服用迭氮钠中毒死亡的案件,实验室中利用离子色谱法,对现场所提取的检材进行检验分析,同时考察了N3-浓度对其保留时间的影响。实验结果表明,运用离子色谱法,采用合
盲元是影响非制冷红外焦平面阵列(IRFPA)成像质量的因素之一。在对非制冷红外焦平面阵列中盲元的响应特性分析的基础上,提出一种基于双阈值快速迭代盲元检测算法。该算法基于
流形数据的查询需要使用流形的嵌入表示,因此查询流形数据需要访问大量的样本数据.提出一种选择标注分层流形学习算法,选择出的标注点集用来帮助查找流形数据.首先采用自适应