高维分类型数据加权子空间聚类算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:matianxiang87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
子空间聚类是高维数据聚类的一种有效手段,子空间聚类的原理就是在最大限度地保留原始数据信息的同时用尽可能小的子空间对数据聚类。在研究了现有的子空间聚类的基础上,引入了一种新的子空间的搜索方式,它结合簇类大小和信息熵计算子空间维的权重,进一步用子空间的特征向量计算簇类的相似度。该算法采用类似层次聚类中凝聚层次聚类的思想进行聚类,克服了单用信息熵或传统相似度的缺点。通过在Zoo、Votes、Soybean三个典型分类型数据集上进行测试发现:与其他算法相比,该算法不仅提高了聚类精度,而且具有很高的稳定性。
其他文献
为提高织物疵点自动检测的准确度,提出一种基于傅里叶特征谱和相关系数的织物疵点检测算法。以平纹、斜纹织物为研究对象,对织物图像进行傅里叶变换,得到织物图像的频谱图;定位频谱中的特征峰点,提取表征图像灰度、纹理的五个特征值;以正常织物为模板,计算待检图像特征值与模板图像特征值之间的相关系数,确定用于识别织物疵点的阈值,来实现织物疵点检测。实验结果表明:当阈值设定为0.80时,该算法能够实现稀密路、断经
采样是网络异常检测中数据采集的主要方法。而网络流的持续时间、数据包的大小、异常流量出现的频率等都在不断变化,给准确的采样带来很多负面的影响。为此,提出了特征感知的
针对传统K均值聚类算法对初始化敏感和容易陷入局部最优的缺点,提出了一种基于扰动免疫粒子群和K均值的混合聚类算法。该算法采用K均值将粒子群进行分类,选择平均适应度值最高
森林资源可持续性宏观调控是一个系统工程。本文在应用系统控制论原理对该系统的基本要素进行全面分析的基础上,提出了相应的控制系统描述模型,并对该系统的稳定性、可控性和可
本文探讨农林复合生态系统生物群体的综合设计,论述农林复合生态系统生物群体综合设计的原则、步骤和基本内容,并总结分析福建省漳州市通过农林复合生态系统发展非木材林产品
建立与社会主义市场经济体制相适应的林业企业财务管理制度至关重要,为此,本文对林业股份公司财务管理制度进行了初步地探讨.
本文介绍了挪威在濒危物种野狼保护中遇到的问题以及政府采取的平衡措施,提出了文化多样性与野生动物保护之间的冲突问题.
作者通过调查,分析了林业股份合作制产生的社会背景,并指出了林业股份合作制在实施过程中存在的5个主要问题:①对林业股份合作制认识不足;②产权主体不明晰;③利益分配不合理;④民主
借鉴可持续发展理论提出林业企业可持续发展的涵义,并分析了林业企业可持续发展的基本条件,即林业企业持续发展的企业制度环境建设、林业企业持续创新能力的建设与林业企业人力