一种基于信息熵的混合属性数据谱聚类算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:lovetheme1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的聚类算法只能处理单属性的数据,不能很好地处理混合属性数据的聚类问题,以及目前大多数混合属性数据聚类算法对初始化敏感、不能处理任意形状的数据的问题,提出一种基于信息熵的混合属性数据谱聚类算法,用于处理混合类型数据。首先,提出了一种新的相似性度量方式,利用谱聚类算法中的数值型数据构成的高斯核函数矩阵与新的基于信息熵的分类型数据构成的影响因子矩阵相结合代替了传统的相似度矩阵,新的相似度矩阵避免了数值属性与分类属性数据之间的转换和参数调整;然后,把新的相似度矩阵运用到谱聚类算法中,以便于处理任意形状的数据,最终得出聚类结果。通过在UCI的数据集上的实验表明,该算法能有效地处理混合属性数据的聚类问题,且具有较高的稳定性以及良好的鲁棒性。
其他文献
六师军户农场疫情防控战役以来,社会各界人士,时刻关注着农场一线防控人员的动态,积极为他们献出爱心,让疫情防控的路上更温暖。夫妻同筑爱心桥"老公,现在我们的党员干部为了
连日来,在九师一六四团疫情防控检查站、各居民小区防控卡点等重点防控要害场所,随处可见民兵不畏严寒、坚守在自己的岗位执勤值守,飒爽英姿。作为团场开展疫情防控的一支重
期刊
4月9日上午,新闻出版总署与教育部、公安部等八部委联合下发通知,于4月15日起推行防沉迷系统,7月16日起将在国内网络游戏中全面实施。新闻出版署音像电子和网络出版管理司副司长
大国工匠精神就是在某个行业或职业中通过"师徒制"所形成的爱岗敬业、精益求精的职业理念与工作态度,不仅在本国很有影响力,而且在世界上被广泛地学习和传颂;其精髓是注重细
麻醉药物是临床医疗活动中不可或缺的特殊药品,现有的麻醉药物种类众多,用法不尽相同,国家对麻醉药物的管理也极为严格。多数麻醉药物在连续大剂量使用后均会产生药物依赖性,