基于信息熵的粗糙K-prototypes聚类算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:sicong907171
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统K-prototypes在计算分类属性的差异度时未考虑各个分类属性对聚类结果的影响程度,且算法容易受到噪声的干扰,无法处理数据中不够精确、不完整等不确定性问题,提出基于信息熵的粗糙K-prototypes聚类算法。在计算数据样本之间分类属性的差异度时,使用信息熵的理论,确定每个分类属性对于聚类分析结果的影响权重;引入粗糙理论,计算得到各样本与粗糙模之间的粗糙相异度,通过多次迭代计算,获得最终聚类结果。该算法结合信息熵和粗糙理论,可区别对待各分类属性,解决数据不精确引起的不确定性问题,4个UCI数据
其他文献
阐述了六西格玛管理的定义及本质;深入探讨了六西格玛管理的理论基础——“零缺陷”理论;从六西格玛管理的核心理念、技术方法、度量系统三个角度系统研究了六西格玛管理的创新
冬虫夏草主要分布在我国四川、青海、西藏,来源于麦角菌科植物真菌冬虫夏草寄生在蝙蜗蛾科昆虫幼虫的子座及幼虫尸体的复合体.一般在初夏子座出土,孢子未发散时挖取的子座与
目的探讨轻度非酒精性脂肪肝(NAFLD)患者血管内皮功能的改变及其与动脉粥样硬化的关系。方法选择健康体检的130例轻度NAFLD患者(NAFLD组)及120例健康者(对照组)进行肱动脉内
贫困大学生人数约占在校大学生总人数的20%左右,这么大的一个群体,他们对学校的学习、生活、人际交往等学校适应性方面是否适应?有哪些特殊性?如何帮助他们尽快适应学校的学
黑龙江省有广大的森林地带,森林脑炎病例报告较多,被列为黑龙江省法定报告的乙类传染病之一。现将黑龙江省森林脑炎的发病情况分析如下。黑龙江省森林脑炎(森脑)最早发现于19
为避免采空区涌水量影响北辛窑矿104工作面回采,首次在工作面回采期间,利用工作面相邻巷道施工泄水孔疏放采空区积水,实现了高产高效安全回采,为以后同类工作面防治水工作提
根据断裂构造和环形构造的解译标志和野外考察的结果,在南水北调西线工程区内确定了近200条断裂构造和26个规模和成因不尽相同的环形构造.断裂构造分别沿NW,NE,近SN和近EW向
牦牛乳是营养价值极其丰富且珍稀的乳制品。相比普通牛乳,牦牛乳蛋白质含量更高。本义丰要介绍了牦牛乳蛋白质的组成及其营养与功能特性,也介绍了牦牛乳中的微量活性蛋白及其功
目的:探究自拟益气化瘀方治疗糖尿病肾病Ⅲ期患者的效果。方法:选取2018年2月~2019年2月收治的糖尿病肾病Ⅲ期患者84例,采用随机数字表法分为研究组与参照组,每组42例。参照
本文介绍了PLC课程教学的现状,针对目前PLC课程教学中存在的问题,结合课程的特点,提出了基于项目驱动与校企合作双教学模式的PLC课程教学改革方案。在此基础上,对新教学模式