属性赋权的K-Modes算法优化

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:x1ete
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统K-Modes算法的一个主要问题是属性选择问题。K-Modes算法在聚类过程中对每一个属性都同等看待,而在实际应用中,很多数据集仅有几个重要属性对聚类起作用。为了考虑不同属性对聚类的不同影响,将K-Modes聚类算法与属性权重的最优化结合起来,提出一种属性自动赋权的FW-K-Modes算法。该算法不仅可以提高传统K-Modes聚类算法的聚类精度,还能分析各维属性对聚类的贡献程度,实现关键属性的选择。对多个UCI数据集进行了实验,验证了该算法的优良特性。
其他文献
摘要介绍了公路施工项目质量问题的特点,对公路施工存在的质量问题以及原因进行分析,并提出了相应的防治对策。  关键词公路施工;特点;质量问题;防治  中图分类号U4文献标识码A文章编号1673-9671-(2011)051-0132-01    公路建设是一个系统化工程,能影响工程质量的原因有很多,技术是否规范、领导者的决策思想及管理水平、施工工艺、工作的质量及设计、监督单位的建设行为等这一切因素都
对造成水资源紧张的原因,现阶段国内外干旱半干旱地区的调水经验教训,需要注意的问题等进行了简要分析。
日本开发用酶法生产带皮柑橘果汁,营养丰富,成本低,维生素含量高,风味优良,不亚于市售的其他果汁,为橘皮的开发利用提供了新途径。
为吸引高新技术人才创新创业,天津滨海高新技术产业开发区近日拟定并出台了《科技型企业股权激励先行先试工作暂行办法》,在“自主创新资金”中设立“股权激励专项资金”,最高奖励1千万元用于高新技术人才认购企业股份。  股权激励是指公司通过授予公司股权形式給予企业经营者一定的经济权利,使其能够以股东的身份参与企业决策﹑分享利润﹑承担风险,激励他们勤勉尽责地为公司的长期发展服务。据滨海高新区科技局负责人介绍,
摘 要:带式输送机具有运输能力强、运行平稳、在運输途中对物料的损伤小等诸多优点,因此,带式输送机被广泛的运用于煤炭、冶金等运输固体物料的方面。但在带式运输机运行过程中也会出现很多的问题。其中带式输送机皮带跑偏的问题就是比较常见的。因此,当输送机出现问题的时候,就应该立即寻找问题的原因,并进行有效的处理与解决。同时也要注意总结经验与教训,不断的探索提高带式输送机的使用寿命的方法,进而不断的提高输送机
预测燃气轮机未来的功率变化趋势对故障预测非常重要。针对燃气轮机故障预测的问题,提出了一种基于Elman神经网络的功率预测方法。以某电厂燃气轮机的实际数据为例,选取与功率
命名数据网络(named data network,NDN)是一种以数据为中心的新型网络体系结构。现有NDN网络路由策略未能充分利用路由结点缓存导致转发效率不高。为了在路由决策中充分利用NDN
中文实体关系抽取是开放域文本检索与知识发现的研究热点,传统的抽取策略普遍存在人工标注量大,模式通用性受限,关系抽取粒度相对固定等问题,限制了其在开放领域的关系抽取效果。
5月15日,国家林业局2011年科技活动周启动仪式暨森林为民科普展在北京市植物园举行。国家林业局科技司司长彭有冬、科技部政策法规司副司长翟立新、中国林学会副秘书长沈贵等出席活动,来自中国林业科学院、国际竹藤网络中心的有关专家,科普志愿者,以及北京市第六十七中学、北京海淀区培星小学的师生代表近200人参加了活动启动仪式。本次活动宣传展示林业的生态、经济和社会效益,为公众提供一个了解森林、认识生态、探
目前节点重要度评估中针对静态无权图的研究比较多,针对动态加权图的研究相对较少。针对加权网络提出了等效点权节点重要度评估方法;考虑加权网络的动态性,提出了动态距离矩阵更