【摘 要】
:
针对现有的K-modes聚类初始化方法没有考虑不同的属性具有不同的重要性这一问题,提出一种基于加权密度与加权重叠距离的初始中心选择算法Ini-Weight。Ini-Weight算法通过计算
【机 构】
:
青岛科技大学信息科学与技术学院; 中国科学院计算技术研究所;
【基金项目】
:
国家自然科学基金资助项目(60802042;61273180);山东省自然科学基金资助项目(ZR2011FQ005);山东省高等学校科技计划资助项目(J11LG05)
论文部分内容阅读
针对现有的K-modes聚类初始化方法没有考虑不同的属性具有不同的重要性这一问题,提出一种基于加权密度与加权重叠距离的初始中心选择算法Ini-Weight。Ini-Weight算法通过计算每个对象的密度以及对象之间的距离来选择初始中心。在计算对象的密度以及对象的距离时,Ini-Weight算法根据每个属性的重要性为不同的属性赋予不同的权值。最后,在UCI数据集上将Ini-Weight与现有的方法进行了比较,结果表明,Ini-Weight算法可以有效地区分不同的属性,而且提高了初始中心选择的准确性。
其他文献
断裂在油气成藏与分布中起到了非常重要的作用。南堡凹陷位于渤海湾盆地黄骅凹陷北部,受多期构造运动的影响,断裂极其发育,大量的油气藏都围绕断裂分布。根据区域资料和地震资料
近年来,随着油田勘探开发工作的不断深入,挖潜对象的地层条件越来越差,井况越来越复杂,喇嘛甸油田多数油层为多层非均质性储层,储层在纵向上分布井段长、层数多,各层段的渗透率差异
城市化的快速发展以及发展过程中带来的水污染问题表明,城市水问题和水危机的实质是城市水系统的恶性循环。面对当今水资源短缺和水环境污染问题,迫切需要在理论研究的基础上对
随着社会的发展和进步,特别第三次科技革命之后,科学技术跨越发展,信息资源在社会发展过程中扮演者越来越重要的角色,发挥着越来越重要的作用。政府信息资源作为一种重要的信息资
目的恶性黑色素瘤(malignant melanoma,MM),简称恶黑,是整形外科常见的一种皮肤恶性肿瘤。恶黑具有高度侵袭性和易转移的特点,尽管其仅占所有皮肤黏膜肿瘤的4%,但死亡率极高,发生转移
从适用范围、纺织织物及填充物、附件、结构、标识以及使用说明和包装等方面介绍了GB/T 35448─2017《婴幼儿学步带》的标准要求,并与GB/T 23159─2008《进出口婴幼儿学步带
将从非豆科作物根际土壤中分离,筛选的11个具有固氮能力的菌株,用气相色谱法测定它们在自生培养条件下乙炔还原活性,经检测均具有较强的固氮酶活性。培养液的全氮分析,也具有相吻合
自中国改革开放特别是20世纪90年代以来,中美双边贸易以前所未有的速度蓬勃发展,同时中关贸易顺差规模也逐年扩大,中国已成为美国第一大逆差来源国。中美贸易失衡问题已成为
基于多模谐振器设计了三通带滤波器,该滤波器具有良好的带外抑制、结构紧凑以及频率可控等优点。多模谐振器是由一个短路枝节和四个开路枝节组成,利用经典的奇偶模分析方法对
随着大数据与云计算的发展,以可搜索加密为核心技术的安全搜索问题日益成为国内外研究的热点.围绕可搜索加密的新理论、新方法和新技术,针对可搜索加密的模式、安全性、表达