一种启发式聚类特征选择方法

来源 :东南大学学报:英文版 | 被引量 : 0次 | 上传用户:sjk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了使聚类可以在低维数据空间中进行,提出了一种新的聚类特征选择方法.该方法分3个步骤,每个步骤都在一个wrapper框架中执行.首先,将所有原始特征都按照重要性进行排序,引入一个特征重要性评价函数E(f);然后,顺序地选择特征组成重要特征子集;最后。去除重要特征子集中可能存在的冗余特征.由于是顺序选择特征而不是在巨大的特征子集空间中进行搜索,因此算法效率很高.实验结果表明该方法可以找出有助于聚类的重要特征子集,并且可以去掉那些不利于聚类的特征.
其他文献
为寻求一种驱动电导率(大于0.02S/m)溶液的新方法,探讨了利用交流电热效应驱动高电导率微流体.根据交流电热效应理论,建立了交流电热粒子诱捕物理模型,利用仿真软件FEMLAB对其进行仿
供应链的发展过程是持续聚集知识和转换知识的过程.首先,阐述了供应链协同知识创新的前提条件;然后分析了供应链协同知识创新的特征,包括:过程复杂性、积累和进化过程、成员
企业内部会计监督是企业经营活动有序进行的重要保障,是现代企业内部管理控制制度的重要组成部份。但是企业内部会计监督机制但在我国的一些企业的会计工作中, 弄虚作假会计工作秋序混乱、会计信息失真的现象及其严重。本文通过分析我国企业内部会计监督存在的问题和产生的原因,针对如何加强企业内部会计监督提出了切实可行的几点措施。  一、企业内部会计监督存在的问题  1.缺乏有效的内部会计控制制度。在企业内部,广泛
为了对处于环境温、湿度中的混凝土的收缩变形进行有效数值模拟分析,提出了一种数值解析与有限元分析相结合的方法.根据多孔介质热质传输原理描述混凝土中湿热迁移过程的耦合偏
为精确描述问答网络论坛的主题信息,提出构建面向英语自然语言的问答知识表示模型,进而提出包括数据采集、平台搭建和应用设计在内的问答知识系统的完整解决方案.模型借助先
为了提高服务组合的质量和效率,提出了一种基于语义约束的服务组合算法.算法中,首先利用2层语义匹配算法对用户需求和服务库中的服务进行比较,利用用户约束性个性化需求对符
为了探讨随机谐振现象的发生对信号、非线性系统和噪音的依赖性,特别是对噪音的依赖性,以互信息量为测度研究了二进制信号在非线性门限阵列的传输问题.在高斯混合噪音下计算了单
从脱氮率、工艺运行以及节能角度对A/O工艺与分段进水2种生物脱氮工艺进行比较.结果表明,当污泥回流比为50%的条件下,分段进水工艺能达到高于80%的总氮去除率,但是A/O工艺只能达到40%.
应用Chemkin化学动力学软件包中的Senkin模块模拟了正庚烷在多孔介质发动机中的燃烧过程.通过修改Senkin程序,结合了Woschni传热模型和多孔介质换热模型,并在正庚烷详细氧化机理
摘要:人力资本作为一种生产要素,在经济的发展中发挥着决定性的作用。本文利用最小二乘法,采用了道格拉斯生产函数形式,并新增加了人力资本投入变量,实证分析了湖北省1990-2011年人力资本对经济增长的贡献,结果发现湖北省人力资本的弹性系数为7.73。并且通过Granger因果检验发现,经济的增长可以促进人力资本质量的提高。最后在此基础上提出相应的政策建议。  关键词:人力资本;经济增长;OLS  一