基于误差数据的最小代价属性选择分治算法

来源 :南京大学学报(自然科学) | 被引量 : 0次 | 上传用户:moon818882003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最小代价属性选择是数据挖掘的重要问题之一,问题的优化目标是得到总代价最小的属性子集。在实际数据的获取过程中,测量误差是不可避免的。基于测量误差,目前已有一些相关的最小代价属性选择方法。但这些方法存在效率上的问题,特别是对大规模数据集。为解决这一关键问题,提出一种基于误差数据的最小代价属性选择分治算法。该算法将数据集按列拆分为若干个互不相交的子数据集,实现对各子数据集的求解,分而治之。对于不同规模的数据集,其子数据集的大小及总个数并非固定不变,而是根据各数据集的规模自适应设定的。该算法通过拆分数据集来降低问
其他文献
某大型商贸城分A、B、C区,采用带移动天窗的"分隔内庭"设计。设A区发生火灾,按自动喷水灭火系统失效与否设置两种情况,经计算对B区物品的最大热辐分别为2.1kW/m^2和8.3kW/m^2,
所谓交往,是人与人之间为了交流信息而相互施加影响的过程.交往既是人的需要,也是现代社会对人的要求,它反映的是人与人之间的相互主体关系.课堂中的交往既是促进个体的社会