【摘 要】
:
数据挖掘的首要工作是数据的准备,数据的准备包括:数据选取、数据预处理和数据变换.对于真正的大型数据集来讲,在数据挖掘过程中,给数据挖掘阶段的开采工作带来了困难.探讨数
【机 构】
:
武汉科技学数理系,武汉,430073
【出 处】
:
第五届中国Rough集与软计算学术研讨会
论文部分内容阅读
数据挖掘的首要工作是数据的准备,数据的准备包括:数据选取、数据预处理和数据变换.对于真正的大型数据集来讲,在数据挖掘过程中,给数据挖掘阶段的开采工作带来了困难.探讨数据库的归约是解决这一问题的有效方法,所谓数据归约是把用来挖掘的海量数据集进行归约,丢掉一些无关或多余的信息,重新组合而产生比原数据集小得多的新数据集,但仍接近原数据集的完整性.为了更好地解决数据挖掘理论及实际问题,本文将Rough集理论与统计思想相结合,提出一些行之有效的方法,探讨信息系统数据库的归约问题,并给出一个应用实例.
其他文献
在多目标优化问题中,由于目标函数间有时存在冲突关系,使得寻求最优解有了困难,甚至没有最优解,如何选取各个目标都能达到比较满意的非劣解,人们已经提出了间接解法和直接解
目的 了解本院儿科住院患儿抗菌药物整治前后的用药情况,评价应用的合理性.方法 将本院2012年1月1日-2012年6月30日收治的患儿设为整治前组,2012年7月1日-2012年12月31日收治
目的建立HPLC同时测定新疆药桑枝中绿原酸、芦丁、异槲皮苷、紫云英苷、白藜芦醇和桑色素含量的方法。方法采用PMC pack ODS色谱柱(4.6 mm×250 mm,5μm),以0.2%磷酸水溶液-0
目的建立HPLC-ELSD测定硫酸异帕米星及其注射液的有关物质、硫酸盐和含量的方法。方法采用AgilentSB-C18柱(4.6 mm×250 mm,5μm),有关物质测定采用梯度洗脱法,流动相A为0.2
本文企图研究基于粗糙集理论的方法,通过学生的综合素质评价来分析学生就业的情况,探讨学生找到好工作的要素,分析学生找到好工作要素中的I (S)重要性,从而研究学生的就业与人才
本文根据基于Rough集的Bayes方法用来构造Rough集综合评价矩阵,计算出不同方案的综合确定度,对各方案进行综合评价,从中比较选优,以得出能给决策者带来效益而又可以规避风险的决
运动特征作为视频数据所独有的信息,是视频检索的重点研究对象.然而由于目前的局部运动检索和全局运动检索都由于编码的干扰不能鲁棒的进行视频的分析,只有通过先验知识来避免
本文简单介绍了用于光缆线路障碍判断的光纤测试工具--光时域反射仪(简称OTDR)的原理和简单的使用方法,并以作者在光缆线路设备维护过程中所积累的光纤测试曲线为依据,对光时
个人小档案:罗烨,2001年进入首创置业,随即主持运作声名赫赫的第三置业项目,现任首创朝阳房地产发展有限公司总经理,同时负责运作CBD的禧瑞都和马甸的北环中心项目。记者:禧
本文基于Rough集理论的基本概念,结合遗传算法和神经网络技术,提出了一种数据离散化模型,该方法建立了一个基于Rough集的神经网络,其离散层对应于条件属性的断点集合,通过遗传算法