论文部分内容阅读
数据挖掘和知识发现是从数据中获取知识的一种新技术。粗糙集作为一种处理不完全、不精确及不确定信息的有效方法,在数据挖掘和知识发现领域大有用武之地。粗糙集方法的成功应用很大程度上依赖于其理论的完善,只有深入地研究粗糙集的理论体系,才能将之更有效地应用到实际领域。本文以国家自然科学基金项目“管理决策中数据仓库与数据挖掘新技术研究”为背景,从理论和应用两个方面较全面和系统地阐述了这一理论的研究内容和方法。完成的工作和取得的创新性成果在于: 经过对粗糙集理论的深入研究,作者找到了粗糙集与模态逻辑、模糊集、代数系统和区间集代数等抽象理论之间的关系,一是粗糙集可以为抽象理论提供语义解释,从而使我们能更好地理解掌握这些抽象理论;二是粗糙集建立了各个独立的抽象理论之间的内在关系,使彼此独立的抽象理论联系在了一起。 作者研究了粗糙集扩展理论,提出了一种多层粗糙集模型CBM-RS。该模型是一种基于覆盖的扩展的多层粗糙集模型。经过验证,二元自反关系序列下的多层粗糙集模型是CBM-RS模型的特例。CBM-RS模型突破了局限在二元关系之上的多层粗糙集模型的研究。另外,作者提出了基于分类正确度的粗糙集模型,该模型已用于作者研制的数据挖掘方法MIE-RS上。 作者提出了从不一致决策表中挖掘最简规则的粗糙集方法MIE-RS。通过分类正确度有效处理了决策表的不一致性,采用启发式算法,挖掘出满足给定精确度的最简产生式规则知识。作者构造了Hash函数来实现算法,有效降低了算法的时间复杂度。并用多个UCI数据集进行了测试,与著名的Rosetta软件进行了实验对比,结果说明MIE-RS可以大大提高总的数据约简量,有效地简化最终得到的规则知识。 作者提出了有序信息表上的数据分析与数据挖掘模型OITM。从数据挖掘的角度考虑对象排序问题,通过引进属性值上的有序关系,作者扩充了常见的属性值方法,提出了有序信息表的形式化概念,进而提出了一个有序信息表上的数据分析方法,通过分析有序信息表中的属性依赖,定义了有序信息表的约简集和核的概念;作者还提出和形式化了有序信息表中挖掘有序规则的问题,设计了有序决策逻辑语言(ODL),并给出了一个挖掘有序规则的方法。基于有序关系来挖掘有序规则可看作是粗糙集模型的非等价关系扩展的一个具体应用实例。 本文的研究成果,对于拓宽粗糙集的理论及粗糙集在数据挖掘中的应用,有一定的理论和实践意义。