论文部分内容阅读
概念格作为数据分析和知识发现的一种有用的数学工具,为人工智能领域提供强有力的技术和方法。而概念格属性约简则是概念格理论研究和应用的热点问题之一,它不仅具有重要的理论意义,也具有重要的应用价值。然而,很多传统的属性约简方法具有较高的时间或空间复杂度,无法有效处理快速涌现的大规模数据集。为此,本文利用图论的基本理论方法,研究了包括粒约简和基于决策形式背景的属性约简等问题,设计了面对大规模数据集的有效启发式算法。最后,进一步拓宽了概念格属性约简的应用领域,讨论了其在有限拓扑空间中的应用。本文主要研究内容如下:1、针对一般的形式背景,给出了基于图论的粒约简问题的等价刻画。建立了形式背景上的粒约简问题同所对应图的极小顶点覆盖问题之间的联系,并给出了基于图论的粒约简启发式算法。同时,为了克服该算法因空间复杂度过高的局限性,引入了粒约简问题的局部图表示,给出了局部粒约简算法。同时,为了获取更小的粒约简,提出了两种有效的局部粒约简算法。最后,通过数值实验验证所提出方法的有效性。2、把决策形式背景看成一种特殊的并形式背景,由此导出了其对应的部分图,从而把决策形式背景的粒约简问题转化为其部分图的顶点覆盖问题。利用改进的顶点覆盖方法,给出了基于图的决策形式背景的粒约简算法。为了克服该算法在面对大样本数据集时所面临的局限性,引入了决策形式背景粒约简问题的局部图表示,并给出了对应的局部粒约简算法。最后,利用数值实验从存储空间、粒约简集和运行时间等三个方面检验所提出算法的有效性。3、探讨了强协调的决策形式背景的属性约简问题。在给定的强协调决策形式背景上,给出了两种简化差别矩阵的方法。这两种方法均避开了概念格的生成,它们不仅需要较少的存储空间,而且具有较低的时间复杂度。在此基础上,分别给出了基于这两种简化差别矩阵的图的表示和相应的属性约简算法。最后,通过大规模数据集验证了所提出算法的有效性。4、利用强协调决策形式背景的属性约简方法研究有限拓扑空间中的极小子基问题。通过讨论两种类型的拓扑空间(I-型和II-型)的极小子基问题之间的联系,把II-型拓扑空间的极小子基问题转化为I-型拓扑空间的极小子基问题。对于给定的I-型有限拓扑空间,利用该拓扑空间的最小基构造了一种特殊的决策形式背景,从而把有限拓扑空间中的极小子基问题转化为该决策形式背景上的属性约简问题。在此基础上,利用概念格的属性约简方法,给出了求I-型拓扑空间的极小子基的理论方法和相应的启发式算法,并通过大规模的数据集验证该算法的有效性和可拓展性。