论文部分内容阅读
随着信息技术的不断进步,日常生活和工业环境中的数据持续增长,如何理解这些数据的含义从而帮助用户做出决策成为一项严峻而具有挑战性的难题。数值型数据在表述不确定信息时,往往无法达到对数据的完整性和准确性的要求,信息粒为解决这类不确定问题提供了更有效的解决方案。信息粒是基于数据的特征性和近似性精心设计并抽象化的数据集合,它可以完整并准确地表达数据的含义。通过信息粒化,复杂问题被分解为一系列易于处理的子问题,从而降低问题总体成本。在粒计算中,如何构建信息粒以及如何将信息粒应用于生产建模中成为当前亟待解决的问题之一。本文旨在通过对信息粒构建方法的研究,建立一种通用的信息粒构建模型,并在此基础上,进一步研究信息粒的优化以及应用。本文从不同方面对信息粒进行概念和算法上的研究,例如高阶信息粒,尤其是粒区间信息粒的构建(即信息粒的分层结构)、信息粒的优化(粒度数据聚合)以及信息粒在模糊规则模型中的应用等。
针对Ⅰ型信息粒描述数据时存在的局限性(比如无法满足实际问题中对描述数据的完整性和准确性的要求),本文提出一种应用合理粒度准则构建高阶信息粒(即粒区间信息粒)的方法。以往的研究对应用合理粒度准则构建I型信息粒(尤其是区间和模糊集)进行了大量探讨。然而在处理实际问题时,需要用更复杂的信息粒来表征数据。不同于Ⅰ型信息粒用数值描述,粒区间信息粒采用信息粒本身描述信息粒。因而在使用Ⅱ型信息粒描述数据时,既保证其准确性,又很大程度地提高信息粒的完整程度。Ⅱ型信息粒的构建通过两阶段的设计过程实现:首先,基于现有实验数据构建区间,即Ⅰ型信息粒;其次,对于没有包含在已经构建的区间内部的数据(称之为剩余数据),以信息粒(而不是数值)的形式构建区间边界,从而产生粒区间(即Ⅱ型信息粒)的概念。该方法被应用于高阶粒度模型中,实现了信息粒的分层结构及高阶粒度模型的总体设计思路。
基于现有的合理粒度准则,本文提出一种全新的自适应合理粒度准则。在使用合理粒度准则构建信息粒时,所获得的信息粒由数据的分布直接决定。合理粒度准则并没有充分考虑不同数据分布的特殊性,因此获得的信息粒可能不是最优的。如何基于现有数据获取最优信息粒是一个值得深入思考和研究的问题。本文提出的自适应合理粒度准则,通过构建最优信息粒实现粒度数据聚合,同时在量化信息粒的性能时采用包含性和特征性两个标准表示其最优性。该方法的灵活性源于其引进了一种数据自适应加权方案,通过自适应的选择权重向量构建最优信息粒。在探讨其设计流程时选择所需的优化工具,例如粒子群优化算法(PSO)、差分进化算法(DE)等基于种群的优化技术。通过该方法构建的信息粒直接用于时间序列和空间分布数据的预测模型,同时使用信息粒的形式表示模型输出结果,信息粒的位置和大小用于预测结果和反映预测过程的精度。
针对传统模糊规则模型中模糊规则难以获取以及模型输出结果误差较大等问题,本文提出一种基于信息粒的模糊规则模型的构建方法。该方法从提高模型的精度和准确性等方面为模糊模型的研究提供了有意义的研究方向。模糊规则模型通过一种两阶段设计方案实现,首先,使用模糊C均值聚类算法等常用聚类技术,构建分别位于各个模糊规则的条件和结论部分的模糊集。模糊聚类所获得的结果被用于构建条件和结论部分的模糊规则从而实现模糊规则的重构。所构建模糊集的性能由规则表达数据的重构能力来表述,并通过不断优化重构的模糊集来提高规则表达数据的能力。其次,将模糊规则中的模糊集转换为粒区间信息粒。这一转换过程完全依赖实验数据,并通过充分考虑模糊规则输入和输出空间存在的模糊关系实现。该方案提出的模糊规则模型是建立在两个连续阶段中的双层体系结构,同时,所提出的规则框架引用两种不同推理模式:(a)当新数据位于粒区间信息粒内部的情况下直接调用信息粒;(b)当新数据不属于模糊规则的核心结构时,依据各个规则的活跃水平调用其聚合的近似模式。通过调用这两种模式,所提出的模糊规则模型产生由区间表示的粒度结果,其性能由包含性、条件特征性和结论特征性等描述符进行评估。该方法克服了传统方式获取模糊规则的难点,以信息粒的形式表达输入输出规则,有效提高了模糊规则模型的性能。
本文基于现有研究成果,对信息粒的构建方法及信息粒在系统建模中的应用进行讨论,为以信息粒为基础的粒计算研究提供了颇具价值的研究方向。首先,提出高阶信息粒(尤其是粒区间信息粒)的构建方法为构建信息粒分层结构提供了新思路。通过灵活选择不同类型的信息粒,可以在保证系统功能的前提下,有效提高系统建模中复杂问题的处理效率。其次,提出自适应合理粒度准则,并将其用于粒度数据聚合。例如,通过该方法构建信息粒用于预测数据发展规律,可以有效揭示某些行业发展情况。通过将信息粒应用于模糊规则模型,可以减少数值型数据在构建模型时的不稳定性,从而确保建模过程的高性能。结合本论文相关研究成果,将高阶信息粒用于构建模糊规则模型,为构建高阶粒模糊模型提供一种新的研究思路。在后续研究中,将针对不同信息粒在系统建模中的应用进行详尽讨论,如基于缺失值位置的缺失值插补模型的构建、模糊关系等式的创建和优化及粒时间序列的分割等。
针对Ⅰ型信息粒描述数据时存在的局限性(比如无法满足实际问题中对描述数据的完整性和准确性的要求),本文提出一种应用合理粒度准则构建高阶信息粒(即粒区间信息粒)的方法。以往的研究对应用合理粒度准则构建I型信息粒(尤其是区间和模糊集)进行了大量探讨。然而在处理实际问题时,需要用更复杂的信息粒来表征数据。不同于Ⅰ型信息粒用数值描述,粒区间信息粒采用信息粒本身描述信息粒。因而在使用Ⅱ型信息粒描述数据时,既保证其准确性,又很大程度地提高信息粒的完整程度。Ⅱ型信息粒的构建通过两阶段的设计过程实现:首先,基于现有实验数据构建区间,即Ⅰ型信息粒;其次,对于没有包含在已经构建的区间内部的数据(称之为剩余数据),以信息粒(而不是数值)的形式构建区间边界,从而产生粒区间(即Ⅱ型信息粒)的概念。该方法被应用于高阶粒度模型中,实现了信息粒的分层结构及高阶粒度模型的总体设计思路。
基于现有的合理粒度准则,本文提出一种全新的自适应合理粒度准则。在使用合理粒度准则构建信息粒时,所获得的信息粒由数据的分布直接决定。合理粒度准则并没有充分考虑不同数据分布的特殊性,因此获得的信息粒可能不是最优的。如何基于现有数据获取最优信息粒是一个值得深入思考和研究的问题。本文提出的自适应合理粒度准则,通过构建最优信息粒实现粒度数据聚合,同时在量化信息粒的性能时采用包含性和特征性两个标准表示其最优性。该方法的灵活性源于其引进了一种数据自适应加权方案,通过自适应的选择权重向量构建最优信息粒。在探讨其设计流程时选择所需的优化工具,例如粒子群优化算法(PSO)、差分进化算法(DE)等基于种群的优化技术。通过该方法构建的信息粒直接用于时间序列和空间分布数据的预测模型,同时使用信息粒的形式表示模型输出结果,信息粒的位置和大小用于预测结果和反映预测过程的精度。
针对传统模糊规则模型中模糊规则难以获取以及模型输出结果误差较大等问题,本文提出一种基于信息粒的模糊规则模型的构建方法。该方法从提高模型的精度和准确性等方面为模糊模型的研究提供了有意义的研究方向。模糊规则模型通过一种两阶段设计方案实现,首先,使用模糊C均值聚类算法等常用聚类技术,构建分别位于各个模糊规则的条件和结论部分的模糊集。模糊聚类所获得的结果被用于构建条件和结论部分的模糊规则从而实现模糊规则的重构。所构建模糊集的性能由规则表达数据的重构能力来表述,并通过不断优化重构的模糊集来提高规则表达数据的能力。其次,将模糊规则中的模糊集转换为粒区间信息粒。这一转换过程完全依赖实验数据,并通过充分考虑模糊规则输入和输出空间存在的模糊关系实现。该方案提出的模糊规则模型是建立在两个连续阶段中的双层体系结构,同时,所提出的规则框架引用两种不同推理模式:(a)当新数据位于粒区间信息粒内部的情况下直接调用信息粒;(b)当新数据不属于模糊规则的核心结构时,依据各个规则的活跃水平调用其聚合的近似模式。通过调用这两种模式,所提出的模糊规则模型产生由区间表示的粒度结果,其性能由包含性、条件特征性和结论特征性等描述符进行评估。该方法克服了传统方式获取模糊规则的难点,以信息粒的形式表达输入输出规则,有效提高了模糊规则模型的性能。
本文基于现有研究成果,对信息粒的构建方法及信息粒在系统建模中的应用进行讨论,为以信息粒为基础的粒计算研究提供了颇具价值的研究方向。首先,提出高阶信息粒(尤其是粒区间信息粒)的构建方法为构建信息粒分层结构提供了新思路。通过灵活选择不同类型的信息粒,可以在保证系统功能的前提下,有效提高系统建模中复杂问题的处理效率。其次,提出自适应合理粒度准则,并将其用于粒度数据聚合。例如,通过该方法构建信息粒用于预测数据发展规律,可以有效揭示某些行业发展情况。通过将信息粒应用于模糊规则模型,可以减少数值型数据在构建模型时的不稳定性,从而确保建模过程的高性能。结合本论文相关研究成果,将高阶信息粒用于构建模糊规则模型,为构建高阶粒模糊模型提供一种新的研究思路。在后续研究中,将针对不同信息粒在系统建模中的应用进行详尽讨论,如基于缺失值位置的缺失值插补模型的构建、模糊关系等式的创建和优化及粒时间序列的分割等。