论文部分内容阅读
数据是信息的表现形式和载体,是原始的数字和事实。数据正以巨大的速度迅速增长和积累,大量数据已经普遍存在于各行各业。大数据理论技术的研究和运用已被提升至国家的重要战略地位,大数据时代已然到来。大数据蕴含巨大价值,发现数据背后所隐含的知识是大数据分析的主要目的。可视分析是大数据分析的重要方法。可视分析未来的十大挑战主要聚焦于可视分析领域所关注的核心主题:认知、可视化、人机交互的深度融合。如何创造匹配心理映像的大数据可视化表征,使分析者能够快速、准确把握数据中所隐含的知识,将是面临的最大挑战。信息粒化是人类处理和存储信息的一种方式,大数据挖掘的特点与粒计算范式具有高度契合性,粒计算将作为大数据分析挖掘的一种重要方法。多维混合数据是大数据中普遍存在的一类数据,对其分析研究具有重要的科学价值和实际意义。数据的价值在于其中隐含的关系,为了充分挖掘和分析数据中对象、属性间复杂关系,本文从不同角度出发,构建多维混合数据不同类型粒结构,开展基于偏序模式表示原理的多维混合数据可视分析问题的研究。以发掘属性间关系所隐含信息为目的,探索建立一种能够表示属性层次和属性间关系的结构形式。属性间关系的建立依据的是属性所对应对象集合间的关系,借助属性约束生成的对象粒,构建了属性关联结构,并给出属性的度量参数。同时,针对结构可视化问题开展研究,建立了二维静态、二维动态和三维静态图形的布局和人机交互方法。针对发掘对象间关系所隐含信息的问题,开展对象模式间关系结构构建的研究。客观事物被认识依据的是事物所具有的特征,对象间关系的建立依据对象所具有的属性集合。对象模式可被表示为图形化序列,对象模式间的聚合形成了结构。根据不同的关注点,建立了整体性与局部性互补的两种生成规则。不但给出数学形式化描述,还设计了相应的生成算法和可视化方法。人类对于事物的记忆并非包含着事物所具有的全部特征,具有普遍性和特异性的属性往往被利用。针对数据集的属性约简和小样本数据充分利用的问题,开展对象模式化简和完备化研究。对象模式化简是在保证模式可分性前提下减少模式描述所用属性的问题,建立了利用特征属性计算的对象模式化简方法。另一方面,完备化则是以现有模式为基础,挖掘新模式的过程。文章利用模式与属性间二元关系,建立基于形式概念计算的模式完备化方法。为了对理论进一步验证,以及方法的推广应用,实现了具备以偏序模式表示原理为基础的多维混合数据可视分析核心功能的原型系统。论文结合不同领域的实际数据,开展本文可视化结构和算法在不同实际问题上应用的尝试。经过实验和分析认为,论文所提方法可用于不同领域、不同类型的数据。该方法以充分挖掘数据中所隐藏的属性与属性、属性与对象以及对象与对象间的关系为基本出发点,融合粒计算、形式概念分析在知识表征和处理中的优势,构建符合人类认知规律的可视分析新方法,可为多维混合数据的知识可视化、知识发现、知识推理等问题提供一类新的数学工具及解决方案。