论文部分内容阅读
1982年,波兰学者Z.Pawlak提出的粗糙集理论是一种刻画不完整性和不确定性的数学工具,能够有效地分析各种不完备的信息。他建立在分类机制的基础上,利用已知的知识库,来(近似)刻画不精确或不确定的知识。该理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息。Beaubouef.T将粗糙集理论与传统的关系数据库模型相结合提出了粗糙关系数据库模型(RRDM)的概念来描述不确定性信息系统。RRDM与普通关系数据库模型在很多方面上是相同的,最主要的不同点是它的属性值可以有多个原子值构成,而不像关系数据库是单属性值,所以RRDM实际上是一个多值信息系统。RRDM是结合了粗糙集理论的一些基本概念如等价类、上近似、下近似和关系数据库的一些基本理论而形成的,它是对标准关系数据库模型的扩展,它是为了增强关系数据库的信息表达能力而提出的。数据查询是数据库系统的核心操作,粗糙关系数据库上的查询叫做粗糙数据查询,粗糙数据查询分为三类:精确查询、粗糙完全查询和粗糙组合查询。目前不少国内外学者在如何实现粗糙数据查询的问题上进行了研究,其共同特点是利用属性值域上的语义等价关系扩充原选择条件后完成查询,由于扩充后的选择条件增加了对各语义相同值的判断,降低了查询效率。本文针对目前粗糙数据查询的实现方法存在的问题,提出一种基于位向量编码的查询实现方式。首先根据属性值域上的语义关系将多值数据编码为单一的位向量码值,在处理查询时只需要对编码值进行判断,无需考虑原属性值域上的语义关系,从而简化粗糙数据查询的实现,提高查询效率。同时,这种查询是基于标准的SQL语句,可以在现有的关系数据库上实现粗糙关系数据库的功能,具有良好的实用性。本文的主要工作有:1.提出了基于位向量编码的查询实现方式,并给出位向量编码的具体算法,并对位向量码值的维护算法进行了讨论。2.针对三类不同的粗糙数据查询,给出了基于位向量编码的具体实现。3.设计了相应的实验与已有的查询实现方法进行对比。通过对实验结果的分析,我们得出了一些有用的结论。