论文部分内容阅读
关系数据库存储的数据具有语义模糊性。例如,数据库中存储“高”、“矮”、“胖”、“瘦”、“适度”、“一般”等数据导致了数据的模糊性,某些字段上存储的NULL值(或允许为NULL)导致信息的不完整,同时,估计NULL值,也导致了信息的不确定。模糊本体是描述模糊概念和概念之间联系的共享概念模型的规范化的形式说明,可以表达自然语言中的模糊语义。把模糊本体应用到语义检索中,可以有效提高信息检索的效果。因此,本文利用模糊本体表达关系数据库的语义模糊语义,研究基于模糊本体的关系数据库语义检索技术,以提高关系数据库语义检索效果。关系数据库规范化设计导致完整的实体(对象)信息被分解存储到多表多元组中,使得按关系模式存储的关系数据的语义不完整,关系数据库模式设计时定义的元数据本身的模糊性也导致关系数据库存在模糊语义,不利于用户对信息的检索。本文利用关系数据库到语义数据的映射语言(例如R2RML语言)把关系数据库映射为RDF语义数据,使得存储大量结构化数据的关系数据库语义得以表达。利用现有的领域本体构建模糊本体,用于表达关系数据库中的模糊语义,提出一个基于模糊本体的关系数据库语义检索模型,设计并实现了基于模糊本体的关系数据库语义检索算法和基于模糊本体的语义相关性排序算法,实现了一个原型系统。该系统可以实现关系数据库的模糊语义检索,可以有效检索关系数据库中存在的模糊语义数据,可以有效提高关系数据库语义检索的查全率和查准率。为验证模型的有效性和原型系统的可用性,本文使用DBLP论文数据库作为测试数据集,利用Publication领域本体构造模糊本体,在该模糊本体的辅助下,采用R2RML语言进行语义映射,生成具有模糊语义的RDF数据,在此基础上进行基于模糊本体的语义检索。实验结果分析表明,本文设计的语义检索系统在查全率和查准率方面优于传统的语义检索系统。