论文部分内容阅读
伴随着数据库技术的广泛应用,大量的数据存储到了数据库中。通过关键词查询方式访问数据库,成为了信息检索、数据库领域学者关注的研究热点,有着广泛的应用价值和研究价值。数据库关键词查询研究大多重点关注的是找到一组能够最优匹配关键词的元组,即某个表中的一个元组或由多个表进行连接而得到的元组。目前大多数的研究只能支持简单类型的关键词查询,无法支持比较复杂的聚集查询。针对此问题,本文对关键词聚集查询进行了研究,主要工作包括以下三个方面:在对关键词预处理时,对用户指定的关键词处理时用符号表来定位关键词在关系数据库中的位置;采用近似字符串匹配算法来判断关键词与查询项中的元素匹配的程度;给出查询项的概念,通过对每个关键词匹配表的叉乘,产生一系列的查询项。用查询项对用户输入的查询关键词进行表示。在查询模板生成时,给出一个适合聚集查询的查询结构——查询模板。同时,指定有效的查询模板必须满足一些性质。本文据此设计了一个启发式查询模板生成算法,对关键词预处理阶段产生的查询项,都会形成相应的查询模板。一个查询模板将会唯一地与一个结构化查询相对应,对每一个查询项,都会形成一个查询模板。在查询结果生成时,利用改进的评分规则对生成的查询模板进行评分,选择最优的查询模板生成结果。实验结果表明,本文提出的聚集查询方法具有良好的查询性能,具有有效性和可行性。