关系数据库关键词的纠错性查询及优化研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:love56789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的关系数据库查询须指出将要查询的属性名,不能像搜索引擎那样自由地进行关键词查询。关系数据库关键词查询(KSORD)可以在不了解关系数据库结构的前提下,实现对关系数据库的自由态查询。本文对KSORD进行了分析和研究,针对以往KSORD的不足,提出了一个解决方案。本文针对以往KSORD缺乏关键词近似查询的问题,提出一个关系数据库关键词纠错性查询的解决方案。本方案给出一个高频词生成算法,利用该算法找出关系表中文本属性和字符串属性值的高频度词汇,并存储在hotkeys表中;给出一个关键词纠错算法,该算法依据hotkeys表中的热词,对待纠错的关键词进行纠错,得到纠错后的关键词。纠错后的关键词组通过KSORD进行查询,最终得到理想的查询结果。另外,本文针对以往KSORD查询效率低耗时长的问题,提出一个基于连接树表的解决方案,以缩短查询时间。在关系数据库模式图中,给图中各节点增加PageRank值,给出一个计算公式,为图中各边增加权重值;给出一个节点数不大于Maxsize的子图生成算法和一个子图中最小生成树对应的select模板生成算法。利用这两个算法从关系数据库模式图中生成连接树对应的select模板,并依据这些select模板建立连接树表joinTree。在查询过程中,从joinTree表中找到候选连接树对应的select模板,替代以往KSORD利用广度优先遍历算法(BFS)从模式图中找到候选连接树的低效方法。本文设计了关系数据库关键词纠错性查询的实验,以查询时间、查准率及查全率作为性能指标,验证了本文提出的关系数据库关键词纠错性查询解决方案的可行性与有效性;本文设计了基于连接树表的KSORD的实验,与以往的基于BFS策略的KSORD进行比较,在不降低查准率及查全率的情况下,缩短了查询时间,并且优化效果随关系数据库规模增大而更加明显。
其他文献
随着网络安全越来越受到重视,以防火墙为代表的传统安全防护技术越来越不能适应时代的发展。入侵检测技术作为一种新型的动态防护技术,很好的弥补了它的缺点,是现代网络防护体系
遗传算法是根据生物遗传原理来求解全局最优问题的随机搜索算法。具有简单,通用,鲁棒性强,适于并行分布处理,但是遗传算法存在稳定性差,收敛的判断具有主观性等缺点。针对遗传算法
快速原型制造技术(Rapid Protoyping Manufacturing, RPM)是计算机辅助设计和计算机辅助制造(CAD/CAM)在制造加工业的一次成功应用。RPM无需经过模具设计制作环节,大大降低生产成
随着Web2.0技术的成熟,社交网络已成为人们沟通交流、传播信息的重要手段,在人们日常生活中发挥着越来越重要的作用。社交网络与传统的虚拟网络不同,它是现实社会活动的在线拓展
随着网络技术的不断发展,Internet现已逐步进入到由IPv4向IPv6过渡的阶段。作为一个网络层协议,从IPv4到IPv6的过渡是在IP协议层进行了更替和升级,对网络架构和其它层的协议
随着信息技术的发展,越来越多的企事业单位迫切希望利用信息技术提升工作效率和提高信息资源的利用率。而由于信息化项目的复杂性,在信息化建设的过程中强烈需要信息化专家对项
人脸表情识别(FaceExpressionRecognition,FER),是指通过计算机技术分析特定的脸部表情及变化,实现人机之间更智能化的监控。面部表情识别的研究目标是让一些人工智能产品能够
随着移动互联网的发展,智能设备成为了一种趋势。智能设备成为人们交流、通信以及获取资讯的主要方式。它不仅对人们的生活产生巨大的影响,还为人们带来了乐趣。为了获得更好的
随着计算机技术的快速发展,基于计算机视觉和人工智能技术的人脸识别技术也得到了大力发展,且被广泛应用到身份识别验证、门禁系统、智能视频监控以及一些软件的登录验证等领
图书馆是学习知识的重要场所,馆藏图书数量巨大、类别齐全、质量不一。从中找寻所需的高质量图书,已成为读者借阅图书的迫切需要。现有的图书馆系统中虽然保存了大量的读者信息