数字有机体数据库中信息检索研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:skywateren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统上,数据库技术和信息检索技术两者独立发展。数据库技术处理结构化数据,采用结构化查询语言,查询结果是精确的完全的并且被同等对待。信息检索技术处理非结构化数据,采用非结构化查询语言,查询结果不精确不完全,根据相关性进行返回。把信息搜索技术应用到数据库关键词的搜索中提高了数据库系统的易用性,用户无需知道数据的存储结构和SQL语法规则,可以使用简单的关键词自由的检索数据库,挖掘其中的信息和知识,信息资源的利用效率得到很大提高。因此,8010教研室在数字有机体数据库系统基础上,以数据库信息的灵活检索为根本出发点,开发了数据库信息检索系统。信息检索系统可分为预处理阶段和查询阶段。查询阶段首先对用户检索请求进行语法分析,然后通过检索策略获得检索结果。在用户未指定检索关键字所在属性的情况下,检索策略的设计是研究的一个重点,检索结果必须满足完整性和非冗余性。本课题充分分析现有数据库关键字检索系统和MySQL数据库。在数字有机体数据库系统的基础上,设计和实现了基于数字有机体数据库信息检索系统的检索策略。此部分主要分为四个阶段:索引查询、生成数据图、获得结果树和SQL语句的生成、执行。索引查询和生成数据图在同一模块中实现,数据图由关键字所在位置和数据库结构生成,体现了数据库中包含检索关键字的关系以及关系之间的联系。通过采用双层结构,充分利用数据库结构属性和查询类型特点对索引信息进行精炼,减少数据图中无用数据的产生。遍历数据图,可获得所有满足用户请求的子图(结果树)。在结果树生成算法中,在保证结果树完整性的同时,对遍历起始节点的有效选择减少了在遍历时产生的冗余子树。结果树包含检索请求的所有关键字,指明了关系中的选择操作和关系之间的连接条件,通过构造相应的SQL查询语句,最终获得满足检索结果。系统通过模块化和层次化设计使各模块算法具有良好的扩张性,并且采用ODBC接口与数据库服务器进行交互,确保了整个信息检索模块的独立性。最后对系统进行功能和性能测试,指出不同参数对数据库关键字检索的影响。
其他文献
随着P2P网络技术的发展和进步,P2P网络上可以利用的资源和服务也越来越庞大。因此,如何在大量的资源和服务中查找到自己想要的资源和服务,成了P2P网络研究领域的一个难点问题
移动Ad Hoc网络是由一组带有无线收发装置的移动结点组成的一个多跳的,无中心、临时性的自治系统,它独立于固定的基础设施并采用分布式运行方式。网络中的每个终端作为结点可
随着互联网普及率的不断提高,网站上出现入侵攻击的现象愈发常见。与此同时,随着网站安全防范技术的增强,网站入侵攻击的手段方法也愈发多变、隐蔽、难以发觉。在中国绝大多数的
试验是新产品研制和技术改型中极为重要的验证和鉴定环节。通过试验获取的试验数据是宝贵的企业产品与决策信息。目前,在绝大多数企业中试验数据都处于传统的管理方式下,随着试
汉字识别是用计算机自动辨识印刷在纸上或人写在纸上的汉字,学科上属于模式识别和人工智能的范畴。汉字识别涉及到模式识别、图像处理、人工智能、形式语言与自动机、模糊数
近年来,随着人们对人机交互兴趣的增加,表情识别逐渐成为一个研究热点。人脸表情识别是指利用计算机分析特定人的脸部表情及变化,进而确定其内心情绪或思想活动,实现人机之间
生物识别技术是通过生物特征进行身份认证的一种技术,其主要通过利用人的生理或行为特征来核对或确认人的身份。随着信息技术的发展,生物识别技术的应用领域也日趋广泛。在众多
随着中国宽带互联网的快速发展,越来越多的人从网络上收听和观看网络音视频,这造就了中国网络音视频市场规模的快速增长。但是,由于在网络上复制传播音像资源代价基本为零,造
数字图像信息隐藏技术是近年信息隐藏技术中的热点研究课题,以数字图像作为载体的信息隐藏与传统加密方法不尽相同,利用图像所具有的迷惑性产生的信息隐藏更能经受起恶意者的
从“软件危机”爆发至今,人们提出了很多新方法和新工具,这些方法和工具致力于解决“软件危机”的各个方面。但现有的这些解决方案并没有使人们彻底地从“软件危机”中解脱出