论文部分内容阅读
数据库自然语言查询界面(NLIDBs)是指允许用户用自然语言访问数据库的一种方式,它的出现大大简化了人机交互的过程。它是多学科交叉的产物,涉及自然语言理解、数据库技术、人工智能、人机界面等多方面的研究。并且随着物联网时代的到来和语音识别技术的发展,数据库自然语言界面的研究是一个具有重大理论价值和巨大实用价值的研究领域。在数据库自然语言查询界面的研究中,关键是对用户输入的以自然语言描述的查询语句的理解,而其中查询条件、查询目标及查询实体的识别又称为重中之重。本文将规划识别分层规划的思想运用在自然语言查询语句的理解上,利用规划识别在自然语言理解领域的成熟的理论基础和技术手段,达到对自然语言查询语句的理解,提高了数据库查询接口的智能性和推理能力。本文的研究工作主要有:(1)讨论了目前数据库汉语查询系统中存在的问题,根据关系数据库中数据表示与自然语言查询句的语义模型不同,提出了数据库汉语查询时隐含知识的查询,并给出了相应的知识表示,本文重点是提高了对数据库隐含知识的处理能力。(2)构造了基于规划识别器的数据库自然语言查询系统。规划识别器由两个核心模块组成:智能分词和推理机,由于中英文语素的差别,对汉语查询语句进行理解,必须添加一个分词模块。本文中采用了一种新的分词算法---迭代式最大匹配算法,克服了机械分词算法的缺点,保证在切分的过程中最大限度地保留词与词之间的完整语义关系,实现智能分词。(3)结合规划识别分层规划的思想和SQL语句结构特性,本文新定义了一种结构---规划知识树,各子树分别代表查询动作、查询目标、查询实体及查询条件。规划知识树这样一种结构既保留了规划识别分层规划的思想,又结合了数据库隐含知识的表示方法,达到了内在的统一。对查询语句中查询动作、目标、实体以及条件的识别就转化为对应子树的构建,理解的过程实质是对规划知识树不断扩展和修剪的过程。