论文部分内容阅读
近年来,随着以数据为中心的应用的大量增加,数据的形态日益复杂多样,除了传统的关系数据模型,图数据模型也逐渐被人们所关注。与此同时,图数据库的发展也非常迅速,对于用户而言,用户往往更关心其在使用数据库过程中的效率问题,为此,数据库管理员需要对图数据库进行不同程度的索引优化以及对用户的查询进行查询优化,除此之外,还可以利用缓存机制进行优化,图数据库从磁盘中读取数据往往需要较高的时间,如果能够提前将用户可能查询的数据进行预测并将数据缓存在内存中,也能大幅提升系统对用户查询的响应时间。现有的查询预测算法和查询优化算法在跨数据移植性上有所欠缺,且对查询和数据要求价高,因此本文对SparQL的查询预测和查询优化进行研究,主要研究内容如下:(1)对于SparQL的查询预测,本课题提出了一种具有还原性且包含更多信息的特征转化方式,将SparQL查询转化为特征向量,并提出了一种基于Seq2Seq模型的查询预测算法,该算法只使用查询本身的信息进行预测,保证了跨数据移植性,实验结果表明了该算法的有效性;(2)对于SparQL的查询优化,同样为了保证跨数据移植性和避免统计信息误差,本课题将查询优化中的三元组连接顺序问题视为一种增强学习任务,并提出了一种基于Deep Q-Network的查询预测算法,实验表明该算法相对于Jena的查询优化算法具有更好的性能。