论文部分内容阅读
随着数据量的不断增大以及对于访问速度的要求,特别是近年来SNS和Web2.0的迅速发展,使得传统的数据库进行数据存取遇到严重的瓶颈问题。传统的解决方案是利用分布式技术,即分布式算法将数据分布到不同的服务器上,出于管理和数据复制的考虑,分布式集群一般采用主从架构。但主从架构下的数据复制是一种惰性的异步复制,它存在一定的时间延迟,从而造成主从数据不一致的现象。论文在原关系数据库的基础上,引入一种NoSQL数据库,即一种基于Key-Value模型的缓存数据库,用于提高数据读写效率。分布式数据库下数据的一致性问题是一个必须考虑的问题,基于NoSQL数据库模型的一致性问题的研究是一个全新的领域,正受到越来越多人的关注,并且在某些特定的领域已经取得了成功,所以基于NoSQL数据库模型进行一致性问题的研究具有很高的学术意义和应用价值。本文是在原关系数据库的基础上,引入当前快速发展的NoSQL数据库模型,采用NoSQL与关系数据库相结合的架构,即用memcached作为MySQL的缓存层,针对主从架构下数据复制延迟问题,提出一种基于memcached客户端访问控制和基于MySQL的触发器映射策略的一致性控制。在该系统下,当进行数据查询操作,首先从缓存中进行查找,如果存在相应的数据,则返回给客户端,否则从底层数据库中进行查找返回给客户端并且写入到缓存中,以备下一次访问时效率的提高;当进行修改操作,memcached客户端进行访问控制,直接对主数据库进行连接操作并进行数据修改,基于行记录的触发器就会调用UDF对memcached进行相应的修改操作,使memcached中的数据与新修改的数据保持一致性,这样从客户端观察,数据是保持强一致性的。利用关系数据库MySQL的UDF和触发器进行数据一致性管理方案,可以非常灵活、高效地实现底层数据库与缓存数据库中数据的一致性的问题,这样可以在一定程度上缓解主从架构下由于数据复制延迟造成的数据不一致问题,而且通过触发器调UDF,可以大大减少客户端编程的复杂性,提高程序的运行效率,而memcached由采用LRU淘汰机制,保证系统有一个较高的命中率,使性能得到提高。通过实验数据进行分析,本设计具有良好的性能,能够非常及时的保证数据一致性的要求,而且可以简化客户端的编程复杂性。