论文部分内容阅读
互联网飞速发展的时代,IT公司都面临着大数据量的技术挑战。分布式数据库非常适合于这种应用场景,很多公司都应用了分布式数据库。对于多节点的分布式数据库环境下,负载均衡一直是一个至关重要的研究重点,负载的分布不均将直接影响系统的性能,降低系统服务质量。一个有效的负载均衡机制能充分的发挥集群各节点的性能,达到避免资源的浪费和性能的优化。 本文基于Cassandra数据库平台,这是一种较为新颖的分布式数据库,目前应用已十分广泛,对于该数据库负载均衡的研究,在当今信息爆炸的时代,对于解决海量数据应用场景有很大的意义。论文基于Cassandra数据库基本理论,由于对于负载均衡的研究就是基于该数据库的基本特性之上的,因此对于Cassandra数据库的深入了解是提出此负载均衡机制的必要前提条件。同时对于业界目前存在的一些经典的、成熟的负载均衡方案和思想的很好的理解,对如何在Cassandra数据库上提出一个新的负载均衡机制也有很大的启发作用。通过分析原有负载均衡机制的所存在的问题,本文提出了一个改进型的自动负载均衡机制,并对于这个改进型的负载均衡机制中的各个子模块都有详细的说明,完成了对于改进型负载均衡机制的设计工作,并在自己构建的测试环境下记录了对于不同的数据量下以及不同的读写操作下集群中各个数据节点的负载反应,并将不启用负载均衡机制、启用旧的负载均衡机制以及启用新的负载均衡机制三类情况下集群各个节点的负载情况作出对比分析,以此来验证不同负载均衡机制的优劣性。 通过前期对于负载均衡理论知识的了解以及对于Cassandra数据库的深入学习,所提出的新的负载均衡机制实现了对于负载均衡的自动控制,并使得该分布式数据库中各个节点的负载更为均衡,集群性能得到提升。