论文部分内容阅读
随着数字集群移动通信在公共安全领域的普及,与其相关的系统可靠性与可用性越来越受到重视。但现有的数字集群移动通信的设计标准中并没有容灾方面的内容,并且目前国内外的相关公司与研究机构也没有为数字集群移动通信系统设计专门的容灾方案。为了满足集群系统的可靠性与可用性要求,本文围绕数字集群移动通信容灾系统的研究与实现而展开。本文首先对PDT数字集群标准(一种通用的数字集群移动通信标准)的网络拓扑结构与设备模块进行研究,分析容灾系统的具体需求。随后根据需求设计合适的容灾方案,并实现了一个数字集群移动通信容灾系统(Digital Trunked Mobile Communications of Disaster Tolerance System,简称DTDT)。本文主要贡献有以下几点:实现数据备份功能,针对数据备份过程中可能产生的数据不一致性问题,引入了备份日志和备份状态表,实现了更新序号登记与状态迁移查询的功能,有效地解决了数据备份过程中的数据一致性问题。针对备份数据量过大,设计了一种基于rsync算法改进而来的bsync算法进行备份数据的压缩,极大的提高了备份效率。针对灾难监测与系统业务迁移功能,采用了双网卡双路心跳监测机制和虚拟IP技术进行实现,可以高效可靠的实现设计要求。针对系统恢复的功能,在bootloader、操作系统内核、应用程序三个层次嵌入容灾模块,并在硬件中加入了一个系统状态寄存器以实现三个层次间的通信。最后通过三个层次容灾模块的协同工作,最终实现了系统启动和日常运行过程中的异常检测与系统恢复。经过实验测试,DTDT系统各项数据都满足容灾的性能指标,基本实现了最初的设计要求。但部分性能尚有较大的提高空间,还需进一步研究。