论文部分内容阅读
内容分发网络(Content Delivery Network, CDN)是一项针对网站的加速服务,通过在各地部署边缘节点,以廉价的存储空间来弥补高昂的传输费用,提升了用户访问速度。然而随着网站规模的扩大和用户数量的增多,CDN新建节点的选址问题变得复杂和困难,而目前基于DNS重定向的全局负载均衡策略也可能判断不准确,这直接影响了CDN的加速效果。本文针对CDN的这两大问题,结合CDN系统功能的功能需求,设计并实现了开源CDN系统、基于IP聚类的节点选址方法以及基于主动测速的全局负载均衡策略。论文的主要工作包括:1.开源CDN系统的设计与实现:论文针对商用CDN系统的高昂费用问题,分析了CDN的功能需求和关键技术,设计出了三层架构的开源CDN系统,降低了CDN的建设成本;其次,面向CDN的海量日志,设计了Hadoop分布式日志处理系统,在保证结果正确的情况下,为关键技术的实现减少了数据处理的时间;2.关键技术的研究:本论文的创新点在于,不仅实现了CDN系统的核心加速功能和管理功能,还对CDN新建节点的选址问题和全局负载均衡策略作出了优化。优化的关键技术点有:(a) IP聚类方法:针对目前CDN新建节点选址的复杂性,结合日志的分布式处理技术,实现了一种基于用户真实IP聚类的选址方法,准确地反映了用户的聚集中心;(b)主动测速技术:针对DNS重定向的全局负载均衡策略的不准确性,实现了一种基于主动测速技术的均衡策略,充分利用了用户的历史访问记录,提高了负载均衡的准确性。3.对CDN系统及其关键技术的测试:测试表明,开源CDN系统比现有的CDN成本低、功能丰富;基于IP聚类的选址方法比传统的选址方式适用性广、实现难度小且准确度更高;基于主动测速的全局负载均衡策略,在用户IP未知或用户已访问的情况下,有更强的自适应性和准确性。