论文部分内容阅读
随着计算机网络技术的发展,网络已渗透到了世界的各个角落。但是,当我们在上网时,经常遇到响应速度缓慢,甚至服务器错误响应或无法进行正常访问等问题。网络实际性能与人们对其服务质量的期望之间的矛盾,已成为关注的焦点。鉴于此,在现有的网络中建立一个完善全面的中间层CDN(Content Delivery Network,内容分发网络)是目前最为流行的网络优化应用方案。其中,内容路由系统是CDN架构中至关重要的组成部分。因为它需要根据用户的请求以及边缘服务器的状态信息决策判断,从而选取最佳的边缘服务器。而在设计新的内容路由系统时,用户集群划分也是十分重要的。而数据挖掘是指从数据库中发现隐含的、新颖的、有用的信息的过程,已经在许多领域得到了广泛的应用。聚类分析是数据挖掘的主要技术手段之一,至今已在理论和方法上取得了丰硕的研究成果。随着近年来数据密集型企业数据仓库等决策支持系统的建设以及企业对商业智能的需求,数据挖掘面临新的应用,聚类分析研究也面临更多新的内容和挑战。CDN是典型的数据密集型网站,如何对请求用户进行划分、并针对不同的用户集群提供不同边缘服务器,也是提高CDN性能的重要方法。本文针对CDN的请求用户细分需求以及数据特性,研究和提出一种针对混合属性数据的聚类算法,并将其应用于CDN用户集群划分。本课题关注在用户端不使用第三方软件的条件下,调研CDN内容路由优化技术,提出一种新的内容路由优化方案,并且研究数据挖掘聚类算法在CDN用户集群划分中的应用。本论文主要进行了如下几个方面的工作:1.介绍了CDN技术,详细论述了CDN内容路由,总结了内容路由的方法和实现技术,重点讨论其实现技术中全局负载基于DNS重定向、HTTP重定向和广域三角重定向,并指出了各自的优缺点。2.深入研究基于客户端探测的技术,针对目前CDN内容路由技术及其不足,研究全局负载均衡技术和基于客户端探测的CDN内容路由技术两者结合的可能性。3.研究了数据挖掘技术,特别是Web数据挖掘技术,并总结出Web数据挖掘技术发展方向。4.研究了数据挖掘技术中的聚类算法在用户集群划分中的应用,并论述了客户细分的基本理论、方法和步骤。CDN的应用越来越广泛,并且解决网络带宽不足的问题。满足人们各种需求的CDN也必将迎来更好的发展机遇,因此这种把数据挖掘技术和CON内容路由技术相结合,直接运用于基于全局负载均衡和基于客户端探测技术相结合的设计模式也必将更好的体现它的实用价值和参考价值。