论文部分内容阅读
流媒体代理服务器技术能有效降低流媒体访问的网络传输量,由于持续数据流访问给代理服务器缓存带来了巨大的挑战,因而如何能在保证媒体流服务质量的前提下,既能保证媒体服务性能又能使磁盘及带宽消耗最低成为了当下流媒体代理服务器领域的重要研究问题。现今主流基于流行度的缓存替换算法中一般对于内容流行度缺少定量的分析和估算,而主流分段算法中抽象分段因子时又缺少对于用户行为特征等因素定量的分析和考虑,精细粒度缓存算法又需要巨大的额外存储空间,实用价值太低。本文针对以上问题,研究流媒体代理缓存技术,对内容流行度进行定量分析,提出了基于内容流行度和分段适应性的流媒体缓存技术。本文通过收集实际日志文件,引入基于K变化下的Zipf-like模型分析用户行为特征,在对影片内部流行度定量分析中提出两点流行度的思想,排除了内部流行度扰动现象,提出了精确的内容流行度收集及估算策略。在媒体分段时,提出基于分段因子φ的媒体分段策略,基于该分段策略,提出媒体块主动预取机制、缓存准入策略以及基于内容流行度等因素的缓存价值估算函数,基于该估算函数,又提出基于该分段算法的替换策略和释放策略,至此形成完整的流媒体缓存机制。通过自行研发的Proxyer模拟器进行模拟仿真实验,分别通过对本文提出的基于流行度和分段适应性缓存算法,指数分段缓存算法和LRU等长分段缓存算法进行仿真,通过选取字节命中率和骨干网带宽消耗节省率作为算法性能的评价指标,得出本文算法在相同的网络配置情况下可以获得比指数分段缓存算法和LRU等长分段算法都要优越的算法性能。本文是对基于代理服务器的高效流媒体缓存技术的研究,其中针对流媒体对象的内容流行度分布特征,引入了K变换下的Zipf-like模型对其进行描述,纳入两点流行度思想,定量地估算了内容流行度。在分段策略中,抽象分段因子φ时将基于K变换下的zipf-like模型下精确的内容流行度的估算方式作为其首要因素,提出一种针对媒体流行度分布特征的分段机制,并在该分段策略的基础上形成包含预取、准入、替换和释放策略的完整的流媒体缓存机制。本文基于流行度和分段适应性的流媒体缓存机制,很好的平衡了分段缓存算法在缓存利用率和算法精度获取上的矛盾,同时提高了流媒体代理服务器的缓存效率。