论文部分内容阅读
随着互联网的飞速发展,视频会议、联机游戏、视频直播等以流媒体技术为核心的新兴应用大量涌现,它们都有着低时延的共性,对时延的追求从秒级(视频直播),到百毫秒级(视频会议),再到毫秒级(云游戏、车联网、VR/AR)。受这些新型应用场景的需求驱动,互联网的方向一定是越来越快,越来越实时。这些新兴的超低时延应用,同传统的网络密集型应用(Web,FTP,多媒体流等)相比,其分发的业务媒体流更加丰富,包括场景音效、视频、语音、文字、操作信息等。其中,视频流可以分为不同清晰度、不同质量的视频切片(如DASH),研究在不同网络状况下选择下载不同码率的视频切片成为了学术界和工业界的热门研究方向,即码率自适应领域。除此之外,这些并发的媒体流通常拥有不同的优先级以及各自明确的截止日期,这使得在传输层根据其特性进行选择性调度成为了进一步降低延迟的可能。针对新兴应用的超低时延需求,本文设计了一套时延敏感的实时媒体流分发策略,从两个角度来降低时延:一是集成深度强化学习的时延敏感性码率自适应算法,新型应用的发展对自适应比特率(ABR)算法提出了许多新的技术挑战,不仅需要稳定的高质量传输,而且需要较低的端到端时延。强化学习(RL)能在不使用任何预编程控制规则的情况下自动学习ABR算法,取得了良好的效果。然而,现有的方法只考虑比特率控制而忽略了延迟控制。因此,为了有效降低端到端的时延,本文在基于RL的比特率控制模型的基础上,提出了一个独立的时延控制模型进行辅助控制。此外,本文还提出了一种模型集成算法来降低性能波动,提高用户体验质量。二是时延敏感的传输层调度算法,具体包括两个调度算法:基于启发式规则和DRL的拥塞控制算法、选包调度算法,分别决定了发送速率和发送哪些数据包,在探测网络带宽的基础上,尽可能有效利用带宽,减少带宽浪费或网络拥堵,尽量满足数据包的截止期限。综上所述,针对新兴的超低时延应用,设计一套合适的流媒体分发策略能够有效地契合当下网络传输的快速发展,提供更高质量的服务。本文将从终端侧的分发策略和网络侧的分发策略两个角度尝试解决这个问题,实验结果表明,两种算法都明显优于基线方法,证明了本文策略的有效性和实用性。