码率自适应的全景视频直播技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:rcs84719
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着虚拟现实(Virtual Reality,VR)在直播行业的融入,VR直播产业发展迅猛。作为VR直播的主要内容之一,全景视频为用户提供360度的观看视角,使用户获得良好的沉浸感体验。然而,全景视频庞大的数据量,对其网络传输带来了巨大挑战。基于Tile的全景视频动态自适应传输方案通过划分Tile的方式,为用户视域内传输高质量的视频,视域外传输低质量的视频,有效地解决了上述问题。本文围绕全景视频直播技术展开研究,设计并实现了基于Tile的全景视频直播系统,进一步研究了视角切换策略和自适应调度算法。本文的研究成果能够有效地降低直播时延、提升用户的观看体验。本文首先设计并实现了基于Tile的全景视频直播系统。在该系统中,服务器端负责媒体文件和媒体描述(Media Presentation Description,MPD)文件的生成,客户端负责MPD文件的更新和全景视频的解码渲染。在此基础上,本文结合MPEG-DASH(MPEG-Dynamic Adaptation Streaming over HTTP)标准协议提出了一种适用于直播场景的MPD更新方案。该方案通过将一个标准的MPD文件划分为多级串联的多个小MPD文件,降低单个MPD文件大小,从而提高了有效信息占比,进而达到降低直播时延的目的。实验结果表明,本文提出的MPD更新方案有效地缩短了直播时延。在基于Tile的全景视频直播系统中,视角切换会导致视域内部分区域呈现低质量画面,难以及时地切换到高质量视频画面,极大地降低了用户体验。为了解决上述问题,本文提出了基于RAPF(Random Acess P Frame)的快速视角切换技术。该技术在视角切换过程中,为后续视频码流提供随机接入图像,实现视域内高质量视频内容的快速显示和播放。同时,该技术使用帧间预测的编码方法降低了RAPF流的码率,从而减小了带宽消耗。实验结果表明,本文提出的快速视角切换技术在有效缩短视角切换时延、提高用户体验的同时减少了带宽的消耗。此外,由于网络带宽的波动以及视角预测误差的存在,全景视频直播系统的体验受到了一定程度的影响。为了解决上述问题,本文结合模型预测控制(Model Predictive Control,MPC)算法,针对不同场景分别提出了视角固定的码率自适应算法和视角切换的码率自适应算法。两种算法以用户体验质量为测度,为预测视域内的Tile选择合适的编码质量等级,保证视域内的视频质量最优。实验结果表明,两种码率自适应算法都能够有效地提高用户视域内的视频质量,优化用户体验。
其他文献
数字波束形成(DBF)是天线波束形成原理和数字信号处理相结合的产物,被广泛应用于阵列信号处理领域。数字波束形成技术可以使得某一指定方向的信号获得最大增益,并且有效抑制其他方向的信号干扰。基于数字波束形成技术的阵列雷达数字信号处理系统的搭建是现代雷达技术发展中的热点和关键技术。论文基于窄带数字波束形成原理系统地实现了阵列雷达数字信号处理系统。首先,对窄带数字波束形成算法进行了仿真,验证了数字波束形成
钙钛矿太阳能电池因其激子结合能低、载流子扩散速度快、扩散距离长、吸收系数高、吸收窗宽等优点,近年来一直是光电转换领域的研究热点。经过近十年的快速发展,实验室电池的能量转换效率迅速增加到25.5%。钙钛矿薄膜的结晶质量、与传输层之间的接触程度都影响着器件性能,除此之外,钙钛矿电池器件制备过程中由于退火时间、结晶速率等因素的影响,在钙钛矿内部及界面不可避免地产生大量的缺陷,从而影响器件的效率及稳定性,
传统媒体时代,信息资讯生产来源短缺,资讯的质量与传播依赖于信息生产者的主观意向,受众的选择空间十分有限,而随着互联网的普及、信息技术的发展,信息过载成为了困扰信息接收者的又一难题。时代进步,一剂良药——推荐算法登上了互联网舞台,图文资讯的个性化推荐逐渐走进人们的日常生活。一个好的推荐算法不仅可以提高资讯的传播效率、增强用户的阅读体验,还可以拓展资讯平台的商业价值,改变产业格局。发展至今,资讯推荐领
随着网络科学研究的发展,网络系统的同步研究具有深远的理论意义和广泛的现实意义,同步目标从渐近同步到指数同步,从有限时间同步到固定时间同步,研究方法也日益成熟,但网络系统的同步研究仍有一些待完善的领域。本论文在控制理论框架下,分别对于中立型复杂动态网络(CDN)系统的函数投影同步(FPS)、具有混合时滞的忆阻神经网络(MNN)系统的固定时间随机同步(FTSS)以及不同节点维数的MNN的固定时间矩阵投
光电探测系统作为无人机的“眼睛”,是无人机捕获、识别、跟踪及瞄准目标的主要工具,而吊舱稳定平台是光电探测系统的重要组成部分,它能够隔离吊舱载体产生的各类扰动,通过稳定视轴瞄准线来确保光电成像设备能够获取高精度的目标图像。本文以某吊舱稳定平台控制系统作为研究对象,主要讲述控制系统设计与开发的过程。本文的主要研究内容如下:(1)根据系统研制要求提出了吊舱稳定平台控制系统的总体设计方案,通过估算控制系统
在动物王国中,许多动物拥有超强的听力,足以让我们人类感到"自惭形秽"。耳廓狐:小身体,大耳朵耳廓狐利用的听觉方式令人难以置信。它们是世界上最小的狐狸,可是有着巨大的耳朵——长约15厘米,比它们的脸还长。相对于体型来说,耳廓狐的耳朵是世界上最大的。
期刊
随着计算机技术和深度学习的飞速发展,基于图像的人脸识别技术已经成功的应用在智能支付和考勤系统等重要领域。这一类方法对人脸图像的质量要求较高,而在实际场景中获取的人脸图像质量参差不齐,直接进行识别则会造成识别准确率不同程度的下降。因此,对以图像序列为输入的人脸识别技术进行研究很有必要。本文主要研究了如何利用强化学习、深度学习和循环神经序列等技术对图像序列进行人脸检测与识别。具体工作如下:(1)提出了
在黄土高原生态恢复重建过程中,土壤养分及化学计量特征是评价黄土区植被恢复效应的有效途径。该文以典型半干旱黄土小流域3种恢复方式下(天然荒草、自然恢复、人工恢复)的5种植物群落(长芒草群落、赖草群落、苜蓿群落、柠条群落、山杏群落)不同深度的土壤(0~20 cm、20~40 cm、40~60 cm)为研究对象,利用方差分析及线性回归法分析土壤有机碳(SOC)、全氮(TN)、全磷(TP)、全钾(TK)含
由于通信技术的蓬勃发展,通信频段越来越匮乏,所以提高频谱利用率是一个必然的选择。对此,研究学者们提出矢量信号生成理论。传统电子器件有着固有缺陷,在电域生成的矢量信号带宽较小,频率调谐性差,且无法在复杂的电磁环境下传输,严重限制了通信速率的提高。因此,融合了光子学和微波技术优点的微波光子学成为解决问题的新方向,它打破了传统电器件的缺陷对系统性能的负面影响,具有:信号带宽极大、载频极高、传输损耗低、所
随着传感器技术的提升,经过多传感器获取的图像数据呈现多样性和互补性,实现了对目标场景的多模化表征,而如何综合利用异源图像实现对目标场更精确、更全面的表达成为图像处理领域的研究热点。异源图像配准融合技术是图像处理技术中的重要一环,配准方法决定了后续图像融合处理的效果,融合方法实现了对源信息的高效表达,两者相辅相成,对于提高目标探测与精确制导能力具有理论支撑和现实意义。合成孔径雷达(Synthetic