【摘 要】
:
随着互联网的不断发展,视频网站拥有巨大的用户访问数量能够给服务提供商带来可观的收益,向用户推荐流行度尽可能高的视频可以吸引更多用户的关注;同时为了缓解核心网络的流量负载,降低用户获取视频的时延,制定以视频流行度为缓存替换策略的算法可以增加缓存的命中率,提升用户的服务体验质量。因此,视频流行度的预测问题成为了一个急需解决的问题。本文针对传统的视频流行度预测算法在中长期预测中存在预测精度低、自适应性弱
【基金项目】
:
国家重点研发计划资助项目(NO.2020YFC1512601); 广东省科技发展专项基金资助项目(No.2017A010101001);
论文部分内容阅读
随着互联网的不断发展,视频网站拥有巨大的用户访问数量能够给服务提供商带来可观的收益,向用户推荐流行度尽可能高的视频可以吸引更多用户的关注;同时为了缓解核心网络的流量负载,降低用户获取视频的时延,制定以视频流行度为缓存替换策略的算法可以增加缓存的命中率,提升用户的服务体验质量。因此,视频流行度的预测问题成为了一个急需解决的问题。本文针对传统的视频流行度预测算法在中长期预测中存在预测精度低、自适应性弱等缺点展开研究,论文主要的工作和创新点如下:(1)针对线性回归模型预测精度低,传统神经网络虽然具有较好的非线性映射能力,但在深层次网络训练时容易出现训练参数灾难、梯度爆炸等问题,本文提出融合特征分析的深度LSTM视频流行度预测算法(D-LSTM)。D-LSTM通过在RNN循环神经网络结构中融入具有控制门机制的LSTM单元构建深度LSTM神经网络模型,可以选择性地对信息进行记忆,有效解决了训练过程中出现梯度爆炸等问题;同时结合Scrapy技术对影响视频流行度的因素进行特征分析,为网络模型提供多层次的训练特征,有效提高了模型的学习能力。通过实验证明,D-LSTM算法在预测损失上较ES、GM、ML及ARMA等传统预测模型分别下降了77%、37%、43%和48%,较BP神经网络下降了12%。(2)针对D-LSTM算法只能在一个方向上学习到流行度序列的时间依赖信息,并为进一步提高算法的预测精度,本文提出基于马尔可夫优化的深度双向LSTM视频流行度预测算法(Mar-DBi LSTM)。Mar-DBi LSTM通过对深度LSTM模型进行改进,构建具有双向隐藏层机制的深度双向LSTM(DBi LSTM)网络模型,可以在两个时间方向上学习到流行度序列的信息依赖;同时结合马尔可夫过程对DBi LSTM模型的预测结果进行优化,在避免引入外部变量导致模型复杂度增加的情况下进一步提高了模型的预测效果。实验结果证明,Mar-DBi LSTM算法在预测损失上较D-LSTM与DBi LSTM分别下降了32%和29%。最后,为了验证本文所提算法的在真实场景下的实用性,对最近热播的10部不同类型的电视剧进行排名预测。实验结果表明,该算法在电视剧排名预测中具有很好的效果。
其他文献
同时定位与建图(Simultaneous Localization and Mapping,SLAM)是移动机器人领域的关键技术之一。已经成熟的视觉SLAM算法大多假设场景是静态的,当场景中存在运动物体时会干扰特征匹配,进而对SLAM系统的定位以及建图的精度造成较大影响。所以在动态环境下,SLAM算法需要识别出场景中的运动物体。本文设计视觉SLAM算法,提升算法在动态环境下的定位精度,并生成动态环
随着空域环境的日益拥挤,针对海量的飞行目标航迹数据进行航迹起始和识别的研究,有助于深度认知空域态势,从而为空域监管提供有效支持。雷达作为获取飞行目标航迹数据的主要手段之一,在航迹起始和识别的研究中发挥着不可比拟的作用。然而,传统的雷达目标航迹起始和识别算法已经难以应对当前多样化、复杂化、大数据化的雷达探测环境。本文基于深度学习技术,分别进行了雷达目标航迹起始和识别研究。主要研究内容如下:(1)提出
因果关系是一类具有明确导向的关系类型,尤其在健康领域具有更多的实际应用价值,比如分析疾病的致病因素等。目前,很多生物医学文献都包含因果关系知识,这部分因果关系值得被挖掘。为此,本文设计开发了一个面向健康领域的因果关系图构建系统,提取相关生物医学文献中的因果关系,并整合不同数据源,构建因果关系图,旨在帮助健康领域的从业人员决策判断,归因分析等。本文工作分为以下两部分:(1)提出了基于循环神经网络的因
阵列天线方向图综合是阵列信号处理领域的重要研究方向之一,具有重要应用意义。其主要目的在于确定阵列天线的激励系数、阵元数目和位置等参数,使阵列天线的辐射特性满足期望的指标要求。然而,在很多实际应用场景下,为了节约成本简化阵列馈电网络设计复杂度,希望通过唯相位方向图综合的方式实现期望辐射特性,这种方法只使用移相器实现波束控制,能够实现阵列馈电网络的一致性。本文主要研究大型阵列天线的唯相位方向图综合的相
作为车辆的关键标志,车标不易被篡改,对车辆信息的提取有着重要的辅助作用。传统基于手工描述子的车标检测算法存在精度低、速度慢等问题,而基于深度学习的检测算法则难以平衡速度和精度。本文基于卷积神经网络(convolutional neural network,CNN)对车标检测进行研究,在现有目标检测算法的基础上,进行了改进和优化,提出了两种车标检测算法:基于YOLOv3的快速车标检测算法YVLDet
旋转机械是现代工业系统中最为重要的组成部分,随着大数据和人工智能等先进技术的发展,深度学习已经成为智能故障诊断领域的热门话题。然而在实际工况下,智能故障诊断方法的研究过程中往往会出现的以下两个问题:(1)标签数据不足,导致模型无法收敛。(2)不同工况,不同类别空间的故障诊断方法难以通用。因此,如何在少量样本下完成故障诊断,如何实现训练数据和测试数据不同工况下的高精度故障诊断以及跨部件的智能故障诊断
工业控制系统(Industrial Control System,ICS)测试床仿真模拟工业生产过程,广泛用于生产控制优化、计划与资源优化、人员培训、安全评估与安全测试研究等。现有包含实物的实物复制测试床、半实物测试床搭建成本较高,且测试床规模远不及实际系统的规模,导致基于测试床的相关研究具有一定的局限性;基于软件联合的纯软件仿真类测试床,不便于开展网络攻防等交互性要求较高的相关研究与测试。针对以
随着科技的迅速发展,实际应用领域涌现出大量流数据,这些数据不仅具有海量、快速、含多个标签与特征高维的特点,且其数据分布会随时间动态变化引起概念漂移等问题。因而如何在多标签流数据环境下快速挖掘有效信息,成为数据流分类的重要研究任务之一。本文旨在针对概念漂移和流特征的多标记流数据分类问题开展研究,主要研究工作包括:(1)针对多标签流数据的概念漂移问题,提出一种基于核极限学习机的数据流集成分类方法。首先
伴随着大数据时代的来临,数据获取的方式和途径较以往更加便捷,大量的高维数据出现在各个应用领域,如人脸识别等。然而,这些高维数据会大大增加计算量,同时其冗余特征也会影响数据分析的结果,很多应用场合必须进行降维。因此,高效的数据降维方法在实际应用中具有重要意义。近年来,图模型被广泛地用于数据降维研究工作中,图嵌入方法作为其重要的技术手段引起了很大的关注。以图判别嵌入为代表的传统图嵌入方法使用k近邻去选
隐写是一种基于信息隐藏的隐蔽通信技术或隐蔽存储方法,通过难以感知的方法将秘密信息隐藏在可以公开的载体中。在隐写与隐写分析的长期对抗发展过程中,隐写研究者提出了丰富的图像隐写思路与方法。无嵌入图像隐写算法不存在被修改的载体图像,虽然理论上具有很高的安全性,但是普遍存在图像特性单一和生成图像质量差的问题。嵌入式图像隐写算法通过修改载体图像的方法进行秘密信息写入,因此容易留下修改痕迹而受到隐写分析模型的