基于用户观看兴趣和购买偏好的单点付费预测方法研究与系统实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:liu0686
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网智能电视如今越来越成为智能家居的重要组成部分。基于互联网智能电视平台的推荐系统也在迅速发展,国外的Netflix、Hulu公司,国内的海信聚好看、爱奇艺等公司都在智能电视平台中嵌入了推荐系统的相关功能。在盈利模式上,单点付费视频和套餐付费视频是互联网智能电视平台收入的重要组成部分。单点付费视频是单独付费购买的高质量电影或电视剧,当了解了用户想要购买的单点付费视频后,服务提供商可以发放优惠券,促进用户消费,从而提高用户的付费率。用户也因为系统的推荐和优惠活动降低了时间成本和消费成本,从而提高了用户体验,增强了用户粘性。但是由于互联网智能电视和传统APP的使用环境不同,没有用户评分、评论这种显式反馈,可以使用的反映用户兴趣偏好的隐式反馈只有用户的观看记录和购买记录。而且对于付费视频来说,用户的观看记录的占比明显小于非付费视频。由于以上因素,在互联网智能电视领域关于单点付费预测问题的算法和系统研究起步较晚、困难也较多。互联网智能电视平台单点付费预测问题的主要挑战在于三个方面。第一个挑战在于如何准确地表示视频。因为系统中单点付费视频的观看记录数量明显少于非付费视频,使用传统的视频嵌入表示方法得到的单点付费视频的嵌入表示不充分、不精确。第二个挑战在于如何对时间因素进行建模。因为不仅视频的流行程度随着时间呈现出线性或者周期性的变化,用户的观看兴趣和购买偏好在一天或者一周的不同时间也会发生规律性的变化。第三个挑战在于如何对用户的观看兴趣和购买偏好进行建模。系统中只有用户的观看记录和购买记录分别反映了用户的观看兴趣和购买偏好,但是在很多情况下用户的观看兴趣和购买偏好是不一致的。针对上述挑战,本文在与国内知名互联网智能电视平台合作项目的基础上,提出了基于用户观看兴趣和购买偏好的单点付费预测模型——VICP(single payment prediction model based on user Viewing Interest and Consumption Preference),并对该模型进行了系统实现。本文的主要工作和贡献总结为如下三点:1.本文提出一个基于用户观看兴趣和购买偏好的单点付费预测模型——VICP模型。该模型首先将基于图注意力网络的ET-GAT方法应用于全体用户观看记录组织成的图结构上,并融合了时间嵌入信息,从而获得精确的视频嵌入表示。接着,根据用户的观看记录和购买记录的特点,对用户的短期兴趣使用序列化方式建模,对用户的长期兴趣和购买偏好使用多头注意力机制进行建模。最后,将短期兴趣、长期兴趣和购买偏好的建模结果以及用户特征和视频的嵌入表示向量输入多层前馈神经网络,预测出用户购买具体单点视频的概率。2.本文在两个真实数据集上进行了充分的实验来验证VICP模型的有效性。首先,设计了本模型与基线模型的对比实验,实验结果表明本模型在两个数据集上的评价指标均优于基线模型。接着,通过消融实验验证了 ET-GAT方法、时间嵌入层等模型组件对模型整体效果的影响。最后,通过可视化实验直观反映了 ET-GAT方法的提升效果以及用户观看序列长度对模型效果的影响。3.本文基于互联网智能电视服务平台,对提出的VICP模型进行了系统实现。该系统在服务器端使用HDFS完成海量数据的分布式存储,使用Hive和Spark集群完成数据的并行化处理,使用TensorFlow完成模型的构建和预训练,并将模型服务用到的视频嵌入向量、用户和视频特征存储到内存数据库Redis中,最后将训练好的模型部署到配置好的Docker容器中。当需要预测用户购买具体单点付费视频的概率时,就可以将数据以JSON格式发送到模型服务端口,该端口返回相应的购买概率。
其他文献
杂凑算法作为密码学三类基础算法之一,在现代密码学中起着重要作用,被广泛应用于数据完整性校验、身份认证等场景。由于杂凑算法软件实现速度慢,安全性差,因此对高吞吐和低延时的杂凑算法硬件实现的需求也越来越强烈。由于杂凑算法的多样性,在不同场景下,人们对算法的需求也不同,因此本文实现了一种基于MD结构的通用算法加速器,以SM3和SHA256为例,在兼容两种算法的同时,优化了硬件资源利用率并提高了加速器性能
学位
随着人们出行需求的增加,作为不可再生能源的燃油的消耗量也正急剧增加。对于驾驶员而言,出行路径的选择不同,燃油消耗量也会有较大的差别。一般来说,乘用车驾驶员出于节省时间的目的,会依据导航推荐的最短或最快路线行车,但是对于商用车驾驶员来说,需要跨省域长距离行驶,会更关心省油路线以降低成本。另一方面,随着商用车联网大数据的发展,交通传感器和支持GPS技术设备的普及,大量的行车轨迹也给研究省油路线推荐问题
学位
我国是拥有辽阔领海和绵长海岸线的海洋大国,随着“一带一路”倡议的提出,我国与世界各国的贸易往来愈加频繁,因而越来越多的舰船航行于我国周边海域,这对我国领海的航行安全和交通管理带来了巨大挑战,因此对海上的舰船进行监测变得尤为重要。由于海洋环境比较恶劣,载人的监测平台不仅成本高昂,而且灵活性小、危险系数大。于是在装有相机的无人水面艇上部署目标检测算法,对于海洋交通管理和航行安全有重大意义。针对可见光图
学位
现场可编程门阵列FPGA(Field Programmable Gate Array)因其丰富的并行计算资源和低功耗的特点在数据中心、嵌入式设备等场景被广泛使用。FPGA的EDA(Electronic Design Automation)算法是该领域的重要研究课题之一。其中,布线作为EDA流程中的重要步骤,负责在布局阶段结束后,完成部件间的连线。现有的FPGA布线策略多为基于协商的拆线重布、迷宫布
学位
为应对地下隧道工程盾构施工时因地质条件复杂、生态环境脆弱等重大挑战带来的各种实际问题,如何搭建盾构机数字孪生平台,达到对盾构机工作过程进行理论分析、数值模拟、仿真设计、结果预测、室内试验与现场施工相结合的目的,已经成为现今智慧地下工程建设关注的重要问题。而基于数字孪生平台实现的盾构机虚拟仿真系统,不仅能够对盾构机掘进过程进行虚拟仿真,还能展示盾构机工作过程中内部结构与信息状态的变化。因此,开发这样
学位
随着电子交易技术的不断发展,智能仓储的需求日趋扩大,目前实现智能仓储的传统计数方法主要是机械式计数和RFID计数。传统的智能计数方式存在着成本高昂、不够准确等各种局限性。而在人工智能迅猛发展的当今时代,机器视觉技术的地位日趋提升,越发地展现出其优势,由于机器视觉方法的优越性,打破了许多其他方法无法解决的技术壁垒。鉴于以上原因,本文开发出了基于机器视觉的堆垛信息实时识别系统,通过对货物堆垛信息的识别
学位
目的 探究汉黄芩素对肾结石大鼠生化指标、肾组织病理及转化生长因子-β1(TGF-β1)的研究。方法 选取60只SPF级SD雄性大鼠,随机分为A(正常大鼠)组,B(肾结石大鼠)组,C(肾结石大鼠给予蜀葵根)组,D(肾结石大鼠给予低浓度汉黄芩素)组,E(肾结石大鼠给予中浓度汉黄芩素)组,F(肾结石大鼠给予高浓度汉黄芩素)组,每组10只,HE染色法检测肺组织病理形态,全自动生化分析仪检测生化指标,ELI
期刊
基于主动式建筑理念,本文描述了设计策略的8个变化,即从设计建筑走向设计生活,从技术主导、措施导向和功能优先转向设计主导、性能导向和运维优先,从专业节能和设备依赖转向空间节能与气候适应,从节能建筑迈向产能建筑,从建造方式回归建筑体系,并给出了基于建筑工业和建筑服务业的建筑体系研究案例,引导使用者行为转变与建筑源头的健康与减碳,实现设计与建造科学的创新。
期刊
在计算机图形学和计算机辅助设计领域中,使用三角网格离散带有边界的二维平面域应用广泛。针对只存在直线段约束的平面域,目前国际上已经存在一些非常成熟且经典的三角网格生成算法,比如约束Delaunay三角剖分算法,其在约束边存在的意义下生成的网格质量最优(最小角最大)。如果平面域中除直线段约束外还存在曲线约束,经典的三角网格算法对其中的曲线不能直接处理,而是先通过线性逼近的方式将曲线离散成若干直线段,然
学位
符号距离场(SDF)是一种重要的曲面表示形式。近年来,随着几何深度学习技术的创新,符号距离场受到了越来越多的关注。无论是显式曲面表示形式(点云、网格),还是隐式曲面表示形式(f(x,y,z)=0),都可以很容易地转换为符号距离场来表示。因此,如何在符号距离场上定义一些关键的操作,是一个重要的研究方向。受限制的维诺图(RVD)是一种基本的几何工具,在采样、网格划分等几何处理任务中有着至关重要的作用,
学位