个性化电影主题播单推荐系统的设计与实现

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:kitwe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频推荐在推荐系统领域是炙手可热的话题,长视频不同于文字,在推荐给用户时所能展现出的信息相对较少,用户大部分时间只能通过名称和海报去判断是否对视频感兴趣。为了解决此类问题,论文设计和实现了电影主题播单推荐系统,从播单的角度寻求方案,一方面可以帮助用户发现自己感兴趣的视频,减少信息筛选的时间,另一方面让电影展现在对它感兴趣的用户面前,提高了平台的流量,从而实现用户和平台的双赢。电影主题播单推荐系统相比于传统推荐系统,需要解决主题寻找、视频聚合等问题,系统会挖掘用户的行为,将用户日志转化成抽象的用户画像,自动化生产兴趣播单、基于内容的播单和非个性化播单,再通过多路召回,混合推荐、多样性过滤等步骤,将播单精准地推荐给需要的用户。系统从功能上分为五个模块,分别为用户画像模块、播单处理模块、推荐工程模块、前端接口模块和工程监控模块。其中用户画像的计算主要使用了播放指数公式,并设计 了基于 TF-IDF(Term Frequency-Inverse Document Frequency,词频-逆文档频率)和基于记忆遗忘曲线增量模型的权重计算公式。在播单自动化扩充时,需要计算电影与电影之间的共现相似度。多路召回时,主要使用了用户画像的特征向量与播单标签向量的余弦相似度,并基于内容和非个性化多路召回。推荐时,主要设计了随机作为对照组,加权SlopeOne算法、ALS(Alternating Least Squares,交替最小二乘)矩阵分解的排序,在输出播单前,需要对推荐列表进行基于栈的多样性过滤,以保证返回播单内电影不会过多重复。前端接口模块使用Spring Boot框架为客户端提供接口服务。项目主要使用了Spark作为计算引擎,Spark MLlib机器学习库,Hive和Hbase作为大数据存储工具,Couchbase作为线上数据库,实现一个完整的推荐系统。项目上线后,使用了分桶测试为推荐效果做线上监控和验证,播单以及播单内视频的 CTR(Click-Through-Rate,点击通过率)和 UCTR(User Click-Through-Rate,用户点击通过率)相比于旧接口有了较为显著的增长。项目使用场景广泛,在TV端、移动端多频道都得到应用,对不同的展现区块可以有不同的推荐效果。
其他文献
上市公司控股股东私利行为问题是中国公司治理理论和实践的重要问题,对企业价值乃至资本市场的发展具有重要影响。在该问题的内部治理机制中,有制衡能力第二大股东的作用逐渐
以负荷传感多路阀中的主阀为研究对象,建立多路阀主阀数学模型和仿真模型,分析其动态特性以及相关物理参数和结构参数对动态特性的影响规律,研究结果为多路阀设计和研究提供
本文以杭州市市级医院正在积极推广的智慧医疗结算工程为切入点,详细介绍了市民卡智慧医疗多功能自助机设计方案。分析了医院自助机使用现状,并对现有自助机使用及布置提出了
选取17个具有典型代表性、享受天保工程政策、由林业部门主管的、以森林生态类型为主的国家级自然保护区,通过实地调查,评估天保政策对国家级自然保护区管理与建设所发挥的影响
工业生产快速发展导致大量重金属进入环境,造成了严重污染。重金属污染传统的物理化学处理法投资大,运行费用高,易造成二次污染,而生物处理法因其高效、低能、环境友好成为当
目的探讨胰激肽原酶(pancreatic kallikrein,PK)对他克莫司(tacrolimus,TAC)诱导的大鼠肾脏损伤的保护作用及其机制。方法体内实验:48只雄性Sprague-Dawley大鼠随机分为4组(
中国夹缬工艺有着古老的传统与悠久的历史,其在漫长历史过程中作为床品、服饰等植物纤维材料的装饰性技艺而存在。位于浙江中雁荡的乐清市的黄檀硐村曾因制靛及蓝夹缬技艺而
以杭州市市级医院正在积极推广的市民卡结算工程为切入点,介绍了杭州市红十字会医院运用市民卡改造门诊流程的成功经验,对普遍出现的问题提出了解决策略和建议。
在禾谷类植物的种子内普遍存在糊粉层组织,它是由包裹着胚乳的糊粉细胞形成的消化性组织层。种子萌发时,胚中产生的赤霉素(GAs)运输至糊粉层中,诱导糊粉层细胞合成并分泌水解酶
高温阀门设计近些年来获得了一定的发展,也获得了较为广泛的应用,因此对于高温阀门设计相关的技术进行研究很有必要。由于高温的长时间作用会对金属材料造成物理性能以及机械性