基于弹幕评论的视频推荐系统研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:mumuduck
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速普及,多媒体处理、网络传输、视频数据存储等相关技术快速发展,人们能够接触到更多来自于各种各样视频网站的内容。眼花缭乱的信息充斥着人们的眼睛和大脑,在这样一个视觉和听觉如此丰富繁华的时代,推荐系统作为解决信息过载的方案逐渐受到学术界和工业界越来越多的关注。随着推荐系统的进一步发展,学者们开始不再仅仅关注于用户和视频之间的交互记录,还包括用户和视频自身的属性等信息。由于机器学习特别是深度学习的发展,研究中涌现出许多将视频图片、视频评论等信息与推荐系统结合的方法。弹幕评论是近年来在各互联网平台上越来越受欢迎的评论形式,它使用户能对当前视频片段表达实时的意见或评论,而国内外对弹幕评论的研究还在处在起步的阶段,研究问题主要包括视频关键词提取和视频高亮片段提取两个应用领域。与图片和评论等信息一样,弹幕评论中包含了大量有关用户偏好和视频的特征,因此从中提取语义信息是一种提高推荐系统效果的重要方法。弹幕评论相较于传统的评论有许多特点,包括实时性、自发性、多样性、丰富性和交互性,一方面用户通过弹幕评论表达了对当前视频内容的感兴趣程度,另一方面不同弹幕评论中的话题组成了视频内容的概览,因此从弹幕评论中可以了解到每个用户的关注点以及视频的话题分布,从中提取的用户和视频特征可以帮助推荐模型获得更好的推荐效果。然而弹幕评论存在的随意性、简短性和口语性使得其中常混杂着大量噪音,对于语义提取而言存在一定的阻碍,因此如何充分利用弹幕评论特征并应用在推荐系统中是本文研究的主要内容。本文提出了基于弹幕评论的推荐系统,分析弹幕评论中的用户和物品信息,并利用这些信息进行推荐。本文主要做了以下几方面研究工作:(1)从弹幕视频网站中收集弹幕评论数据,将用户的所有弹幕评论聚合为用户数据集,将视频中包含的所有弹幕评论聚合为视频数据集,然后分别对物品和视频数据集进行分析;对弹幕评论进行了数据统计并按照不同数据特征例如数据稀疏度、视频类型等不同数据特征,研究在此基础上的推荐效果。(2)为了平衡推荐模型性能和训练时间复杂度,本文提出了两个基于弹幕评论的推荐算法:个性化主题推荐模型(Personelised Topic Recommender Model,PTRM)和个性化循环推荐模型(Personelised Recurrent Recommender Model,PRRM)。前者利用话题模型处理弹幕评论提取用户和视频特征,然后在上层设计多层感知神经网络利用用户和视频的交互数据修正用户和视频特征,以提高模型推荐效果;后者利用词向量的方式提取弹幕评论特征,并设计基于注意力机制的循环神经网络从中提取用户和视频的特征用于推荐。(3)通过实际数据集实验将本文算法与经典的推荐算法和基于深度学习的推荐算法进行比较,分析本文模型的推荐性能。(4)设计并实现了基于弹幕评论的推荐系统原型。系统主要功能包括用户注册、登录、观看视频和弹幕评论、发表弹幕评论等,系统收集用户的观看和评论记录,并据此对用户进行个性化推荐。本文首先介绍了基于弹幕评论的推荐系统研究背景和意义,分析了推荐系统和弹幕评论研究的现状和存在问题,提出了本文的技术路线。然后对本文提出的推荐模型进行详细的说明,包括模型参数、结构和训练方法,并在实际数据集上进行实验,验证模型的推荐性能。最后设计并实现了弹幕视频网站原型,展示了模型的真实应用场景。
其他文献
我国著名教育家陶行知曾说,校长是一个学校的灵魂,要评论一个学校,先要评论他的校长;校长是学校精神力量之所在,校长是带给学校蓬勃生命力的主要因素;校长虽然官位不高,权力不大,但责
智能化系统是整个纪检监察机关办案工作点建设的关键组成部分,通过该系统平台,可以在最有效的状态下整合各种有利因素,充分发挥整体功能,全面提升查办大案要案的效率和指挥水平。
本文采用文献资料法、访谈法、问卷调查法和数理统计法对四川师范大学非体育专业的大学生参加课外体育活动的兴趣、动机与规律进行了调研,旨在探索提高大学生参加课外体育活动
“一只粉笔一本书,一盘磁带一张嘴”,这是传统思维中人们对韩语听力课堂的印象。可想而知,学生对如此单调的教学设备,干巴巴的教学模式能有多大的兴趣。所以,听力课上往往是教师在
一般意义上讲,发展职业教育的出发点是为经济建设培养大量实用型、技能型人才,也是为了满足就业市场的需要,其落脚点在于培养了什么样的人才,培养的人才是否适销对路。从人才合格性的角度和职校生就业的角度出发,职业技术教育与德育教育加以整合是职业教育发展的必然选择。  目前,在职业教育领域中存在着一个误区,即过于狭窄地理解职业教育所培养的“实用型”、“技能型”人才的概念,过多地关注其职业技能而忽略了学生素质
文章认为我国经济进入新的发展时期中,优化经济结构具有重要意义。作者认为宜从两方面入手:①以销为基准,优化产业结构;②在爱国主义大旗下,建立中华经济统一体,优化经济结构
温室气体(Greenhouse gases,GHG)大量排放造成的全球气候变化已成为当今最严峻的环境问题之一。二氧化碳(CO_2)被认为是主要的GHG之一,其控制与减排刻不容缓。碳捕集和封存技术(Carbon Capture and Storage,CCS)是目前实现CO_2减排最行之有效的途径之一。以有机胺为溶剂的化学吸收法是目前应用较为广泛且相对成熟的工艺,但该法仍存在一系列的操作管理问题,例
在引入佣金提成的独立私人价值模型及关联价值模型中,讨论第一价格和第二价格拍卖,发现佣金比例k的大小对投标人的出价策略、卖方和拍卖行的期望收益都有影响.k越大,买方出价
1994年,我国外汇管理体制发生了重大变革,取消了外汇留成,实行银行结售汇制度,以此为基础,建立了银行与企业、外汇指定银行之间的二级外汇市场构架,形成了以市场供求为基础的
一种新观点认为,随着工业和信息化部成立、国务院信息化工作办公室“不再保留”,当前的中国电子政务建设进入“重要机构缺位”的时代,这对电子政务发展非常不利。从我国电子政务