论文部分内容阅读
数据稀疏性问题一直是推荐系统中的一个难题,但目前为止仍然没有得到很好的解决。实际的推荐系统获取到的数据往往比较稀疏,传统的推荐算法无法再这种情况下很好的工作。考虑到电影自身的特点,人们对电影的评价大部分都来自于视觉信息,显然视觉特征中包含大量有用的信息,可以作为辅助信息为推荐算法所用进一步提高推荐系统的性能。视觉信息是人们理解世界的一种非常重要的信息,视觉特征中丰富的信息可以帮助人们更好理解推断事物。虽然视觉信息对推荐系统有很重要的利用价值,但是由于图片和视频的隐藏特征比较复杂,提取比较困难,因此研究相对较少。针对这一研究现状,本文对基于预告片视觉信息的电影推荐算法进行了深入的研究。具体研究内容如下:首先,本文对推荐算法的发展进行了回顾,对电影推荐算法以及视觉信息提取算法进行了系统详尽地总结和分析。其次本文设计实现了一种基于预告片视觉信息的电影推荐系统。本文设计的电影推荐系统主要包括三个模块:数据收集模块、预告片视觉信息提取模块和推荐模块。其中与传统的推荐系统不同的是,增加了一个视觉信息提取模块,此模块也是此推荐系统中最重要的模块,它的实现直接影响本文所提出的两个算法。随后,本文提出了基于预告片视觉信息的电影推荐算法。从预告片中提取出来的视觉信息作为一种附加信息,与评分数据相结合,用以提高电影推荐的精确度。因此,此电影推荐算法包括两个重要的部分:预告片视觉信息的提取和电影推荐的生成。预告片视觉信息的提取有两种方法:(1)利用将图片输入到卷积神经网络,输出中间的某一层作为视觉特征向量输出;(2)采用视频描述加标签文本分析的方法,即先通过视频描述过程为每个视频进行标签化描述,然后每个电影得到标签集合,再对标签集合进行标签文本分析,得到特征向量。电影推荐算法采用的是易于扩展且性能优异的概率矩阵分解算法。本文通过大量的实验证明了基于视觉信息推荐算法可以显著提高推荐性能。进一步,考虑到视觉信息所涵盖信息的有限性以及评论文本信息所包含的大量信息,本文提出将评论文本信息加入,与预告片视觉信息共同辅助评分信息,进一步提高推荐的精确度。本算法的实现方式有两种:(1)分别从预告片和评论中将视觉特征向量和文本特征向量提取出来,然后同时将两个特征向量带入到推荐算法中;(2)先利用视频描述过程,对每个视频进行标签化描述,每个视频得到一系列标签之后,将这些标签文本与评论放在一起进行文本分析,得到特征向量,最后将这个特征向量带入到推荐算法中。本文通过多组实验证明了评论文本信息与预告片视觉信息相结合应用于推荐算法中,展现出了有益效果。最后对全文进行了总结,对本文的主要贡献进行了阐述,并对下一步工作进行了展望。