论文部分内容阅读
近些年来,随着信息技术以及互联网的飞速发展,通过网络观看电影已成为了许多人的一种习惯。然而,由于人们无法从海量的电影资源中快速获取自己喜爱的电影内容,这使得电影信息的过载现象变得愈发严重。作为缓解信息过载问题的重要手段之一,推荐系统可以帮助用户快速找到喜爱的电影内容,为用户带来良好的使用体验,因此其在国内外知名电影及视频网站中得到广泛应用,并带来了巨大的商业价值。推荐算法模块是电影推荐系统的核心,决定了一个推荐系统的优劣。在众多的个性化推荐算法中,协同过滤算法由于其简单性、有效性、准确性而成为了目前应用最为广泛的技术之一。然而,随着用户及电影项目数量的急剧增加,数据稀疏性问题成为了传统协同过滤算法面临的一大挑战,严重影响了推荐质量,导致用户体验度较差。此外,传统的协同过滤算法无法有效提取数据中的非线性因素,且考虑的数据角度单一,这也使得算法性能受限。随着深度学习技术的蓬勃发展,将传统推荐算法与深度学习技术相融合解决上述问题成为了新的发展趋势。针对以上问题,本文在现有研究的基础上,将改进加权Slope One方法与深度学习中的自编码器相结合,在缓解数据稀疏性问题的同时,学习数据集的更深层特征,进而提高推荐质量。本文的主要研究内容如下:1.针对数据稀疏所导致的近邻评分数据过少的问题,提出一种基于改进加权Slope One的评分矩阵填充方法。该方法利用改进的Slope One算法对未评分项目进行预测,然后将评分预测值填充到原始矩阵中,得到新的用户-项目评分矩阵,从而使得数据稀疏性大大降低。同时,本方法也为之后的DeepRec算法缓解数据稀疏性问题提供了思路。2.由于经典的协同过滤方法采用浅层模型无法学习到用户和项目的深层次非线性特征,进而导致推荐质量较差。针对上述问题,在前一个工作的基础上,将深度学习模型中的自编码器引入到电影推荐的评分预测任务中来,提出一种基于深度降噪自编码器的电影个性化推荐算法,命名为DeepRec。该算法利用深度自编码器学习非线性和有意义的用户-项目关系;同时,由于自编码器具有去噪的特性,故加入合适的噪声,以提高预测的鲁棒性和准确度。3.在MovieLens电影数据集上进行实验,并通过对本文所提算法和对比算法的实验结果分析,验证本文算法的有效性。