电影推荐算法的研究与实现

被引量 : 0次 | 上传用户:shall202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,互联网上的新增信息量呈爆发式增长,用户无法有效的获取有价值的信息,面临着日益严重的信息过载问题。作为克服信息过载问题的一个重要方法,个性化推荐系统顺应潮流地迅速发展起来,并被应用到各种各样的互联网服务中,如电商网站、电影音乐社区等。传统的基于协同过滤的个性化推荐算法以群体智慧的思想为基础,使用用户与物品之间的交互信息(即用户在网站上的历史行为记录,如购买记录、评分记录等)建模,以此来衡量用户对物品的偏好程度。为了进一步提高推荐系统的效果,基于人们容易接受来自朋友的推荐这一现实生活中的现象,研究者把协同过滤的思想应用到社交网络信息中,通过在个性化推荐系统中融入社交网络信息来提升推荐的准确性。然而,在真实的个性化推荐系统中,除了用户与物品间的交互信息以及用户间的社交网络关系信息以外,还有很多用户或物品的相关信息。这些相关信息隐含着用户与物品的特征,可以被引入到推荐系统中,从而提高推荐的效果。如何有效的融入不同类型的相关信息,是个性化推荐系统研究领域面临的一个新的挑战。本文把复杂的个性化推荐系统抽象成双星图模式,并提出一种新的基于双星图的矩阵分解方法。该方法通过添加基于用户或物品的相关属性相似性正则化项,使目标用户或目标物品的潜藏因子与其他相似的用户或物品的潜藏因子更接近。通过添加新的正则化项,该方法有效地向矩阵分解模型中融入了用户或物品的多种相关属性信息,从而提升高推荐系统的性能。为了验证新方法的有效性,本文抓取了一个较大规模的豆瓣电影数据集,其中除了用户与电影间的历史评分记录,还包括用户间的社会网络关系信息,用户的居住地及其加入的兴趣小组,电影的类型、导演和演员等属性信息。为了更好的进行对比实验,我们还实现了几个时下流行的基于矩阵分解的协同过滤模型,包括基于概率矩阵分解的协同过滤、基于社会化矩阵分解的协同过滤以及基于协同式矩阵分解的协同过滤。在豆瓣数据集中,对新方法和这几个流行的方法进行对比。主要考查不同方法在有效性对比实验以及冷启动性能对比实验的表现。通过实验,可以展示出本文提出的基于双星图模式的矩阵分解方法比其他对比方法对评分预测得更准确,并且在缓解冷启动问题上更有效。因此证明了我们提出的方法可以有效的融入更多的信息,并以此提升推荐性能。
其他文献
通过对黑龙江省249家农民专业合作社有关融资问题调查数据的整理,运用Logistic模型对农民专业合作社产权抵押贷款可获性的影响因素进行分析。研究结果表明,农民专业合作社社
<正> 一、雄性特异抗体的制备 1、免疫注射:取10个近交30代以上大鼠新生仔的睾丸或0.5克雄性大鼠的脾脏做为抗原,腹腔注射给同系的2月龄雌性大鼠,每周一次,连续注射六周,最后
随着四川省农村社会经济的快速发展,农村城镇化水平加快、规模增大、人口增加,畜禽养殖水平提高,农药化肥的大量施用,导致农村消费指数的上升及水污染的加剧,使四川省水体环境恶化
本文研究了姜油树脂微胶囊的制备工艺。选择麦芽糊精和大豆蛋白作为壁材,以姜油树脂为心材,其工艺过程主要包括心壁材混合液的制备、均质及喷雾干燥微囊化。试验发现,影响其产品
<正> 评价系数法是价值工程中确定功能价值的一种主要方法。1—9标度法不仅可以对功能之间的重要性及重要性大小进行明确地评价与判断,而且还可以检验并保持评价(判断)过程的
网络时代,网络营销早已成为市场营销的重头戏,它以其互动性、针对性、趣味性等特点迅速抢占市场,企业若想在当今社会突出重围,创造更高的价值,网络营销是其不可忽略的部分。
随着国民生活水平不断提高,生活质量、身体健康越来越受到人们的日益关注,卫生健康越来越受到人们的重视。这也导致了医疗费用的支出被大幅提高,同时国家也在逐年增加对医疗卫
央视文化类节目《朗读者》一经播出,便得到了社会大众的广泛好评。这其中离不开节目精良的制作追求,但更要归功于其成功的传播策略:注重前期策划,保证内容质量;利用节目制作
<正>结节性多动脉炎(PAN)是一组主要侵犯中等度大小肌肉动脉和肌层小动脉的以呈节段性炎症和坏死为特征,伴受累血管的供血组织发生继发性缺血。病因可能与免疫机制有关,药物
话语标记语自从上个世纪七十年代以来就备受许多语言研究人员的青睐。很多学者都对话语标记语的研究做出了突出的贡献,同时,几十年来有关话语标记语的研究课题和文章也同样如雨