融合边信息的协同过滤推荐算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:eidolonfish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的普及以及互联网的快速发展,越来越多的信息服务为用户的日常生活带来了便利,尤其是近年来智能手机的普及,使得用户可以随时随地地在网络中分享或者获取信息。这些丰富的信息服务使得网络上的信息资源呈现出了指数增长的趋势,越来越多的信息充斥着网络,导致了用户在面对这些海量的数据时无法快速找到对自己真正有用的信息,即所谓的信息过载问题。为了使用户能够高效地获取到自己需要的信息,以个性化推荐技术为代表的推荐系统应运而生。作为目前应用最成功的个性化推荐技术,协同过滤推荐只需要根据用户的历史评分数据就可以完成对用户潜在兴趣偏好的挖掘,具有应用简单、预测准确度高等一系列优点。但是,在推荐系统中越来越大的数据量、越来越复杂的数据类型使得传统的协同过滤推荐算法遇到了越来越严重的问题。而在这些问题中,最难解决的当属数据稀疏问题。然而,在目前一些新的推荐场景中,除了用户的历史评分信息之外,还能够获取到丰富的用户和物品的边信息,这些边信息能够为描述用户的偏好以及物品的属性提供重要的信息,从而为缓解数据稀疏问题带来了契机。本文针对如何将边信息融合到协同过滤算法中展开了深入细致的分析和探讨,具体内容如下:(1)针对目前协同过滤推荐面临的数据稀疏问题,本文提出了一个可以融合边信息来提升推荐质量的算法——“三体”协同过滤推荐算法,该算法将基于用户的协同过滤推荐、基于物品的协同过滤推荐和基于模型的协同过滤推荐相结合。通过在隐语义模型的基础上加入用户和物品的约束平滑项,使相似的用户或者相似的物品具有高度相似的隐特征,通过实验证明改进后的算法相比单独的三个算法都具有较高的推荐质量。(2)结合三个现实中的推荐场景来对“三体”协同过滤推荐算法进行说明。在传统的电影推荐场景中,由于没有有效的边信息,则直接利用用户评分矩阵来计算得到用户之间和电影之间的相似度,并带入“三体”协同过滤推荐算法中。在图像推荐的场景中,图像的视觉信息是一个重要的边信息,本文通过VGG16网络结构来提取图像的深层视觉特征,然后将基于视觉特征计算得到的图像之间的相似度带入“三体”协同过滤推荐算法中进行推荐效果验证。在加入社交信息的电影推荐场景中,用户的社交信息同样是一个重要的边信息,本文通过“大度节点有利指标”来计算社交网络中用户节点之间的相似度,然后将其带入“三体”协同过滤推荐算法中进行推荐效果验证。通过对三个不同的推荐场景进行实验验证,充分证明了“三体”协同过滤推荐算法能够作为一个通用的推荐算法来有效提升推荐的质量。
其他文献
目的:通过临床调查,观察中重度吸烟的闭塞性动脉硬化症(Atherosderosis Obliterans,ASO)患者的一般情况(性别、年龄等)、内膜-中膜厚度(IMT)、血管狭窄程度、ABI及中医证候特征的相关性,并分析了烟草烟雾病邪在血脉病中的致病机理,为ASO的一二级预防提供中医防治思路。方法:将符合纳入标准的患者根据吸烟指数分为4组:非吸烟组、轻度吸烟组、中度吸烟组和重度吸烟组。分别观察每
随着信息时代的迅速发展,人们对于通信带宽和速度的要求越来越高。通信容量的增加对光通信系统中各器件的性能提出了更高的要求。光调制器是光通信系统中必不可少的器件之一,
近年来,企业界和学术界均强调企业社会责任行为对投资者态度与行为具有至关重要的影响,履行企业社会责任行为越来越受到企业、政府、公众的重视。受到市场竞争和技术变革的驱
目的:通过检测阻塞性睡眠呼吸暂停低通气综合征(obstructive sleep apnea-hypopnea syndrome,OSAHS)患者血浆血管生成素样蛋白4(angiopoietin-like protein 4,ANGPTL4)和血管生成素样蛋白8(angiopoietin-like protein 8,ANGPTL8)的水平,研究其与OSAHS脂代谢紊乱的相关性,探讨ANGPTL4
随着点云相关技术的高速发展,大量产业与领域开始加深对点云的结合与应用,城市规划、VR虚拟现实、机器人自主导航、3D影视等处处可见三维点云的身影。但三维点云从扫描到应用中间,还需要进行大量的处理工作,而点云的特征提取与形状分类都是点云应用前至关重要的处理步骤。本文主要针对室外场景的三维点云,进行特征提取并实现点云的形状分类。本文提出了一种基于高斯主元分析的几何特征提取方法,通过KD-Tree和KNN
在中国经济高速发展的进程中,中国经济稳中求进、稳中有忧,经济下行的压力有所增加,特别是在中美经贸摩擦的背景下,中国经济面临的外部环境严峻,无法与自身的发展相平衡,使得稳定增长、预防风险的难度加大。从需求方面来看,消费增速持续疲软,尽管房地产开发投资保持较高水平,基础设施投资略有反弹,但受工业企业利润增速下降和进出口增速下降的影响,制造业投资急剧下降,总投资增速有所回落。在此经济环境下,金融市场发挥
在n个连续的测量周期内持续出现的流被称为持续流。对于一个主机,在n个连续的测量周期内至少有一个主机始终与该主机相连接,则该主机称为持续主机;同时始终与该主机连接的其
目的:通过观察三种不同禁饮状态对腹腔镜胆囊手术全身麻醉患者麻醉诱导前、插管前、插管即刻及插管后5分钟血压、心率的变化,同时测定各时间点静脉血去甲肾上腺素、血糖水平变化,了解不同禁饮状态对腹腔镜胆囊手术全身麻醉患者气管插管应激反应的影响,进而为减轻患者麻醉时应激反应提供更合适的选择。方法:选取邯郸市中心医院普外一科60例腹腔镜胆囊切除术患者,将患者随机分为三组:对照组(即术前禁食12小时,禁饮8~6
随着信息技术的快速发展和数字多媒体设备的不断普及,我们生活中的数字视频资源日益丰富。在视频数据中,人工文本信息同视频的内容密切相关,对于视频的分析理解和检索等应用
随着互联网的高速发展,网络攻击事件频繁发生,如端口扫描、蠕虫病毒、DDoS攻击等,这些事件具有相似的行为特征。例如,蠕虫病毒传播时,攻击者的源主机在短时间内向大量的目的