基于多特征融合的混合协同过滤算法研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:anglewang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,信息超载问题变得愈发突出,用户无法快速从大量的网络信息资源中获取对自己有用的信息,导致信息的使用效率降低。推荐系统作为一种信息过滤的重要手段,有效的解决了这些问题,现在推荐系统的应用已越来越广泛。协同过滤是推荐系统最有代表性的技术之一,具有很强的应用价值,它的基本思想是通过分析用户和项目的历史数据,找到目标用户或项目的相似邻居,再根据相似邻居的评价产生目标用户或项目的预测结果。然而,由于历史数据的稀疏性,导致传统协同过滤算法的推荐准确度大大降低;此外,随着用户和项目数量的增长,实时性、可扩展性等问题也使协同过滤的发展受到一定的限制。针对上述问题,本文主要在以下几个方面进行了探索和研究:(1)针对数据稀疏导致相似性度量不准确的问题,首先提出了增强的皮尔森相关相似性度量方法(EPCC),该方法综合考虑了用户或项目间共同评分和所有评分的差异,使得相似性度量更加准确。其次,为了进一步缓解原始评分矩阵的稀疏性,提出了基于评分和特征融合的相似性度量方法,该方法利用SVD技术挖掘用户和项目的潜在特征并把原始评分和特征进行融合,再根据融合后的评分-特征向量度量用户或项目的相似性,特别的,该算法采用中融合的方式可以动态的平衡评分和特征之间的重要程度。实验结果表明,本文提出的相似性度量方法可以有效的提高预测准确度;(2)针对传统邻居选择算法存在的问题,本文对邻居的相似大小和邻居的数量进行分析,提出了一种改进的近邻选择算法——基于信任区间的k近邻优化算法。实验结果表明,该算法可以在时间复杂度几乎不增加的情况下选择更优的近邻进行推荐,从而提高了推荐精度;(3)为了充分结合用户和项目的预测以提高推荐准确度,提出了基于用户和项目混合的协同过滤算法。通过分析邻居数对预测的影响,本文算法在用户-项目二维邻居集中选择用户最近邻和项目最近邻,并把选择的近邻数作为混合用户和项目预测结果的重要程度。此外,在预测部分,考虑到规模评分和真实评分的差异,提出了区间匹配的预测方法,该方法先预测目标用户或项目的值区间,再根据预测值区间匹配来确定最终的预测值。实验结果表明,本文提出的混合算法有效的缓解了数据稀疏,进一步提高了预测的准确度。
其他文献
快速、高效的文本聚类算法有助于从大量非结构化的文本源中发现和挖掘其所蕴含的巨大潜在知识。文本数据以向量空间模型表示成特征向量,往往呈现出高维特征。利用投影寻踪模型
本学位论文选择了将中国书画艺术电子化创作的论题作为研究中心。 本学位论文对中国书画艺术电子化创作中涉及到的若干智能设计与美学创作的重要问题以计算机科学研究的方
目前,市场上流行的网络物理隔离器件硬件系统,往往基于工控机或者多片嵌入式芯片构成,实现复杂、成本较高。本文首次提出了基于大规模逻辑门阵列FPGA(Field Programmable Gat
信息时代如何短时间内获取最有用信息以适应社会的生存和竞争的问题,越来越被人们重视。信息摘要作为该问题的主要解决手段受到广泛关注。由于自然语言文本是信息记录和传播
随着微电子、无线通讯等技术的发展,越来越多的智能设备被发明并被广泛应用于诸如物流运输、环境监测、智能家居和健康医疗等领域。这些数量众多、功能各异的智能设备是泛在
空间语法是一种研究空间组织结构与人类社会活动之间的相互关系的理论方法和分析工具。然而,其传统的轴线模型在对道路表示方面存在着局限性。因此,在此基础上得到的关于道路网
目前,随着互联网和计算机技术的发展,基于网络的实时在线监测系统成为企业对监测系统追求的新目标。国内的状态监测研究与应用仍存在不足之处,主要表现在传感器配置不完善,监
随着网络信息技术的快速发展,如果大数据中有许多遗留下来的历史数据,那么用户从数据仓库中提取信息时可能会过时或不准确,时效性差的数据可能会对人们的日常生活和企业决策
近年来,随着Internet和图像处理技术的快速发展,网络视频监控技术得到了广泛的应用。在网络视频监控系统中,监控的范围不再局限于某一个地点,而是任何有网络的地方。和以前的
在信息社会里,手机已成为人们日常生产生活中必不可少的通讯工具。随着技术的发展,手机的性能比过去有了巨大的提高,几乎可以与九十年代中期的PC机相媲美。可以说当今的手机已经