基于用户影响力和隐式因子的推荐方法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:haibolovemj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤算法是迄今最为流行的推荐算法之一,但是传统的协同过滤算法都面临着数据稀疏性的问题。现有的系统主要是通过辅助信息来缓解这一问题,但是这些方法并没有充分挖掘各类信息中所蕴含的价值,从而限制了模型的性能。为了解决此问题,本文提出了基于用户影响力和隐式因子的推荐方法。首先,本文使用PageRank算法计算用户的全局影响力。然后,考虑到影响力大的用户在推荐中起引领作用,本文将影响力作为权重对评论文本进行预处理。我们认为这是对平台内影响力大的用户"言论"进行扩散的过程。接下来,利用评分和处理后的评论文本,在一个共享的主题空间使用潜在主题模型对用户偏好和物品特征进行建模;结合学习到的用户偏好分布和物品特征分布,使用矩阵分解技术对用户-物品评分矩阵进行分解。最后,用最终得到用户和物品的潜在特征向量对模型进行预测。本文在公开数据集Epinions上进行对比实验和结果分析。结果表明,将用户影响力加入模型能极大提升系统的推荐性能,而且模型在召回率方面相较于已有的推荐方法也有一定的提高。
其他文献
在大数据时代背景下,电子商务、第三方支付等线上业务爆发式增长,随之而来的是日益猖獗的线上欺诈案件,在线欺诈检测技术作为企业风控能力的基石,通过对业务行为建模,更加精
在实际应用中,数据集通常包含正常数据和离群数据,相对于正常数据而言,离群点的产生机制往往与之不相同,所以离群点可能蕴含着重要的信息,研究离群点的内涵知识具有重要学术意义和
制造工业产品缺陷的分析是改进企业产品制造过程的重要途径之一,对于产品质量以及营销收益有着重要的研究意义和应用价值。伴随计算机技术的快速发展、自动化系统的全面部署,
随着计算机技术的发展,计算机设备和网络设备变得越来越复杂。为了维护这些设备的安全稳定的运行,日志系统记录了这些设备的运行信息。但是各种设备的日志系统各不相同,它们
近些年在知识图谱蓬勃发展的大背景下,与之相关的语义Web的数据规模也呈现爆发态势。如何在大规模语义Web数据上有效地进行语义推理是研究者们面临的棘手问题。具体来说,在大
随着数据库技术的高速发展,普通用户可以像网页搜索引擎一样通过输入关键词直接在关系数据上查询结果,而不需要了解底层的数据库模式以及复杂的SQL查询语句。当前的关系数据库
目前,针对模糊认知图(Fuzzy Cognitive Map,FCM)学习算法与应用的研究已得到很大发展。但FCM学习算法的研究仍是一个新兴的领域,尚未形成一个独立的分支。FCM的最大缺陷就是基于先
多机系统为人类实现高性能计算、大容量分布式信息存储提供了强大的工具,多机系统的广泛使用已经成为衡量一个国家经济发展和信息化水平高低的一个重要标志。随着系统规模的日
软件测试贯穿于整个软件开发生命周期,是保证软件质量的重要手段。测试过程中,穷举测试是不可能的,但是我们又希望达到测试的完备性,同时使测试不会出现冗余。虽然等价类划分法、
随着计算机图形学技术的发展以及三维模型在各领域内的广泛应用,如何利用自由的表达方式快速准确的从数据库中检索设计过程中需要的三维模型变得尤为重要。目前,三维模型检索研