基于两阶段行为模式的协同过滤推荐算法研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:ymlazy62
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于互联网中信息爆炸式的增长,导致用户很难直接发现有用的信息。为此,根据用户的历史行为数据进行建模的推荐系统吸引了学者的广泛关注,可以一定程度上缓解信息过载的问题。各种类型的推荐算法中,协同过滤推荐算法以其可理解性强、无需语义分析等特点成为目前使用最广泛的推荐算法之一。但是,随着数据规模的增大,协同过滤算法面临着数据稀疏,实时性以及准确性和多样性的权衡等方面的问题。另外,与之前的评分预测相比,Top-N推荐形式更符合当前协同过滤推荐算法的需求。因此,本文主要针对协同过滤算法存在的部分问题,研究协同过滤算法在Top-N的推荐算法。本文主要的研究工作是:(1)提出了基于两步预测的二分网络Top-N推荐算法。已有的基于二分网络的协同过滤推荐算法只考虑了用户选择,忽略了用户评分。利用本文的用户行为中存在的两阶段的行为,提出了基于两步预测的二分网络Top-N推荐算法。该算法先利用NBI算法预测用户对产品进行评分的概率,然后利用两步预测将其与协同过滤算法结合进行推荐。在MoiveLens数据集上的实验表明,该算法提高了推荐的准确度。(2)提出了一种基于属性比重相似性的两步预测Top-N推荐算法。在处理极端不均匀和稀疏的用户评分数据时,传统的协同过滤推荐算法不能很好的进行相似性计算。为此,考虑用户对某一类的产品更感兴趣和一个产品可能同属于不同的属性,同时,结合用户两阶段行为模式,本文提出一种基于属性比重相似性的两步预测Top-N推荐算法。在MoiveLens数据集上的实验表明,算法能提高协同过滤算法的Top-N推荐的准确率和多样性。(3)基于Spark框架的属性比重相似性的两步预测推荐算法的并行化实现。结合Spark框架在实现并行化方面的优势和协同过滤推荐算法的实时性,本文实现了基于Spark框架的属性比重相似性的两步预测推荐算法的并行化,达到通过架构的方式提高推荐算法实效性的目标。在MoiveLens数据集上的实验结果表明,该算法能够提高运算的速率。
其他文献
量子计算机可看作是量子图灵机,量子图灵机则可等价于量子逻辑电路,量子电路是研究量子信息的主流模型。随着量子信息快速发展,量子电路越来越复杂,自动高效的设计出复杂量子
在基础交互任务中,性能预测模型是人机交互研究的一个重要分支,如得到广泛应用的费茨法则。近些年随着力反馈技术的发展,力反馈设备的应用也越来越多,如虚拟手术、虚拟装配、
大批量定制生产因为充分融合了定制和大规模生产的优势成为一种在各领域得到广泛应用的重要生产模型,它在满足客户个性化需求的同时,能保持较低的生产成本。在各种大批量定制生产的解决方案中,基于产品平台的产品族设计战略得到高度重视,其中的核心问题是产品平台规划。通过分析当前国内外研究现状及存在的问题,对基于灵敏度分析的可调节式产品平台规划方法和关键技术进行了较为深入的研究,主要工作包括以下5个方面:(1)对
移动Ad Hoc网络(MANET)是一种由多个不依赖于任何基础设施的无线移动终端分布式构成的多跳自治网络。近年来,随着移动通信技术的飞速发展和普及,这种新型网络技术引起了广泛
随着计算机和互联网的飞速发展,网络的覆盖面越来越广、网络设备的普及率越来越高,人们随时随地可以获取自己需要的信息,人们对互联网的依赖性也越来越强,互联网也成为很多人
随着计算机网络系统的日益庞大,许多用户所要求的复杂业务需要分布式环境中多个位置合作完成,由此迁移工作流成为近年来工作流研究的热点问题。在迁移工作流管理系统框架中,
随着信息技术的快速发展,互联网已成为了人类信息社会主要基础设施之一,但经过半个多世纪的发展,已经演变成了复杂的巨系统,随着用户规模的快速增长,资源并发访问显著,使得有
云服务聚合作为实现云计算按需服务的关键技术与研究热点,目前已经取得了一些有价值的经验成果。然而,这些理论大都以服务质量(Quality of Service,QoS)为驱动,侧重从功能性需求、
由于指纹具有唯一性、稳定性和使用方便性,指纹识别已经成为主流的生物特征识别手段,在许多领域得到了广泛的应用。指纹识别包括预处理、特征提取和匹配等过程。指纹图像分割
在高速发展的信息时代,随着网络技术和规模的不断发展,信息安全已经成为全球性的重要问题之一。入侵检测技术作为新一代安全保护技术,它对计算机或网络中发生的事件监视和分