长尾物品个性化推荐中的协同过滤

来源 :云南大学 | 被引量 : 0次 | 上传用户:hasfyturnip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网和科学技术的发展不断地降低物品的生产成本,致使物品空间迅速膨胀,长尾物品越来越多;物质世界的日益丰富,使得人们对个性化的要求也越来越高,而不再是从众地消费热门物品。但在信息的汪洋大海中,人们很难发掘自己感兴趣的长尾物品,长尾市场也难以定位到合适的用户群体。为了解决信息过载和不对称的问题,推荐系统应运而生,但目前常见的推荐算法大都倾向于为用户推荐热门产品。因此,构建长尾物品个性化推荐模型具有十分重要的现实意义。本文在MovieLens数据集上进行长尾物品推荐研究。针对用户物品矩阵数据所拥有的稀疏性、物品流行度分布有偏性特点,使用ITCC双聚类和K-means聚类算法对其进行聚类。实证分析结果表明,聚类算法能有效地提高子用户物品矩阵的稠密度和长尾物品的流行度,并且以聚类方法作为基于物品的协同过滤算法的预处理步骤,能提升长尾物品的推荐效果。其次,面对隐反馈用户物品矩阵数据缺少明确的正负反馈信息的问题和推荐长尾物品的需求,本文探索改进基于隐语义模型的协同过滤算法:对于用户物品矩阵中的每个用户物品对,根据有无历史交互记录猜测用户对物品是否感兴趣,并根据物品的流行度给出猜测的置信度。这样的改进能为长尾物品推荐模型提供更合理的正负样本,同时对模型在训练时倾向于提取热门物品的特征进行惩罚,以提高模型对长尾物品的关注。模拟结果表明,改进的隐语义模型能在保持较高推荐准确率的同时,将推荐覆盖率提升至隐语义模型的两倍左右,使物品空间中更多的长尾物品能被推荐给至少一位用户,显著地提升了长尾物品的推荐效果,很好地达到预期效果。
其他文献
随着人类对能源需求的加大,以及陆地能源的不可再生的特点,拓展能源空间已经迫在眉睫。海洋中具有丰富的资源,但水下环境复杂,对潜水人员的要求极高,依靠水下机器人进行作业
[研究背景与目的]肺癌的发病率和死亡率居全球恶性肿瘤首位,非小细胞肺癌(Non small cell lung cance,NSCLC)占肺癌的85%,腺癌是其中很重要的一种类型,易早期发生转移。大多
神经网络是人工智能领域一直以来的研究热点,神经网络的一大缺点就是反复迭代带来的巨大运算量,加快神经网络模型训练的速度能节省大量训练时间。COStream数据流编程模型是数据驱动的并行执行模型,利用COStream实现神经网络模型的并行化对于提高其训练速度有着很好的实际意义。针对神经网络运算量大的问题,利用COStream数据流编程模型提供的并行化方式,结合神经网络模型中存在的数据并行和流水线并行的
随着国民消费水平的提升,旅游行业在国家经济中扮演者愈发重要的角色,旅游业收入占GDP比重不断提高。旅游人数的增长对旅游城市和景点的管理提出了更高的要求,旅游需求受季节、假期、天气以及突发事件等多重因素的影响,如何准确预测旅客数量,对于行业监管者和经营者来说都具有重要的意义。诸多学者尝试使用不同模型对旅游需求进行预测,人工智能方法在自适应学习能力、非线性拟合能力方面较传统的方法具有很大优势,近几年成
遥感图像配准技术作为图像处理领域中的重要环节,在无人机、人造卫星、航天器等遥感系统平台中有着广泛的应用。由于遥感图像配准难度较大,在一定程度上限制了其应用和发展。
学位
作为国际贸易货物通关中的一个重要环节,海关估价是WTO贸易便利化的一个重要议题。一直以来关于海关估价的讨论主要集中在一般贸易货物,鲜有论及保税货物。但随着我国鼓励保
库存路由问题(简称IRP)作为物流配送系统的基础理论问题,主要研究的是为供应商制定给若干客户配送产品的计划,需要同时决策客户配送方案和车辆配送路线,在满足多项约束的情况下最终实现总开销最低的目标。最大级别交付策略下的多周期库存路由问题(简称MPIR-ML)是库存路由问题的变种之一,国内外对该变种问题的研究成果却几乎没有,对该问题的研究还存在着很大空间。本文主要研究MPIR-ML问题及其求解算法,用
自从2002年11月,金伯利进程国际证书制度建立,至今有54个国家和地区参与了这项关于毛胚钻石原产地控制的国际协议,在国际上对钻石的原产地进行全程追溯监控,要求参与的国家以
随着计算机视觉技术的飞速发展,对图像理解技术的要求也越来越高。图像检索作为图像理解方向的一个分支,具有十分重要的研究意义。该文针对图像检索算法进行相关研究,旨在通过对图像形成更加有效的图像类别信息,进而训练出更加有效的图像检索模型,以提高图像检索的性能。首先,建立基于“点-面”类别模式的图像检索模型。在一对一图像检索的基础上增加了类别信息,将单个图像上的图像检索转化为类别图像上的图像检索,挖掘查询