基于多类型隐性反馈的推荐算法的研究与实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:ronglao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迭代与更新,信息数量呈爆炸式增长,信息过载问题尤为严重,推荐系统应时而生。传统的推荐系统分为两种,一种是直接利用显性反馈信息进行预测,由预测分数高低进行推荐,另一种是基于用户隐性反馈信息进行Top-k推荐,把推荐列表直接展示给用户。然而,在现实生活中,用户与物品的交互行为包含一系列的隐性和显性信号,从点击、收藏、购买,到评分。隐性反馈数据不仅容易获取,而且数据量大、数据类型丰富。如何有效地利用丰富的隐性反馈数据来产生更恰当的推荐,仍然是个还未解决的问题。针对这个问题,研究人员也注意到了用户的隐性反馈数据,但其关注点往往在单一类型的隐性反馈行为,这样的方法在如今互联网平台快速发展的阶段已经不再适用。互联网平台提供功能越丰富,用户与物品之间可能存在多种不同的行为关系,经研究发现这些不同类型的行为之间存在潜在依赖关系。基于此,本文尝试挖掘用户多种类型的隐性反馈之间的单调依赖关系,更准确地预测显性反馈行为的发生。首先参阅国内外相关文献,分析目前利用多种类型隐性反馈数据的推荐算法的研究背景和最新成果,夯实了基于多类型的隐性反馈数据之间的单调性,预测用户响应行为的理论基础。然后对现存的比较先进的基于隐性反馈行为的推荐算法进行了分析与改进,提出了可以模拟用户与物品之间全范围的交互行为的多重单调行为链推荐算法。随后对隐性反馈都属于正反馈,无法真实反映用户的兴趣爱好的问题进行了研究与分析,基于群体行为相似理论,引入聚类算法划分用户兴趣群组,提出了基于兴趣群组的个性化推荐算法。同时,本文针对提出的两个算法,都设计了相关实验,将它们分别与目前国内外的基于隐性反馈数据的推荐算法应用最广的贝叶斯成对排序模型、逻辑回归矩阵分解算法、行为链算法和隐语义算法,在公开的、被广泛应用于对隐性反馈数据研究的Yoo Choose、Steam Video Games和Goodreads Book三个数据集进行了对比实验,并以控制变量法,探究多个参数对性能的影响。通过对比AUC和NDCG两个指标,提出的两个算法的推荐效果明显优于基线算法,也证实了利用多类型隐性反馈行为间的单调性描述用户偏好,可以提高推荐的准确性。最后本文将提出的两个算法应用于实际,设计实现了一款基于多种类型隐性反馈数据的推荐原型系统,实现了高准确率和低时耗的物品推荐,为互联网平台处理复杂的推荐问题提供了一种新思路与新方法。
其他文献
当前社会正处于体验经济的发展阶段,它是继农业、工业、服务业之后的第四个经济增长点。它改变了企业的生产方式,影响了人们的消费方式,强调要为消费者营造难忘的体验。在体验经济的大环境下,各个行业都在探索一条独特的体验经济之路。苏州桃花坞木版年画作为第一批国家级非物质文化遗产之一,蕴含着中华民族民间手艺的的巧妙智慧,具有极高的艺术价值,然而社会的快速发展使得桃花坞木版年画逐渐被人们遗忘,导致生存状况堪忧。
独立审计作为第三方审计对被审计单位的财务状况起着外部监督的作用,而内部控制作为企业的内部体系建设可以从根源上发现、规范财务不合理的现象。当企业内部控制存在缺陷时,
本论文从社会学视角出发,根据文献资料、基于实地调查,以鄂尔多斯市乌审旗梅林庙嘎查为例,通过分析家庭变迁、家庭分工以及家庭权力关系,探讨了牧区家庭权力结构的现状。本文
荧光分析法因其极高的检测灵敏度和无损的检测方式,获得人们广泛地研究。尤其表面增强荧光法的发展对痕量目标体系甚至单分子层面的研究起到极大地推动作用。除了实现分子光
石墨烯作为一种新型的二维碳纳米材料,由于具有独特的物理化学性质,在能量存储与转换、传感器、半导体材料、生物医学等领域有广阔的应用前景。目前石墨烯的制备方法主要包括
在全球变暖的大背景下,多年冻土的分布和发育对区域环境和生态系统影响显著。有“世界屋脊”之称的青藏高原,作为气候的“放大器”和“驱动器”,其多年冻土的特征及演化趋势与全球其他地区具有相似性,故青藏高原作为研究多年冻土的典型代表,其研究意义和价值不可小觑。本文以青藏高原典型热喀斯特湖BLH-A湖所在流域为研究对象,在国内外学者提出多年冻土研究方法的基础上,通过改进SUTRA程序,建立热喀斯特湖影响下的
当前幼儿园课程实施过程中存在诸多现实性问题,例如幼儿园对权威的盲目追逐,忽视了幼儿园课程实施的文化适宜性,基于幼儿园文化研究课程实施有助于该问题的解决。那么这理应涉及到如下几个问题:基于幼儿园文化,幼儿园课程实施的基本原则是什么?个案幼儿园的课程实施现状如何?基于个案幼儿园文化,该幼儿园的课程实施存在什么问题?影响该园基于本园文化实施课程的因素是什么?幼儿园基于本园文化实施课程的策略是什么?为了解
催化剂的表面组成和结构(几何结构和电子结构)对其催化性能有显著影响。但真实多相催化体系比较复杂,很多表面灵敏表征手段无法直接应用。因此构筑结构明确均一的模型催化剂体
Docker是一种轻量级的虚拟化技术,和传统虚拟化方式相比,Docker容器内的应用进程直接运行于宿主的内核,它的内部没有自己的内核,同时也没有进行硬件的虚拟化。因此Docker容器要比传统虚拟机的虚拟化方式更加轻便。但是无论是Docker容器技术还是它依赖的底层Linux内核技术都尚未成熟,远不如同等的虚拟机技术那么久经考验。至少目前而言,容器尚未提供与虚拟机相同水平的安全保证。针对Docker
火力发电量在总发电量中所占的比例始终维持在70%以上,提高锅炉效率能有效地改善我国的能源消耗现状。锅炉在设计的时候,一般取20℃作为环境温度,但当锅炉实际运行的时候,环境温度大部分时间都是偏离20℃的。基于这一实际情况,本文主要研究环境温度偏离设计值时对锅炉性能的影响。首先本文在分析了中国气温的年变化情况之后,选取-20℃~40℃作为研究范围,且每隔10℃取一个计算工况。在对每个工况下的不同受热面