基于稀疏标签语义偏好模型的个性化推荐

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yangdod
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,如何从海量的数据中挖掘到自己感兴趣的内容成为至关重要的问题。为了满足用户的个性化需求,需要进行个性化推荐。传统的个性化推荐是根据用户对物品的历史评分、浏览、点击等数据,分析用户的偏好,给用户推荐感兴趣的物品。然而由于数据的稀疏性,对用户的偏好不能很好的建模。随着web2.0的发展,标签的出现为获得用户的偏好信息提供了一个新的数据源,能够更好的分析用户的偏好信息。  现有的基于标签的推荐是通过对用户的打标签数据进行分析,得到用户对标签的语义偏好,然后将偏好信息融入到推荐算法中。然而,在使用标签的过程中,我们发现原始标签存在着由用户差异(文化,地理等)问题,导致的对于同一个语义的不同表达形式,使得用户标签矩阵特别的稀疏。  为了能够更好的利用标签的语义信息,我们提出了基于稀疏标签的偏好模型,通过用户与标签,物品与标签,标签与标签的关系,使用聚类的方式将相同语义的标签聚在一起形成一个主题。分析用户与主题语义的偏好信息,从而降低标签数据的稀疏性。  我们的最终目的是为了使用标签推荐物品,根据我们提出的主题语义偏好模型,我们提出了基于主题语义向量,基于主题语义的扩展协同过滤,基于主题语义传播的三种推荐算法。最后为了能够充分利用单个算法的优点,我们通过集成学习的思想,将多个推荐模型集成在一起,提高推荐的准确度。  为了验证我们的算法,我们抓取豆瓣图书相关的数据。实验表明,在本文提出的基于稀疏标签的语义偏好模型能够更好的反映用户的偏好信息,在我们的模型上实现的集成推荐算法在结果比其他的算法好。
其他文献
随着数据爆炸式的增长,如何从海量数据筛选出人们感兴趣的信息,成为当今数据库领域的一个重要课题。Skyline计算通过维度间支配关系的定义,提供了满足上述需求的查询方法。在多
伴随着社交网络的飞速发展,社交推荐算法得到越来越多的关注和研究,这些算法都是基于一个共同的假设,即具有社交关系特别是信任关系的用户之间具有相似的兴趣爱好。但是,以往的基
随着汽车电子软件功能设计越来越复杂,使用传统的软件开发方法已经无法满足市场的需求,与此同时软件产品移植到其他硬件平台的成本日益加大。为了解决汽车电子软件的可扩展、可
快速发展的云计算技术使得SOA架构成为了业内的主流架构体系。而在计算机行业的发展历程中,早期开发的很多Web系统直到现在都还在持续维护运作中。但是,由于这些系统使用陈旧的
在逆向工程,形变检测等领域,点云对齐被广泛的应用。随着三维扫描仪和三维打印机的发展和逐渐普及,工业界对点云对齐技术越来越重视,并且提出更高的需求。点云对齐是两片任意位置
随着大数据时代的到来,传统的关系型数据库逐渐不能满足海量非结构化数据管理的性能和价格要求。海量数据中蕴藏着巨大的商业和研究价值,但目前缺乏一套完整的面向海量非结构化
天线方位角下倾角的精确规划是影响无线网络覆盖最重要的因素之一。传统的计算方向角和下倾角的方法基于物理测量方式,存在这测量复杂,测量不方便,测量受限制于测量环境等缺点。
随着数字媒体技术的飞速发展和电子数码设备的普及,图像的产生变得越来越容易,图像数量也日益增多。在大规模图像数据中,如何快速准确地找到需要的图像是值得深入研究的问题。因
现场可编程门阵列(FieldProgrammableGateArrays,FPGA)以其可编程、高并行性、高集成度等优点,被广泛应用于通信、控制等领域。然而,随着FPGA器件日益复杂、系统规模日益庞大,作