互联网推荐系统中的协同过滤算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:charleshuangjing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网的许多应用场景中,用户需要面对海量的信息。无论这些信息对于用户而言是熟悉或不了解,人们都希望可以迅速的从中得到有用的个性化的信息。推荐系统是解决这个问题的方法之一,它根据用户的访问或行为历史数据,过滤用户不需要的信息,推荐最符合用户需求的个性化信息。电子商务是推荐系统在互联网最为典型的应用领域之一。推荐系统在电子商务中扮演销售人员的角色,为用户提供建议,帮助用户更好的做出购物选择。推荐算法是推荐系统中的关键技术。它根据用户的特征信息、历史行为信息和物品的特征信息,结合一些额外的策略,预测用户对物品的评分、喜爱程度或个性化地为每个用户推荐物品。其中,协同过滤(collaborative filtering)算法是目前主流的推荐算法。尽管目前协同过滤技术在互联网推荐系统中已经有很多成功的应用例子,但是随着互联网技术的发展,以及页面信息量和用户量的与日俱增,协同过滤推荐算法面临着以下两个问题:1)利用用户和物品的可用信息提高推荐结果的准确率。除了评分和访问信息外,用户和物品还有特征信息,例如用户有人口统计学信息而物品会有形状、属性和访问时间等信息。如何使用这些可用信息产生更准确的推荐。2)用户兴趣随时间推移而变化的问题。随着时间的推移,用户的兴趣是会不断地变化的。如果推荐系统不能及时捕捉用户兴趣的变化,那么其产生的推荐结果就有可能偏离用户需求。针对上述问题,本文在分析研究前人工作的基础上,提出一种基于时间权重的最近邻协同过滤算法。算法在传统最近邻协同过滤算法的基础上,引入时间权重。通常,物品的可用信息包括物品被用户访问的时间,基于访问时间信息构造时间权重函数。直观地,用户兴趣的变化是与时间相关的,因此时间权重能够在某种程度上反映变化情况。提出了基于指数时间权重的最近邻协同过滤算法和基于对数时间权重的最近邻协同过滤算法,以推荐准确率为评价指标,设计了基于二元评分数据集的实验对算法进行评价。结果表明,对数时间权重与基于用户的最近邻协同过滤算法结合效果最好,与传统最近邻协同过滤算法相比准确率有所提高。
其他文献
机器翻译是自然语言处理领域的一个重点和难点问题,拥有着巨大的科学研究价值以及广阔的商业应用前景。近年来,基于实例的机器翻译发展十分迅速,取得了较为突出的成绩。基于
在现代高技术战争中,迷彩伪装是军事武器和军事装备保存自我的重要方法。近年来,随着高空飞行器技术和卫星技术的发展,以及侦察机和侦察卫星在军事领域的广泛运用,对伪装技术的要
随着我国高速动车组的大规模投入使用,动车组成为了铁路客运与货运的重要工具。伴随着运行时间和运行里程的增长,动车组运营已经积累了海量的运营数据和丰富的运维经验。但目
本文对人类视觉感知经验进行数学化表示,并将其应用于三维深度估算当中。首先,用数学语言对人类视觉感知经验进行表示和研究。研究如何从单张二维图像中的点、线、面的二维坐
近些年来,燃气在使用、存贮和运输过程中引发的爆炸事故时有发生,造成了大量的人员伤亡和经济财产损失,因此燃气的安全问题被普遍关注,引起了相关部门的极大重视。但由于燃气
本文针对高速数据采集方法和实现机理展开研究,提出了基于SOPc(可编裎片上系统)酌8路并行采集架构,用低速、低成本的模/数转换器件实现了1GSPS高速数据采集的目标。研究工作主要
学位
随着企业规模的不断扩大以及运行自动化水平的不断提高,它要求有可靠、成熟的高新技术来保证其发展。企业质量管理实施的水平高低直接关系着产品质量的高低,由于在企业生产管
随着计算机技术和网络通信技术的不断发展,在数据交换和数据传输更加方便的背景下,数字信息的安全问题得到了大家的关注,应运而生的数字水印技术也成为解决数字化多媒体信息
近年来,计算机视觉成为越来越热门的研究领域,而图像语义理解更是其中非常活跃的研究方向,从而实现对图像数据的有效管理、组织和再利用。在计算机视觉领域中,对于图像的认知
材料的微观结构影响着材料的性能和性质,从定量上弄清材料的宏观性能和其微观结构之间的关系,一直是计算材料学的一个主要研究目标。对于水泥复合材料来说,其各种性能指标,如