基于用户可信度的抗攻击协同过滤算法的研究与应用

来源 :重庆大学 | 被引量 : 0次 | 上传用户:yysky99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤是目前个性化推荐系统中应用最为普遍和成熟的技术。协同过滤技术通过分析用户的历史行为记录获取用户之间或者项目之间的相互关系,然后通过该关系为各个用户或者项目找到他们的最近邻居,然后使用这些最近邻居为目标用户推荐相关的项目以达到挖掘用户潜在兴趣的目的。但是该技术仍然存在着数据稀疏性、冷启动、可扩展性和系统脆弱性等问题。本文主要针对数据稀缺性问题以及系统脆弱性问题进行深入研究,并据此改进传统协同过滤算法,使其在数据稀疏的情况下具有更高的推荐精度,并且能够对各种常见的攻击有较好的抵抗能力。首先,本文指出通常只有那些在计算相似度的时候需要使用缺失数据的算法才会直接面临数据稀缺性问题。由于皮尔逊相关相似度的计算并不使用缺失数据,所以在计算皮尔逊相关相似度的时候不需要直接面临数据稀缺的问题,而是面临着共同评分项数目不同的问题(即“波动因子”问题)。本文在引出波动因子的问题后,系统分析了相似度在不同波动因子影响下的分布情况,并根据该分布情况提出一种简单有效的方法消除波动因子对相似度计算的影响。接着,使用消除波动因子影响的协同过滤算法(包括user-based以及item-based协同过滤算法)在Movielens的数据集上进行实验,实验表明消除波动因子影响的协同过滤算法在推荐精度上较原始算法有较大的提高。然后,针对协同过滤算法易受到攻击的问题,本文从用户可信任度的角度出发,提出一种简单的基于统计的方法来计算各用户的可信任度,并根据用户可信任度加强协同过滤算法的抗攻击能力。接着,本文将改进的消除波动因子影响的相似度计算算法应用到传统协同过滤算法中,并且结合用户可信任度提出了一种抗攻击的协同过滤算法。为了验证改进后算法的推荐能力以及抗攻击能力,在Movielens数据集上进行实验,实验表明改进后的算法在推荐精度以及抗攻击能力上都比原始算法有较大的改进。最后,将本文的研究内容与“第四方就业信息平台”项目相结合进行相关的应用研究。
其他文献
经过二十多年的改革开放,中国中小企业已经成为拉动中国经济持续快速增长,促进市场繁荣的重要力量,成为安置社会就业,促进社会稳定的经济主体。在现代知识经济时代,信息技术在企业
光集成器件是光网络的核心,也是光通信技术不断发展的支撑。光集成器件在实际封装过程中由于存在集成波导和光纤的模场失配和方向错位,将带来严重的耦合损耗,成为制约二者有效耦
互联网的普及和电子商务系统的快速发展,带来了信息量的爆炸式增长,过量的信息使用户无法快速找到所需商品。推荐系统在这样的背景下应运而生,协同过滤是推荐系统中应用最广泛的
伴随着经济高速增长、改革不断深化、社会深刻转型,从而引发了经济社会发展的一系列深层次结构性矛盾。于是,各种揣测和议论也时有出现:如何看待自己、看待世界?如何看待国家的发
工业部门每年产生大量余热、废热,不仅降低了生产过程中的能源利用效率,也加重了我国的能源负担。针对这一问题,近些年来各工业企业纷纷开展了余热资源回收利用技术的研究与应用
在第一届东亚国家和保护区宣传环境教育会议中指出,生态旅游是环境敏感的旅游和设施的提供,让游客参观了解价值和享受自然和文化等各个领域,与此同时不会对生态环境造成不可接受
协同过滤推荐技术作为应用最广的个性化推荐技术之一,被认为是解决信息爆炸时代信息过载问题的有效方法。但是由于协同过滤推荐系统的开放性和用户参与性,系统存在严重的安全隐
在20世纪90年代,美国出现了一段较长的经济繁荣期,从1991年3月至2000年6月,共持续了9年零4个月,创下了美国历史上时间最长的经济增长记录,而这种增长是一种以高增长、低失业、低通
点击化学(Click Chemistry)是由2001年的诺贝尔奖获得者Sharpless教授提出的,它是一种模块化的合成方法,在生物偶联、药物筛选、材料科学等领域得到了广泛的应用。其中的Cu(I)催化
产品竞争战略管理是构成企业发展战略的职能战略之一,对企业发展战略起到了重要的支持作用。建于2003年的秦皇岛金海食品工业有限公司自成立至今,受国际大豆行情和国内非转基因