【摘 要】
:
随着大数据时代的到来,信息过载问题越来越受到广泛关注。协同过滤推荐系统被认为是解决信息过载问题的有效途径之一,被广泛应用在电子商务推荐等众多领域。然而,协同过滤推荐系统由于本身所具有的开放性,极易遭受推荐攻击,在这种攻击中,恶意用户出于自身商业竞争等目的,人为地向系统注入大量虚假用户概貌,以达到改变推荐结果的目的。为了检测推荐攻击,研究人员提出了无监督、有监督及半监督三类检测方法,其中,半监督检测
论文部分内容阅读
随着大数据时代的到来,信息过载问题越来越受到广泛关注。协同过滤推荐系统被认为是解决信息过载问题的有效途径之一,被广泛应用在电子商务推荐等众多领域。然而,协同过滤推荐系统由于本身所具有的开放性,极易遭受推荐攻击,在这种攻击中,恶意用户出于自身商业竞争等目的,人为地向系统注入大量虚假用户概貌,以达到改变推荐结果的目的。为了检测推荐攻击,研究人员提出了无监督、有监督及半监督三类检测方法,其中,半监督检测方法的优势在于可以利用推荐系统中存在的大量无标记用户概貌提升检测性能。本文在综合分析国内外研究现状的基础上,对推荐攻击半监督类检测方法进行了一定的研究和探讨,以进一步提升半监督检测方法的检测性能。首先,针对已有半监督检测方法准确率较低的问题,本文提出了一种基于半监督Fisher判别分析的推荐攻击检测方法RAD-SFDA来提升半监督检测方法的准确率。该方法首先利用Fisher判别分析技术结合有标签用户概貌确定投影向量;然后,利用主元分析技术从有标签和无标签用户概貌建立的数据集中提取全局结构;最后,综合上述由有标签用户概貌确定的判别结构和由所有用户概貌确定的全局结构确定最佳投影向量,在最终的投影空间中训练贝叶斯分类器,利用训练好的贝叶斯分类器对测试集中的数据进行检测。其次,虽然上述提出的方法RAD-SFDA一定程度上提升了半监督检测方法的准确率,但该方法的检测稳定性不高,主要表现在该方法对高填充规模、高攻击规模的推荐攻击的识别能力不高。针对该问题,本文提出了一种基于集成学习SemiBoost的半监督检测方法RAD-SemiBoost,该方法首先根据用户概貌间的相似度对无标签用户概貌赋予伪标签并进行采样操作,然后将采样后带有伪标签的无标签用户概貌和有标签用户概貌共同训练个体分类器,最后,利用集成学习思想,将多次迭代的个体分类器组合成最终的集成分类器,利用最终的分类器对推荐攻击进行检测。最后,在协同过滤推荐领域标准的Movie Lens 10M数据集上,将本文方法与相关工作进行了实验对比,验证了本文所提方法的有效性。
其他文献
再生水的水质安全问题是其回用实践中最为关键的问题。目前针对污水中的化学污染物特别是有机污染物,污水再生处理或回用时更多考虑常规综合性指标(如BOD5、COD、TOC、DOC等)的达标与否。然而,诸多研究发现再生水中还存在种类众多的微量有机污染物,在长期低剂量暴露情况下对生态环境具有潜在威胁,但目前的研究对其在污水再生处理系统中的存在水平和生态风险关注不足。因此,本研究选取青岛市两座污水处理厂为研究
一致性问题是多智能体系统研究的持续热点问题。鉴于事件触发控制在资源利用上的优势,本文针对一阶离散多智能体系统,研究了事件触发控制下的二分一致性问题。主要工作如下:文章首先考虑智能体间通信拓扑结构为无向连通结构平衡图的情形。针对各智能体,设计事件触发控制,包括仅依赖于自身及邻居智能体采样状态的控制输入,以及仅依赖自身状态的事件触发条件,实现了对通信资源的节约利用。基于图论、离散系统稳定性理论,证明系
自改革开放以来,城镇化便是我国社会发展的关键任务。近年来国家经济在稳步提高、社会水平在逐渐发展,带动了城镇化的进程也在向前迈步,这对国家的现代化发展起到了积极作用。城镇化的不断发展,对我国的经济发展有一定的促进作用,这主要是因为人口集聚能够发挥出规模效应,就业转变的激励机制和收入增加的增长机制,使得产业结构产生优化升级。城镇化发展所带来的好处不单单体现在一个国家或者一个区域经济总量的增长方面,还体
随着机动化水平的不断提高,交通安全问题日益严峻。驾驶员的驾驶行为状态对道路交通安全有着决定性影响,驾驶行为在人-车-路-环境系统中的直观呈现形式为车辆的跟驰行为和换道行为,驾驶人风格是影响这两种行为的主观和关键因素;研究驾驶人风格对车辆行驶行为的影响,并探讨车车交互作用机理,建立考虑驾驶风格的车辆交互行为定量化模型,对于车辆安全行驶和车流平稳运行至关重要。本文研究内容分为以下几个方面。首先,设计驾
机器人抓取技术已经成为机器人研究领域的重要方向,虽然众多学者在机器人抓取投入了大量的精力,但抓取点识别不准确、实时性差等问题仍然存在。针对该问题本文设计了基于RP-ResNet网络的抓取检测算法,并考虑实际抓取需要提出了多任务卷积神经网络模型,可以同时执行抓取检测和目标分类两个任务。并搭建了机器人抓取实验平台,对设计的机器人抓取网络的实时性、准确性、可行性进行了实验验证。(1)首先分析了双目相机的
随着无线通信技术和全球定位技术的迅猛发展,基于位置服务得到广泛应用,各种移动应用程序迎来新的机遇,越来越多的用户开始通过这些移动应用程序享受基于位置服务带来的便利。使用这种增值服务时,移动用户需要主动提供自身位置信息与请求查询内容,这一过程难免会造成用户的隐私信息泄露,给用户的人身和财产安全造成极大的威胁。位置服务的进一步发展受到隐私泄露问题的严重制约,位置隐私保护已受到国内外研究学者的广泛关注。
近年来,区块链技术受到了广泛的关注,原因在于其具备去中心化、自治性、防篡改性以及完备可追溯等特点。但是,区块链的应用仍然存在性能约束。为了进一步优化区块链的性能,对现存扩容方案进行了研究。为提升区块链的可拓展性,前人提出了大量区块链扩容方案,这些方案大致可以分为三类:区块链链上(Layer 1层)扩容、区块链链下(Layer 2层)扩容和链上链下协同扩容方案。链上扩容即第一层(Layer 1)扩容
雕刻工艺不断发展,传统雕刻机已经无法完全满足市场需求。激光加工是一种非接触性雕刻技术,因为其超高的工作效率、可靠的安全性、更低的噪音等特点在广告,工艺品加工等行业被广泛的应用。在激光雕刻机的应用过程中,一些弊端也逐渐暴露出来,主要问题是控制系统在控制插补运算数据处理能力弱,因此不能完成对加工拐点处的平滑加工,使得工件加工精度降低,导致加工效率不能进一步提高,控制响应速度较慢。提高控制系统的数据处理
比特币和以太坊的兴起带动了全球区块链的发展,越来越对的人将注意力放在了区块链技术之上。虽然公有链采用全分布式结构,具有优良的去中心化特性,但是在全网范围内广播消息不仅会阻塞网络,还会导致资源的浪费,以至于网络吞吐量以及时延难以满足公有链中供应链金融、商品溯源等商业场景的需求。公有链的工作量证明机制每十分钟产生一个区块,每六个区块才可确认交易,交易时间较长、效率较低,因此,此种工作量证明机制已无法满
当外界侵蚀性介质渗入到混凝土内的钢筋表面时,往往会导致混凝土中的钢筋锈蚀,钢筋锈蚀后体积膨胀,从而引发混凝土保护层脱落、粘结性能劣化、结构表面出现纵向裂缝等现象,最终导致整个结构过早失效破坏,造成大量经济损失。为降低钢筋锈蚀的概率,提高钢筋混凝土结构的耐久性,一种切实有效的方法便是采用涂层钢筋。在现在的工程中,环氧涂层钢筋的应用最为广泛,但环氧涂层同样存在许多不足,如易老化变形、脆性大、固化时易产