面向选择偏差消除的无趣项挖掘及其在推荐系统中的应用研究

来源 :南京财经大学 | 被引量 : 0次 | 上传用户:wazyymm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据、云计算和物联网等技术的快速发展,互联网中的数据规模也呈现出爆炸式的增长态势,推荐系统成为大数据背景下研究和应用的热点领域。协同过滤作为最经典的推荐方法,在工业界应用广泛,然而其仍面临显式评分数据中固有的数据稀疏性和用户选择偏差等问题的挑战。用户选择偏差指用户倾向于选择和评价那些可能给他们带来高满意度的项目,而忽略那些可能带来低满意度的项目。换言之,评分数据不是随机缺失的,而是用户自由选择的结果。这导致观察到的评分数据并不是所有评分的代表性样本,其偏向于表达用户的正面偏好,且负样本更容易从观察到的评分数据中缺失。然而大多数协同过滤算法专注于更好的拟合观察到的评分数据以建立用户偏好模型,从而导致模型有偏,在Top N推荐任务中表现不佳。本文主要针对这些问题做出如下工作:(1)提出一种基于无趣项挖掘的通用数据填充方案,从数据层面消除选择偏差。为挖掘缺失项中的无趣项,提出使用前偏好的概念。根据“看见未交互”的项目表现用户负面偏好的经验,结合用户活跃度、项目流行度和时间因素综合衡量用户时点可见性,并提出基于用户时点可见性的加权矩阵分解算法对缺失项的使用前偏好建模。将使用前偏好低的项目作为无趣项并以低值填充。(2)提出了一种基于生成对抗网络的通用数据增强框架,使用去噪自编码器作为生成器以捕捉用户项目交互背后复杂的非线性潜在因素并提高模型面对自然噪声的鲁棒性。使用矢量对抗训练以避免标签矛盾问题并保证平滑地回传梯度,通过掩模操作来模拟评分数据的稀疏性,添加评分向量的重建损失作为正则项以避免生成器生成平凡解。针对选择偏差场景,结合上文的无趣项挖掘方法,提出了一种基于无趣项注入的数据增强模型成功解决这一挑战。实验结果显示,本文方法能够有效缓解数据稀疏性并消除用户选择偏差,显著提高现有基于显式反馈协同过滤算法的Top N推荐性能。
其他文献
W6Mo5Cr4V2(M2)高速钢因其良好的红硬性和耐磨性,常用来制造复杂的切削刀具。但随着加工技术的快速发展,切削加工速度和精度不断提高,对切削刀具提出了更高的要求。在高速钢表面制备性能优异的涂层被认为是改善其性能的最有效最经济的方法之一。为进一步提高M2高速钢表面等离子熔覆制备的Ni Cr Cu涂层的红硬性,在Ni Cr Cu合金粉末中添加了不同含量的Co,选择Co添加量为20 wt.%(Co
学位
观看电影是人们在闲暇时间里的一种主流娱乐方式,当前随着互联网的发展,各种网络电影点播网站是人们观看电影的一种新途径,通过它,人们足不出户就能方便地观看到世界上的绝大部分电影,然而影视行业的蓬勃发展导致各类影视资源的数量不断增多,出现了电影资源的“信息过载”问题,网络电影点播平台如何能有效地帮助用户发现符合其个人偏好的电影是一个需要解决的问题。推荐系统技术很大程度上缓解了电影信息过载的问题,协同过滤
学位
锆钛酸铅[Pb(Zr,Ti)O3]压电陶瓷由于具有互相转换电能和机械能的特性以及优良的压电响应和温度稳定性,已被应用在许多电子设备中(例如,马达、超声波电机、传感器、换能器等)。但是,Pb基压电陶瓷含有超过60%的氧化铅,这可能会损害人类身体健康和污染生态环境。因此,开发无铅压电陶瓷以替代各种电子器件中的铅基元件是实现可持续发展的重要举措之一。本论文主要通过化学改性(稀土离子掺杂)的方法制备了改性
学位
近年来,随着城市建设脚步加快,高层建筑工程项目越来越多,高层建筑施工技术等相关问题引起业界广泛关注。高层建筑工程施工中,桩基础施工技术是最为关键的一环,决定了高层建筑结构的安全与稳定,对提高建筑施工质量起着积极的作用。鉴于此,文章研究了高层建筑工程桩基础施工技术相关问题,分析了施工过程中的常见问题,指出了提高桩基础施工质量的关键点,并对桩基础施工技术应用进行论述,以供参考。
期刊
在线社区问答(Community Question Answering,CQA)网站已经吸引了众多参与者在互联网上分享知识和获取信息,成为广受大众欢迎的交流平台。然而,随着众包系统的快速发展,许多恶意用户利用众包平台组织针对CQA网站的共谋攻击,参与任务的账号通过发布诱导性问题和欺诈性答案,推广他们的目标(产品或服务)。通过这些众包任务,可以完全操纵问答内容,并聚合成多个合谋问答(Q&As)欺诈群
学位
近年来随着深度学习在计算机领域的广泛应用,深度推荐系统逐渐成为相关领域的研究热点。在深度推荐系统中,深度协同过滤利用深度神经网络对用户和项目的历史行为建模,与传统的协同过滤相比对用户和项目潜在关系的学习能力更强,因此推荐效果也更加理想。但这类模型在学习时往往利用全部的历史行为,着重捕获用户和项目的全局信息,对局部信息的捕获能力相对较弱。为解决这类问题,本文对局部信息在深度协同过滤中的融合应用进行研
学位
桩基础施工技术是建筑工程施工建设中的关键技术,其应用效果直接关系到建筑工程的总体质量和结构的稳定性。但由于建筑工程所在区域的地理位置和地质水文条件差异比较大,需要采用与之相适应的桩基础施工技术,并把控好各项应用要点,做好常见问题的处理工作,才能提升基础的稳定性和承载力,为建筑工程施工建设和后期稳定运行营造一个良好的条件,以提升建筑工程使用的安全性。
期刊
针对整车膨胀水箱液位上涨故障,本文从冷却系统结构设计、整车冷却管路布置、膨胀水箱作用原理等多维度进行了全面、系统梳理。结合具体市场故障案例,通过对发动机及整车冷却系统管路布置及其压力、温度等详细排查及测试分析,揭示了膨胀水箱液位上涨的原因和机理,给出了相对系统、全面的故障分析思路和方法,并提出相应的改进措施,为整车冷却系统的匹配优化提供参考。
期刊
自1999年高校扩招以来,我国高等教育规模迅速扩张,实现跨越式发展。劳动力市场上接受过高等教育的求职者越来越多,而劳动力市场却并未向其提供充足的适配岗位。部分高学历求职者为避免失业不得不从事学历要求较低的工作,过度教育问题相应产生。基于对国内外过度教育相关研究的系统梳理,本文就过度教育对个人收入的影响进行估计,并进一步对该影响的异质性和稳健性进行分析。在实证分析部分,研究使用2014年中国家庭追踪
学位
为解决建筑工程施工中存在的承载力过低问题,以某建筑工程项目为例,开展桩基础施工技术的研究。通过施工流程设计与施工准备、超前钻施工与钻孔技术应用施工、机械旋挖成孔灌注桩基础施工,提出一种施工技术。通过实证分析得出,该施工技术在实际应用中能够有效提升建筑承载力,进而使建筑整体质量和安全水平都得到提升。
期刊