网络表示学习在推荐系统中的应用研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:kandyyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会信息化水平的提高,信息过载的问题日益突出。推荐系统能节省用户时间,提高信息的利用率。它通过考察各用户、物品和信息本身的特征及其历史记录信息,形成对用户偏好和物品特征的判断,进而推荐符合用户偏好的物品或信息给相应的用户。本论文聚焦于推荐系统里的评分预测问题,引入网络表示学习并使用了用户对物品的评分数据、用户间信任网络数据和物品类别数据,构建了解决评分预测问题的框架TrustEmbed及其拓展版本。主要包括以下工作和结论:(1)在TrustEmbed中,将用户间的信任网络数据与用户对物品的评分数据融合成一个自主设计的“物品关系网络”,再利用网络表示学习方法得到每个物品对应的低维向量表示,进而通过计算物品间的相似性来预测用户对物品的未知评分。(2)改进了TrustEmbed中所引用的网络表示学习方法node2vec,在原有的随机游走过程中增加了节点“热度”的影响,使得改进后的算法能够采集到更高阶的全局网络拓扑信息。(3)对数据集结构进行了多角度的分析。评估了各个算法的评分预测误差。讨论了参数的不同取值对算法效果的影响。使用t-SNE算法对TrustEmbed得到的物品向量进行可视化分析,佐证了TrustEmbed能够挖掘出物品的潜在特征,为评分预测任务提供有效的帮助。(4)探究了数据集的稀疏程度对各算法的影响以及在信任数据缺失情况下各算法的效果变化,结果表明TrustEmbed具有更好的鲁棒性。尝试在TrustEmbed上使用其它的网络表示学习方法,并讨论了TrustEmbed的灵活性和合理性。(5)提出了两个TrustEmbed的拓展版本,将物品类别数据也融合进物品关系网络的构建中,体现了TrustEmbed具有较强的可扩展性。
其他文献
随着云计算及互联网技术的飞速发展,日益增长的信息需求与互联网之间的交互产生了海量的数据,传统的使用单台服务器存储数据的文件系统已经不能很好的满足海量数据的存储,因此需求存储大量数据的存储系统应运而生。分布式文件系统基于服务器客户端模式的设计解决了单机存储的局限性,通过多台服务器之间协同存储数据。对于云环境下海量数据的存储,分布式文件系统涉及大量的数据服务器节点和网络设备,这些节点可以分布在各个地方
循环水养殖集约化程度高、养殖效果好,属于节能环保的新型养殖模式,目前循环水养殖水处理的核心是以菌藻为氮磷移除主要手段的生物净化,但应用中往往存在处理效果不稳定和尾水中污染物超标的问题。电化学水处理技术是在外加电场作用下,通过一系列的物理、化学等反应,使污染物分解转化,具有反应速率快,去除效果稳定,特别在海水处理中有明显优势。过往的研究电化学技术主要集中在对水中氨氮的处理,本实验在此基础上,探究了电