基于行为序列的用户兴趣挖掘研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:magihao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的迅速发展,电子商务逐渐成为人们日常生活中不可或缺的一部分。近年来,淘宝、京东等电子商务平台越来越受到用户的青睐。在购物网站上,只需要通过浏览、收藏、加购物车和购买等简单的几步操作,用户就能挑选出感兴趣的商品。电商平台在用户购物的过程中记录了用户与商品的交互行为,这些行为记录虽然包含丰富的用户兴趣信息,但是并不能直观地表达用户对商品的偏好程度,存在用户兴趣信息提取困难的问题,从而导致数据的价值没有得到充分的利用。针对这个问题,本文围绕挖掘行为记录中包含的隐式兴趣信息这一目标,针对具体应用场景中的数据特性,从行为和序列两个方面充分分析,深入挖掘兴趣信息,构建有效的兴趣模型。本文依据行为记录的时间属性提取行为序列,根据交互商品序列的上下文关联性对商品进行向量表示,提取行为特征和序列特征预测用户兴趣商品,根据预测结果构建用户兴趣模型,具体研究内容如下:(1)商品向量化表示,根据交互商品序列的上下文关联性特点,使用item2vec算法学习得到商品的隐向量表示,使得向量空间能够表达更加丰富的商品关联性信息,通过聚类形成商品簇,每个商品簇作为一个粗粒度兴趣,在粗粒度上构建兴趣模型。(2)兴趣商品预测,分析历史行为记录与用户兴趣商品之间的关系,根据经验提取行为特征,使用RNN(Recurrent Neural Network)提取序列特征,建立预测模型,得到每个用户的兴趣商品集合和用户对商品的兴趣度,通过模型优化提升预测效果。(3)构建兴趣模型,根据商品向量空间、粗粒度兴趣点、兴趣商品集合刻画用户兴趣,提出用户兴趣计算方法,对用户偏好做形式化描述,提供个性化推荐的依据。(4)实验验证与分析,在真实数据集上验证本文各部分算法的有效性,通过对比实验调整模型到最优状态,并分析模型的优缺点。
其他文献
本文利用马尔可夫情势转变向量自回归模型,考察了20世纪90年代以来,我国宏观经济运行与财政政策的情势转变特征、财政政策对宏观经济稳定的影响以及财政政策的非线性效应。分
2016年9月24-25日,中国教育学会教育史分会第十七届学术年会在太原举行。来自全国22个省份的420余位代表参加。与会者围绕“教育政策与管理史”主题展开了深入对话和广泛探讨
进行水利行业经营管理需要有一个科学合理的管理机制做支撑,从而有效保证可以达到水利行业经营管理模式创新发展的新的标准要求,以此来实现水利行业经营管理模式的创新,同时
由于企业在经营中面临着不断变化的内部和外部矛盾以及复杂的内外公众,危机事件的发生是不可避免的。危机并不可怕,只要处理得当就可以化险为夷或把危机转变为机遇。关键在于
ADS-B作为一种先进的空中交通监视手段,在保障飞行安全、增加飞行流量、提高空域和航线资源的利用率和减轻管制人员工作压力等方面都发挥了巨大作用,该项技术现已成功地应用
教科书插图二次开发的运作系统由制约因素及其基本关系共同构成。制约因素包括主体因素、对象因素和条件因素,各个因素又包涵若干相应的子因素。基本关系包括图文关系和师生
通过对以色列奶牛场、奶业相关企业和政府部门进行专项考察,着重在奶业宏观调控、奶牛繁育体系、精细牛舍设计、专业化管理系统、日粮营养结构与饲喂管理5个方面对以色列奶业
胫骨平台骨折是常见的骨折,随着对胫骨平台的认识逐步深入,从基于X线的Schatzker分型发展到基于CT的"三柱理论",目前将后柱又分为后内柱和后外侧柱。后外侧柱因有腓骨小头遮挡,
目的对结直肠癌术后患者实施早期康复护理的效果进行分析。方法自我院随机选取52例结直肠癌术后患者,选自2017年8月至2018年7月,根据抽签法随机分组,行常规术后护理+早期康复