论文部分内容阅读
近年来随着IT产业的迅猛发展,特别是(移动)互联网及在线社交网络的普及,人类传统的生活社交方式和消费购物模式从线下转移到线上。亿万在线用户的消费行为记录蕴藏着巨大的科学及市场价值。对在线用户消费行为进行研究对引爆互联网经济、为互联网服务提供商制定商业战略、提升用户满意度有着重要意义。因此如何利用数据挖掘技术对在线用户消费行为进行理解成为计算机学科及相关交叉学科的研究热点。然而已有的在线用户消费理解算法面临着数据源稀疏异构、消费决策复杂性及多学科交叉等挑战。为此,本文以不同类型产品为实例,提出利用数据挖掘技术,结合心理学、社会学、营销学等交叉学科知识,设计建模方法,实现对在线用户消费行为的理解。本文工作与贡献可以概括如下:首先,提出基于用户兴趣建模的消费行为理解模型,构建消费产品推荐算法。基于协同过滤的推荐算法的基本假设是用户消费行为受到自身兴趣爱好驱动,因此用户兴趣建模是推荐系统的核心问题。为解决用户兴趣建模中消费数据的高稀疏性及冷启动问题,本文提出二层的协同过滤框架NHPMF。NHPMF根据用户生成的标签信息,将标签邻居关系引入到矩阵分解模型中,实现基于协同过滤的两类主要算法(局部邻居模型和全局矩阵分解模型)的互补优势。实验结果表明该方法可以显著提高推荐系统的精确度。另一方面,针对传统的用户兴趣建模的推荐算法以提高精准度为目标而导致的推荐结果同质性较高、缺乏多样性的问题,本章还从用户满意度出发,提出面向多样性的用户兴趣建模及推荐框架REC。具体而言,REC框架中设计覆盖度指标衡量传统推荐中无法测量的集合整体效用。在该覆盖度标下,实现了高效的算法同时优化推荐过程中的精确度和覆盖度。三个真实数据集上的实验结果表明,REC模型无需任何额外知识,可以在不损失精准度的条件下提高推荐结果的多样性。其次,提出社交网络情境下用户消费行为建模及预测方法。社交媒体下用户消费行为的一个典型特征是信息的传播性导致链接用户之间的行为相关性。本文借鉴交叉学科对用户消费行为的研究,提出社交情境下预测用户消费行为的三大主要因素:用户自身兴趣、社交同质性及社交影响力理论。设计了社交图下的有监督学习模型SHIP,自动衡量这三类因素对用户消费行为的贡献。在实验阶段通过跟踪用户发送的微博信息,收集了大规模网络用户的手机消费数据。实验结果表明提出的SHIP模型在预测用户智能手机使用任务上的优越性。另一方面,针对相关工作利用二元数据(消费或者没有消费)刻画用户消费产品的缺陷,进一步提出了产品使用率的概念追踪用户对产品偏好的时序变化,设计产品使用率决策函数整合不同因素对用户产品使用率的影响。并根据用户自身决策的复杂性,提出了非个性化及个性化权重区分用户之间的差异性。实验表明,与基准算法相比,提出的相关模型在用户产品使用率预测上有着优异表现。最后,提出社交服务平台下的用户-产品的消费行为及用户-用户的社交行为共同演化分析模型。事实上,社会学的社交影响力理论与同质性理论表明用户的消费行为与社交链接行为相互影响,共同导致了社交服务平台随时间的演变。为此,本章设计一种联合建模算法EJP,通过隐向量模型构架用户两类行为间的传递关系,共同建模用户两类时序行为的演化。两个真实社交服务平台下的数据集验证了该算法优于传统的消费行为预测和社交链接预测方法。