论文部分内容阅读
用户活动偏好挖掘是地理信息科学中人类移动行为模式研究的重要课题,对实现用户个性化推荐、城市规划与管理等领域具有显著意义。近年来,随着传感器技术、移动通信技术和互联网技术的快速发展与进步,产生海量用户粒度、具有时空标记的位置大数据,也极大促进位置社会标注的广泛应用。位置附加的社会标注将地理位置扩展为社会位置,"社会性"成为位置继时空四维后的第五维要素,位置活动、位置评价等位置社会语义反映用户行为模式、兴趣爱好等,为用户活动偏好挖掘提供新的研究视角。目前用户偏好研究主要侧重移动时空特征或位置固有属性,忽视用户偏好与位置社会语义的相关性,难以挖掘用户更多维度、更细粒度的活动偏好。如何在这些附加时间、空间和位置评价的大规模用户移动位置中挖掘用户与时间、空间、位置评价等多维情景相关的细粒度活动偏好成为一个新的研究挑战。位置活动和评价的标签是一种比类别更加细粒度的表达形式。位置的多方面标签反映用户不同层面的偏好特征。本文提出一种基于位置社会语义的用户情景感知偏好挖掘方法,综合GIS理论和Labeled LDA主题建模技术,围绕多维度位置社会语义的形式化表达、空间和语义双重约束下的用户活动空间聚类和情景感知偏好挖掘模型构建等问题展开研究,实现在用户移动位置轨迹中挖掘用户与时间、空间、位置评价等多维情景相关的细粒度活动偏好。具体研究内容和创新点如下:(1)多维位置社会语义的本体建模。引入位置评价,扩展位置社会语义维度,定义本文位置社会语义内涵,设计一种新的位置社会语义本体模型,分析位置社会语义的加权关联关系,实现多维位置社会语义概念、语义层级关系及语义加权关联关系的形式化表达。(2)基于位置社会语义本体的空间-语义双重约束聚类。提出用户活动区的概念,表达具有相似社会语义特征的用户活动空间。提出基于位置社会语义本体的空间-语义双重约束聚类算法,实现在地理空间上发现空间距离相近和社会语义相似的用户活动区。(3)用户活动偏好与时空特征、位置评价的相关性统一建模及参数推断。定义一种新的情景感知偏好概念。扩展LabeledLDA主题模型,基于位置社会语义本体的位置活动及用户评价构建LabeledLDA模型的主题分类标签,提出情景感知偏好生成模型,挖掘用户与时间、空间、位置评价相关的情景感知偏好概率分布。并基于CollapsedGibbs提出情景感知偏好生成模型推断算法,估计情景感知偏好的概率分布参数,进而发现用户的情景感知偏好分布。通过在大众点评网真实数据集的实验发现,本文构建的位置社会语义本体能准确得反映社会语义概念间的真实关系。通过与其它参照方法在不同数据集的实验对比,本文的情景感知偏好生成模型具有更高的用户偏好识别准确率,证明本研究方法的有效性。