论文部分内容阅读
随着互联网的快速发展,以Twitter、Facebook、Instagram、新浪微博、知乎、豆瓣等为代表的社交应用激增,在线社交网络服务愈来愈完善,网络用户也逐渐增多。用户通过多种社交网络频繁地进行信息交流与互动,导致在线社交网络中信息急剧膨胀,用户进行跨社交网络信息检索的行为愈发常见。传统搜索引擎只注重结果的获取速度和链接的流行度,缺少对用户搜索自主性行为的分析;另外,越来越多的用户使用两个以上社交网络,已有的社交搜索工作主要基于单一社交网络进行,少数的跨社交网络信息检索的分析,不仅忽略了不同社交网络之间的信息壁垒,而且也忽略了不同社交网络对用户的影响。针对现有社交搜索研究的不足,本文将从多社交网络出发,利用多模态数据(包括文本、图片等),对用户的兴趣偏好以及平台偏好进行建模,感知用户当前的搜索意图,构建基于意图感知的跨社交网络个性化内容搜索模型,为社交用户提供跨社交网络的个性化内容搜索服务。本文具体工作如下:首先,本文从多社交网络真实数据出发,基于Aboutme社交名片网站,设计有效的规则选取种子用户,并抓取其在Twitter、Instagram等社交媒体上的关注关系以及推送内容。在此基础上,为了解决文本语言的规范性较差问题,需要进一步对抓取的文本内容进行预处理;此外,为了打破Twitter文本以及Instagram图片的信息壁垒、解决多模态数据的分析问题,也需要进一步对抓取的图片内容进行预处理。其次,提出基于意图感知的搜索模型。该模型考虑社交数据由用户自主生成的特性,利用多社交网络主题模型建模用户的主题偏好,感知用户个性化搜索意图,并建立多模态数据之间的联系;同时该模型设计了线上线下搜索排序算法,为用户返回多社交网络信息。在此基础上,对模型中涉及的主题模型变量采样以及更新规则进行推导和展示,并提出多社交网络主题模型参数估计的采样算法。最后,本文在真实的多社交网络数据集上对本文提出的基于意图感知的个性化内容搜索模型进行实验验证,通过实验对比与分析,可以得出:本文提出的基于意图感知的个性化搜索模型能够有效地建模用户的主题偏好,感知用户的搜索意图,并且能够有效地融合各个社交网络数据。另外,本文利用多模态数据补全用户的信息能够打破不同社交网络用户的信息壁垒,为用户提供更具个性化的社交搜索内容。最终,设计并实现基于意图感知的跨社交个性化内容搜索原型系统。