基于意图感知的跨社交网络个性化内容搜索

来源 :东南大学 | 被引量 : 0次 | 上传用户:guojunaaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,以Twitter、Facebook、Instagram、新浪微博、知乎、豆瓣等为代表的社交应用激增,在线社交网络服务愈来愈完善,网络用户也逐渐增多。用户通过多种社交网络频繁地进行信息交流与互动,导致在线社交网络中信息急剧膨胀,用户进行跨社交网络信息检索的行为愈发常见。传统搜索引擎只注重结果的获取速度和链接的流行度,缺少对用户搜索自主性行为的分析;另外,越来越多的用户使用两个以上社交网络,已有的社交搜索工作主要基于单一社交网络进行,少数的跨社交网络信息检索的分析,不仅忽略了不同社交网络之间的信息壁垒,而且也忽略了不同社交网络对用户的影响。针对现有社交搜索研究的不足,本文将从多社交网络出发,利用多模态数据(包括文本、图片等),对用户的兴趣偏好以及平台偏好进行建模,感知用户当前的搜索意图,构建基于意图感知的跨社交网络个性化内容搜索模型,为社交用户提供跨社交网络的个性化内容搜索服务。本文具体工作如下:首先,本文从多社交网络真实数据出发,基于Aboutme社交名片网站,设计有效的规则选取种子用户,并抓取其在Twitter、Instagram等社交媒体上的关注关系以及推送内容。在此基础上,为了解决文本语言的规范性较差问题,需要进一步对抓取的文本内容进行预处理;此外,为了打破Twitter文本以及Instagram图片的信息壁垒、解决多模态数据的分析问题,也需要进一步对抓取的图片内容进行预处理。其次,提出基于意图感知的搜索模型。该模型考虑社交数据由用户自主生成的特性,利用多社交网络主题模型建模用户的主题偏好,感知用户个性化搜索意图,并建立多模态数据之间的联系;同时该模型设计了线上线下搜索排序算法,为用户返回多社交网络信息。在此基础上,对模型中涉及的主题模型变量采样以及更新规则进行推导和展示,并提出多社交网络主题模型参数估计的采样算法。最后,本文在真实的多社交网络数据集上对本文提出的基于意图感知的个性化内容搜索模型进行实验验证,通过实验对比与分析,可以得出:本文提出的基于意图感知的个性化搜索模型能够有效地建模用户的主题偏好,感知用户的搜索意图,并且能够有效地融合各个社交网络数据。另外,本文利用多模态数据补全用户的信息能够打破不同社交网络用户的信息壁垒,为用户提供更具个性化的社交搜索内容。最终,设计并实现基于意图感知的跨社交个性化内容搜索原型系统。
其他文献
目的:检测血小板减低时血液病患者的血浆凝血因子FⅩⅢ水平,探讨血液病患者血小板减低时血浆FⅩⅢ浓度水平以及与出血事件的关系。方法:选取自2017年08月至2018年03月在兰大一院住院治疗的血小板计数<50×109/L且凝血功能检查无明显异常的血液病患者共136例,血小板计数正常的非血液病患者凝血功能检查正常的血浆样本35例作为正常对照。用ELISA方法分别检测血浆FⅩⅢ的浓度,依据FⅩⅢ浓
戏剧选文是高中语文教材中的一个重要组成部分,戏剧教学也本应是高中阶段语文教学的重要一环,但由于戏剧本身文体的限制,戏剧选文在高中语文教材选文中所占比例较小,也由于高考趋势等因素的影响,戏剧教学在实际的高中语文教学中并不尽如人意。毫无疑问,戏剧作品中蕴含的价值体系是其他文体形式替代不了的,然而高中语文戏剧教学存在应然教学和实然教学差距大的矛盾,戏剧在实际的课堂教学中发挥不出其真正的魅力。民国时期是历
“消费社会”是波德里亚是作为一个理论概念而非一个事实描述提出来的,其特点是以“物符”为标志,这与他后来提出的“拟像”和“超现实”具有一脉相承的关系。本文从这一概念出
随着自由贸易和科技进步的不断发展,知识产权日益成为一项重要的权利。知识产权与国内政策、法律相互影响,并通过国际合作或者经济强权不断外化。知识产权保护和多边贸易体制
从水资源开发利用中的生态环境问题出发,对河流系统生态环境需水量的内涵进行了探讨,讨论了南方河流系统与北方河流系统的生态环境需水内涵的异同,并以广西右江为例,对河流生
社区发现是社交网络相关研究的重要组成部分,社区反映了社交网络中用户间的关联关系,具有巨大的数据挖掘价值。同时,随着用户需求的日益多样化,不同类型的社交网络得到蓬勃发
根据2017版《小学科学课程标准》(以下简称“新课标”)的要求,自2017年9月起,小学1-2年级增设科学课,并将其作为基础性课程。随着1-2年级《科学》教科书发行使用,为使教科书