基于元路径的对齐异构社交网络中的链路预测

来源 :东南大学 | 被引量 : 2次 | 上传用户:huangwily
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展、智能终端的普及以及多种社交平台的出现,人们会参与到不同种类的社交网络中,这导致只研究一个社交网络向用户进行实体(用户、商品、位置等)推荐的方法已不是最佳。近年来,研究领域出现了对齐异构社交网络(aligned heterogeneous social networks)这一网络模型,该模型能够建立多个社交网络的连接,这使得利用多个社交网络数据进行推荐变得可能。然而对齐异构社交网络的推荐或预测工作仍处于起步阶段,仅限于少量种类的数据集和对应的用户-用户链路预测和用户-位置链路预测。另外现有研究考虑的特征或因素过于简单,对于数据集中多种属性的利用以及特征的处理和筛选并不成熟,预测空间较为局限,不适用于推荐场景,且预测结果不具有时间因果性。因此,本文提出部分对齐异构社交网络中的实体推荐问题,即用户-实体的链路预测问题,主要分为以下研究内容:第一,提出了一个基于元路径特征的对齐异构社交网络的链路预测框架。首先将该问题转化为分类问题,并提出基于元路径的自动化特征提取方法;通过定义边权值的多种计算方法进一步扩展元路径特征个数,生成基于元路径的初始特征集合;然后通过特征提取算法进行特征筛选,并生成最终的预测模型。第二,提出了两阶段逐步向前贪心的特征选择算法。该算法设计时结合了计算复杂度低的过滤模型及性能指标好的封装模型的双重优势,从全体特征中选取特征子集。实验证明,该特征选择方法较现有的特征选择算法在计算时间、预测效果及模型复杂度上表现较好。第三,基于上述链路预测算法过程及关键步骤实现了对齐异构社交网络的实体推荐系统,系统实现了对齐异构社交网络的数据抓取、特征定义及生成、边权值计算、特征计算、特征选择算法以及模型生成,系统还设计了一个可视化界面以向用户展示推荐结果。利用原型系统,本文抓取了Foursquare和Twitter的数据集,并进行了Foursquare中用户-用户链路、用户-位置链路以及Twitter中的关注者-被关注者链路的预测实验。从最终建模的特征种类可以看出,除包含常见的时间、空间和二三度好友因素的元路径特征之外,锚链路、流行度、标签以及权值的多种计算方法产生的元路径特征都起着重要的作用。实验通过Precision Recall、 F1值等指标进行评价,证明本文的模型相对现有工作或者baseline具有较好的推荐效果。
其他文献
近年来,图像压缩技术在数字电视、可视电话、视频会议和远程医疗等诸多领域获得了广泛的应用。随着Internet和移动通信技术的快速发展,对图像信息需求量持续增长,对图像压缩
矿产预测,即矿产资源潜力评价,是地质学、数学、信息技术及计算机技术等领域相结合的产物。它是在研究和认识矿产成矿规律的基础上,应用地地质理论和可能涉及到的地质的、物
无线传感器网络是由大量随机部署在监测区域的微小传感器节点通过无线通信、自组织方式构成的分布式网络系统,用于对人类无法到达的区域或环境进行监测,并将采集的信息传送给远
无线传感器网络作为一种新型的数据采集和处理手段越来越受到人们普遍的重视。作为一种全新的计算模式,无线传感器网络利用众多分布在物理环境中具有感知、计算和通信能力的
语义Web是当前web的扩展,它已经成为当今科学活动中必不可少的部分。其中的语义信息与人们广为接受的本体相关联,更有助于计算机之间以及计算机与人之间的协同工作,它可以用RDF
随着信息技术在海洋相关行业的广泛应用,信息安全在海洋业务的应用中起着更加举足轻重的作用。信息安全问题严重威胁海洋业务系统的安全和正常运行,并影响着海洋信息化的实现
随着非线性动力系统领域研究的深入,各国学者陆续发现新的混沌系统,但对混沌系统族群的演化和形成问题的研究较少。目前,对混沌同步和混沌保密通信系统的研究,集中在有限几个信道
随着科学技术的迅猛发展,各项识别技术被人们广泛关注。人脸作为区分人类特征的重要标志,其关注度近年来显著提高。人脸识别技术具有高稳定性、较强的直观性以及快捷安全的特
随着科技和社会的快速发展,学术领域也趋于信息化。互联网检索成为广大学者获得相关信息的重要途径。因此,如何在电子知识库中快速、准确的寻找到自己所需要的科技论文成为众
人脸识别技术作为生物识别技术的研究内容之一,是模式识别、人工智能及计算机视觉等领域中的一个前沿课题。同利用指纹、手形、视网膜、签名、声音、虹膜等其他特征进行识别