社会网络中基于聚类信息和协同推理的链接预测关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:m6300
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在线社会网络以指数级速度飞速发展,已经成为世界各地人们生活的重要组成部分,为人们提供了一个思想交流和贸易经营的平台。目前流行的在线社会网络平台主要有人人网、Facebook、Twitter以及Flickr等。然而,随着互联网和信息技术的迅猛发展,这些社会网络的规模越来越大,包含的信息量越来越多。如何有效地挖掘利用这些网络中包含的大量潜在有用信息,已经成为很多研究领域一个重要和富有挑战性的问题。为解决上述问题,链接预测作为数据挖掘的一项重要任务,开始成为各学科研究者们近年来的研究热点。  现有的链接预测方法主要是基于节点相似度来进行链接预测的。然而,在实际应用中,这些方法存在诸多亟待解决的问题。例如:基于局部信息的链接预测方法虽然有较低的计算复杂度,但是其预测精度较低;基于全局信息的链接预测方法虽然有较高的链接预测精度,但是其计算复杂度较高。并且,这些现有的链接预测方法忽略了网络的聚类信息。研究证明,社会网络中的聚类信息对链接预测具有很重要辅助作用。本文针对现有链接预测方法存在的问题,在基于节点相似度的链接预测方法基础上,对链接预测中基于聚类信息的若干关键技术进行了深入的研究,现将主要工作总结如下:  第一,对链接预测技术产生的背景、国内外研究现状和应用前景进行了较详细的分析和研究。  第二,在上述基础上,对现有链接预测方法进行了细致的研究,分析了现有方法的优点、存在的问题及其根源。  第三,针对现有链接预测方法存在的问题和实际应用的需要,结合大多数社会网络的特点,从网络聚类的角度,提出了一种基于聚类的链接预测方法,使用人造数据集和真实网络数据集,通过实验结果验证了该算法在预测准确度上的有效性。  第四,针对社会网络的稀疏性问题,在上述方法的基础上,提出了基于协同聚类的链接预测方法,较详细分析了该方法的时间和空间复杂度。使用人造数据集和真实网络数据集,通过实验验证了该方法在预测精度上的有效性。  第五,为进一步满足实际应用的需要(较高的链接预测精度和较低的计算复杂度),对基于协同聚类的链接预测方法进行了改进,提出了节点耦合聚类的链接预测方法,该方法通过聚类系数来捕获社会网络的聚类信息,与采用聚类方法来获取网络的聚类信息相比,有较低的计算复杂度。使用人造数据集和真实网络数据集,通过实验验证了该方法在预测精度和效率上的有效性。
其他文献
随着人们对视频服务要求的不断提高,传统单路视频所提供的简单视觉信息,已经不能满足人们对于真实场景立体视觉体验的需求,多视点视频技术应运而生。多视点视频系统可以提供场景
随着信息检索技术的发展,用户的需求也更加多样化,传统的信息检索越来越不能满足用户的需求。搜索技术发展趋向于个性化、智能化、精准化。本文的研究,专家搜索是一个比较新的研
图像超分辨率重建是以一种软件手段增强或融合同一目标或场景的单幅或多幅低分辨率(Low Resolution,LR)图像获得一幅高分辨率(High Resolution,HR)图像的技术,它为后续的特征提
片上多核结构是使用丰富的片上资源的有效方法之一,是未来高性能处理器发展的一个趋势。本文主要进行片上多核结构的研究,具体的研究成果如下:   1.设计了片上多核结构:本文设
网络传输需求的快速增长推动着路由交换技术不断朝着高吞吐、大容量、可扩展的方向发展。近年来交换结构的研究热点集中在缓冲交叉开关与多级互连结构。由于具有分布式交换的
交通视频指的是交通监控系统将监视区域内的现场图像利用监控摄像进行记录并保存下来的图像序列。随着城市文明的不断发展进步,城市规模不断扩张,交通网络体系不断健全,智能交通
过去几十年编译器的优化主要使用的是人工调优的方法。随着计算机体系结构的不断发展,编译器的优化变得更加复杂。编译器人工调优的方法将会耗费编译器开发者大量的时间,而且
自1920年11月世界第一座广播电台在美国诞生以来,无线电广播在全世界得到广泛的应用。随着时代的发展,科技的进步以及媒体技术的日新月异,在初期打下的广大听众基础,现如今在新媒
ARP项目是本院“十五”期间重点建设的科研管理信息化支撑平台,其中ARP所级系统承载了本单位所有人、财、物、科研项目的管理信息及其主要业务流程。   ARP系统上线一年多,
性能模型研究一直伴随着存储系统的发展,为存储系统的配置、设计和改进提供了重要基础。IP-SAN逐渐成为重要的SAN构架,数量庞大的存储设备和丰富多样的工作负载使得智能化和自