【摘 要】
:
大数据时代的来临,由于数据类型的多样性与庞大的数据规模,给大数据存储与数据挖掘带来了挑战。链路预测的作用是利用现有的网络结构知识预测网络中尚未产生的连边和检测异常的连边。链路预测作为数据挖掘的重要工具受到越来越多研究人员的关注与重视。为了解决链路预测问题,各种链路预测算法如雨后春笋般出现。然而这些链路预测算法很少考虑网络的高阶聚类结构,并且传统的链路预测算法的预测精度不太理想。鉴于此,本论文提出了
论文部分内容阅读
大数据时代的来临,由于数据类型的多样性与庞大的数据规模,给大数据存储与数据挖掘带来了挑战。链路预测的作用是利用现有的网络结构知识预测网络中尚未产生的连边和检测异常的连边。链路预测作为数据挖掘的重要工具受到越来越多研究人员的关注与重视。为了解决链路预测问题,各种链路预测算法如雨后春笋般出现。然而这些链路预测算法很少考虑网络的高阶聚类结构,并且传统的链路预测算法的预测精度不太理想。鉴于此,本论文提出了两种基于高阶聚类结构的链路预测算法,均能够一定程度提升链路预测的预测效果。(1)提出了一种基于高阶聚类结构互信息的链路预测方法。该方法将高阶聚类结构使用到链路预测中,其使用互信息来量化共同邻居间的高阶聚类系数的贡献。该算法融合不同阶的聚类系数,来考虑它们对节点间产生连边的影响。此算法在九个真实网络上比其它基准算法都表现出良好的预测结果。(2)提出了一种基于高阶聚类信息贝叶斯的链路预测方法。传统基于共同邻居的链路预测方法不能区分共同邻居的影响,因此我们将高阶聚类信息和贝叶斯理论相结合,联合考虑共同邻居和节点的高阶聚类特性对节点间产生连边的影响。与传统算法比较,该算法在真实网络中表现出优良的预测性能。
其他文献
随着互联网的快速进步与发展,信息过载和信息冗余问题日渐突出。无数研究者寻求解决方法,推荐系统成为解决此类问题最有效的途径之一。推荐系统中最经典的算法就是协同过滤算法,但它面临的挑战是如何学习到更有效的用户和项目向量表示来增强算法的预测性能。神经网络的非线性特性可以更好地捕捉用户和物品之间的特征交互,为解决这一问题提供了方法。图神经网络处理非欧几里得数据的能力可以更有效解决问题,所以结合了图神经网络
高原鼠兔目标检测是统计高原鼠兔种群数量和研究其种群动态变化的基础。自然场景图像下的高原鼠兔目标体型小、特征不显著及背景复杂,使其可用检测特征少,而基于深度卷积神经网络的目标检测模型在提取特征时经过多次池化操作,使得高原鼠兔的特征更加难以有效提取,从而对其检测不利;此外,基于深度卷积神经网络的目标检测模型需要大量的样本训练,而高原鼠兔栖息地环境恶劣,且对外界环境变化敏感,采集图像困难,使得高原鼠兔训
目标检测是研究计算机视觉的一个重要基础,也是当代社会中做各种视觉任务的基石。近年来,在深度学习飞速发展的背景之下,目标检测已经达到了前所未有的突破。如今,在辅助驾驶、智能安防、自动控制以及医学智能辅助等领域已普遍应用目标检测。但是,目前的方法处理小目标问题仍然很棘手。真实世界中杂乱多变的使用场合下,小目标伴随着目标光照和遮挡等剧烈变化的情况,通常比较复杂且难以观察。因此,对小目标的检测非常困难。基
“足以严重危害人体健康”是妨害药品管理罪的构成要素,具有三个方面的作用:限缩罪名适用范围、界分刑行关系和判断犯罪类型。妨害药品管理罪的法益保护类型是医药管理秩序,不包括人体健康。分析“足以严重危害人体健康”的内涵,妨害药品管理罪是具体危险犯,不是抽象危险犯,也不是准具体危险犯。判断是否“足以严重危害人体健康”,需要从个案性向规范性转变,具体包括行为人创设了行为风险、导致危害结果发生、行为风险和危害
图谱理论的研究是以邻接矩阵、距离矩阵和路矩阵等图的矩阵为主要研究对象,通过将图转化成相应矩阵,应用矩阵的特征值和特征向量来建立图的拓扑结构和特征值、特征向量等之间的联系。图谱重要的理论意义及广泛的应用价值使得它不仅与数学分支有着密切的联系,而且在复杂网络、化学、统计力学等学科中都有重要的应用,特别是在复杂网络中,以图谱理论为基础的节点中心性算法、社团挖掘算法、链路预测算法等为实际复杂系统的瓶颈问题
随着航空航天事业的发展,航天器在轨运行的振动不可避免。就航天器本体结构而言,太阳能电池板、空间机械臂及航天器基础构架等空间结构具有刚度低、阻尼小的特性,这些因素都致使航天器很容易受到内外干扰而发生振动,以致影响航天设备正常运行。因此对航天设备与装置的实时振动控制,已成为航天工程领域亟待解决的关键技术问题。本文主要对在外力作用下柔性结构的振动及控制进行研究,利用柔性悬臂梁作为控制对象,压电薄膜(Po
随着社交媒体的快速发展,数以亿计的人在网络上分享自己的观点,因此网络平台上产生了大量具有主观情感的数据。通过对这些文本数据进行情感分析,无论是对于国家或者社会都有着重要的意义。目前深度学习方法在微博情感分析任务上取得了很好的成绩,但大多数对于情感分析的研究仍然是基于文本的,忽略了如表情、图片这样的特征。其次,目前的情感分析不能有效的处理序列化文本,虽然胶囊网络在小数据集上的浅层结构下具有优越的分类
随着市场的全球化,传统制造业和新兴制造业间的竞争日益激烈。企业已经由单一的生产车间模式向分散的多车间模式转变,分布式生产制造应运而生。相对于传统的生产制造,分布式生产制造打破了地域的限制,实现了全球资源的优化配置和全球利益的深度融合。因此,分布式制造已然成为制造领域的一类重要问题。车间调度在分布式制造问题中至关重要,高效的调度策略是企业在面临不确定性和动态性的问题下提高自身竞争力的有效手段。许多分
视频内容描述生成需要提取视频的多个模态特征并进行融合,然后生成能表达视频内容的文本,具有较高的研究意义和应用价值,可以应用在无人驾驶、视频内容检索、视频分类等众多应用场景。当前视频内容描述模型大多基于CNN-RNN的编码器解码器架构实现,取得了较好的结果,但仍然存在一些有待解决的问题,包括:(1)现有模型对视频中丰富的模态信息利用不充分;(2)对不同模态之间的交互以及融合研究不够深入;(3)对于视
随着云存储和互联网等技术的飞速发展,更多的用户选择把语音等多媒体数据上传至云端存储,使得云存储中语音数据安全以及个人隐私保护引起了人们的关注。因加密后的语音信号失去了大部分特征,难以对加密后的语音数据进行进一步的识别、检索与认证,而同态加密是实现数据隐私计算的关键技术,为密文语音特征提取提供了很好的技术手段。论文针对语音同态加密方案加密效率低、现有语音检索等系统无法将特征提取外包给云服务器等问题,