异构网络中的社团检测算法研究及应用

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:chenzhipengo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异构信息网络是一种拥有多种类型的结点与链接的复杂网络,这些结点与链接蕴藏着丰富的语义信息,给当前数据挖掘领域带来了更多的研究机会与挑战。近年来,研究者们针对异构信息网络,分别在相似性度量、图聚类、链路预测以及推荐等方向做出了许多成果。本文以异构信息网络为研究对象,主要在社团检测和推荐系统两个方面进行研究。传统的异构信息网络中社团检测的方法主要有基于排序、基于路径与多视角学习三种类型,前两者多根据概率图模型来求解模型,后者则主要利用多视角学习方法来解决异构网络中的问题。而基于异构网络的推荐系统则可以看做是基于多源信息融合后的推荐,主要以融合策略和融合信息来提高推荐性能。与之不同的是,本文以全新的角度(将异构信息网络挖掘转化为同构信息网络挖掘)出发,借助信息在元路径上的有效传播,提出一种分解技术,能够在无信息损失的前提下将原始异构信息网络分解为一系列同构信息网络。同时基于该分解策略,本文分别提出了一种异构信息网络的社团检测算法HomClus与一种融合用户与项目信息的推荐方法CSR。这三者构成了本文的核心内容,本文的主要贡献如下:第一、提出了异构信息网络的基于元路径的分解策略。该策略主要利用元路径反映实体间的不同关系的本质,针对目标类型实体,通过简单的矩阵操作得到不同路径下目标类型实体的关系权重矩阵——也就是同构信息网络。且该过程对目标类型而言没有信息损失。因此,对异构网络的相关研究问题都可以简化为在目标类型的同构网络上的研究问题,从而更容易被解决。第二、提出了基于异构信息网络的分解策略的社团检测算法HomClus。该方法在第一个贡献成果的条件下,首先将异构信息网络转化为一系列同构信息网络,并整合为统一的网络结构。其次,使用非负矩阵分解快捷地将节点转化为向量,即将整个网络投影到低维子空间中。最后,采用高效的聚类方法如基于同步的聚类方法对低维子空间中的“节点”进行聚类,从而检测出原始网络中潜在的社团结构。实验表明,HomClus算法与领域内的前沿算法相比有很大的优势,如算法直观简洁,参数不敏感,同时也验证了异构信息网络分解策略的有效性与实用性。第三、提出了基于异构信息网络的分解策略的推荐算法CSR。该方法针对推荐系统中典型的实体对象——用户与项目,利用异构信息网络的分解策略,将用户的异构信息、项目的异构信息同时转化为同构信息。并受当前较为流行的基于渐近因子模型的推荐方法与相似性正则化的启发,将用户信息、项目信息以及评分信息三者以集体相似性正则化一致逼近的形式有效地融合在一起,最后产生高质量的推荐结果。
其他文献
在社会交往中,依恋是解释个体知觉和调节情绪的差异的一个重要因素。前人研究主要集中探讨不同依恋个体的情绪调节方式偏好,极少有研究探讨其情绪调节的时程动态差异。本研究
随着科技的发展,不少学者已经提出了许多方法来应对越来越具有挑战性的多输出回归任务。在高维数据的回归任务中,多输出回归算法利用数据的多个特征值来预测多个输出值,能获
一、国民经济宏观调控的主要手段由于市场失衡或者市场失灵的存在,不论哪一个国家都必须采取一定的措施,对国民经济的运行进行一定程度的干预和影响,以期保持经济总量的基本
会议
现代社会的高速发展离不开高效率的交通设施,选择公路隧道能有效缩短时空距离,随着国家西部大开发与“一带一路”的战略实施,隧道建设事业开展地如火如茶。由于隧道大量穿越
化石燃料燃烧造成的气候变化正在引起人们越来越广泛的关注,同时污水也被越来越多的看做可再生的能源。基于这一点,很多厌氧工艺被用于处理市政污水,因为好氧工艺需要消耗能
本文在国内外社区理论、模式和实践进行梳理的基础上,阐述了环境治理与社区合作的理论背景,重点对中国社区研究特别是牧区社区研究现状以及牧区社区研究的发展趋势进行了剖析
一、本学科在地质学研究中的地位和作用洞穴是在特殊的自然条件下经历数十万、数百万年漫长地质时期逐渐发育、演化而成的。我国的洞穴数以十万计,是一种重要的、不可再生、
会议
本文研究椭圆问题有限元离散的梯度重构技术及其超收敛性质。由于基于保多项式梯度重构技术(PPR)的后验误差估计在自适应有限元方法中的应用,其超收敛性质受到了人们的青睐与
一、前言现代法治国家的最主要特征是将保障人民的自由权及财产权,当作国家存在及政治运作的主要目的。尤其作为生活之资的财产基本权利,在现今的工业社会及追求物质生活的社
会议
Kazhdan-Lusztig多项式是Kazhdan-Lusztig理论中一个非常核心的研究对象,当我们考虑Weyl群或者仿射Weyl群时,它们的Kazhdan-Lusztig多项式的系数在表示理论及李理论中有非常