多关系异构网络上随机游走技术的研究及应用

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:hejunfeng206
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展和多媒体技术的日新月异,各领域实体之间的联系和交互愈加频繁,形成了庞大的网络体系。在图上进行分析和挖掘可以发现许多隐含的知识和信息,例如发现潜在链接进行推荐、发现社团等。因此,基于图的挖掘技术成为广大学者研究的热点。图信息挖掘方面现有大多数研究都是基于同构网络的。然而,现实中网络对象之间交互复杂,实体类型繁多,例如在微博社交网络中,包含用户、博文等实体,实体之间的交互包括关注、评论、转发等行为,这样的复杂网络需要用异构网络来刻画。图挖掘技术的一个重要研究方向就是基于马尔科夫链的随机游走,通过模拟用户在网络中的跳转最终得到网络中每个节点的访问概率,其结果可用于排序、推荐、知识发现等相关研究领域。由于异构网络中存在多种类型的节点和边,使得基于异构网络的随机游走过程的研究更加困难。研究者通过类比同构网络上的随机游走,设计了高阶马尔科夫过程来解决多关系异构网络随机游走的问题(MultiRank)。然而这些方法并没有区分不同类型的关系对随机游走过程的影响,这显然与实际情况不符,得到的结果也存在一定的偏差。因此,本文针对多关系异构网络上的随机游走过程展开调研和研究,以张量为载体,设计了一系列的算法来解决多关系网络随机游走过程这一问题,主要内容如下:(1)通过分析多关系网络实体之间的跳转,使用关系内转移概率和关系间转移概率分别刻画同种关系内实体之间的跳转以及不同关系间的跳转。SemiRank算法通过预先给定先验信息,建立损失函数来计算关系间转移概率,从而约束随机游走者选择何种关系进行游走。实验结果表明本文提出的方法比MultiRank算法效果更好。(2)TRWRank算法结合随机游走过程和监督学习任务,考虑多关系网络结构以及节点和边的属性,设计一个优化问题来获取关系内转移概率和关系间转移概率,使得随机游走者更加倾向于访问重要的节点,从而指导多关系网络的随机游走。实验证明TRWRank算法可以进一步提高结果。(3)ClusterRank算法结合图聚类以及弱关系理论,将多关系网络中的节点进行聚类并计算每种关系中弱关系的比例,从而可以得到不同类型关系的重要度,最后进行多关系网络的随机游走。这种算法不需要提供先验知识,因此比前两种算法具有更广泛的应用空间。实验证明ClusterRank比MultiRank表现更优。
其他文献
湿空气的焓湿图在工程领域的应用非常广泛,也是制冷空调设计中不可或缺的基本物性图表之一。利用Flash实现的焓湿图表查询程序可以方便、快捷地获得湿空气各状态参数,对于实现
目的对比肺结核治疗前后的CT特征,总结肺结核活动征象的转归及演变规律,评价CT对肺结核活动性及转归征象的判定及监测治疗转归的价值。方法搜集临床治愈的继发性肺结核80例的
目的回顾性分析32例卵巢卵泡膜细胞瘤的临床病理资料,以提高卵巢卵泡膜细胞瘤的术前诊断率。方法分析2008年至2014年在西安交通大学第一附属医院妇产科手术治疗,病理诊断的卵
精准扶贫已成为党的十八大后农村贫困治理工作的重要措施。我国地域辽阔,区域差异性较大,尤其是东西部地区经济社会发展水平差距明显,这些因素对精准扶贫工作提出了更高要求。为
城市生活污水处理在现阶段面临较大难度,不仅仅生活污水数量多,内部成分同样也更为复杂,对于污水处理技术提出了更高的要求。基于此,针对城市生活污水处理技术予以研究和探讨
期刊
作为社会工程学的教育行动研究具有双重目标,其学术目标是揭示问题解决方案的设计、选择、实施和修正的过程和机制,形成关于问题解决的方法和策略的一般理论,其现实目标就是要解
当牛采食块根块茎类食物、较大的饲料团块时,就容易发生食道阻塞。本病属于较急的病症,容易继发急性瘤胃鼓气而危及生命,本文从牛食道阻塞的病因、临床症状、诊断和治疗等方
人们常用自己最熟悉的身体部位构成身体隐喻概念,去认知、体验和感受其他领域的隐喻概念。英语“eye”的本义及其直接投射、容器隐喻、情感及通感隐喻、颜色隐喻这几方面揭示
正确的激励机制必须建立在可观察、可证实的业绩评估基础之上.经营能力是一种隐藏信息,业绩评估中也存在着大量的隐藏信息和隐藏行动,在此条件下,国有产权的某些特殊性往往会
随着微创理念的不断扩展,内镜下甲状腺手术因其颈部不留瘢痕的特点已应用于临床,但由于手术操作空间小、在内镜下只靠2个器械间的配合来完成,使其广泛开展有一定难度。我院2001