面向属性图的协作模式挖掘方法

来源 :西北大学 | 被引量 : 0次 | 上传用户:ninghaitao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“科技社会”口号的提倡,互联网技术得到了极大的关注。这些互联网如社交网络和商业网络,都极大的推动了信息的产生和传递。在信息交流和传递的过程中,产生了大量的中间产物即网络数据集合。对于这些数据集合的理解和研究能够更好帮助我们去完善个体和网络服务。研究者常常采用属性图这种表示方法来描述这种数据集合。在传统的属性图中,研究者常常关注顶点的属性和图的拓扑结构,忽视了属性图的时间信息即属性图的时间戳信息。为此,本文提出了协作模式的挖掘问题。协作模式是指在紧凑的一段时间内,由拓扑结构紧密的顶点集协作完成的项集。这种新的模式不仅能够完善现在属性图模式挖掘方法,而且能够更好的帮助我们理解这些网络数据,完善网络的性能。本文设计了协作模式的挖掘方法。整体方法采用两步来进行挖掘:(1)协作路径信息的发现;(2)挖掘频繁协作模式。具体为,传统的属性图中的”属性”指的是顶点的标签或者特征,但是本文考虑的属性是指顶点的行为。因此需要在传统属性图基础上进行拓展。值得注意的是,在属性图上挖掘的协作模式是由参与同一件协作事件的顶点行为序列所引入的项集构成。这些行为序列记录了在什么时间戳下什么顶点发生什么行为。将这些行为序列所对应的项目序列称为协作的路径信息。通过挖掘这个路径信息,可以发现这件协作事情包含了哪些项集,及出现的概率。因此,本文首先利用信息传递的思想去发现这些协作路径信息,然后采用FP-tree模型对这些协作路径信息中的频繁协作模式进行挖掘。必须指出的是,由于实际生活中存在很多随机事件,不可避免将会导致挖掘的无效性。本文采用了G-test方法对协作模式进行随机性验证,确保所挖掘的模式具有实际的研究价值。最后,为了验证协作模式算法的有效性,在一些公共数据集上进行了一系列结果验证实验。实验结果证明了本文算法的有效性。同时在实验中改变了不同参数的数值以验证不同参数对算法性能影响。
其他文献
任务分配乃社交网络的重要研究问题之一。一般地,任务的完成质量主要由参与人员的技能水平决定。但是,仅考虑技能水平的任务分配,可能引起各自为战,导致完成质量不高。因此,综合考虑技能水平与协作成本的任务分配方法,能为任务的完成质量提供有效保障。由于执行目标的不同,任务分为协作型任务与竞争型任务。协作型任务需要参与人员精诚合作,为实现一个共同的目标而努力,如嫦娥四号的发射;而竞争型任务需要参与各方既斗争又
如今,能源和环境问题越来越受到人们的关注,而我国作为能源消耗大国,所面临的问题更为严峻。同时我国也是一个农业大国,生物质资源丰富,但利用率低下。以秸秆为例,其中大多以
骨关节炎是一种常见的关节退行性疾病,以关节软骨侵蚀、滑膜炎、关节肥大、软骨下骨重建为其主要特征。在骨关节炎发生发展的过程中,细胞外基质的合成与降解失衡导致细胞网状
我国是世界上地震灾害最严重的国家之一,地震的频发给国家带来了惨痛的人员伤亡和巨大的经济损失。历次震害表明,农村地区的受灾程度最为严重,房屋质量参差不齐导致抗震能力
目的:探究茵陈四苓颗粒含药血清对骨髓间充质干细胞迁移能力的影响及机制。方法:通过构建急性肝衰竭大鼠模型,测定外周血清及肝脏组织内SDF-1的含量。通过提取BMSCs,用茵陈四
本次设计选址的曹家里村位于乐平市历居山原始森林公园中,它是历居山怀抱中的一颗明珠。原始居民在此生活500余年,盛产茶油,板栗、香菇、冬笋、蜂蜜、红豆杉果实。这里山明水
研究背景:克罗恩病(CD)和溃疡性结肠炎(UC)是炎症性肠病(IBD)的两种主要的表现形式,IBD是一种以局部和全身炎症为特征的慢性复发性炎症性疾病,可能影响整个胃肠道。血栓栓塞
碳材料因其中碳原子电子排列、键和方式的不同而具有多重结构以及非同一般的性质,因此在诸多领域得到广泛的应用。碳复合材料改善了单一碳材料的纯度低、性能差的缺点而使碳
劳动力日益短缺是当前我国农业生产面临的主要问题之一,水稻直播是一种适宜于轻简化和机械化的栽培技术,具有节省劳力和节本增效的优势。当前,关于直播稻的研究主要集中在机
散落分布的分布式电源需经大量变压器及较长传输线路接入公共电网,导致公共电网的等效阻抗增加,电网越来越表现出弱电网特性。随着电网阻抗的逐步增大,锁相环与电网阻抗耦合