加入隐藏关系的属性社区搜索方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:wahahabookbb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着在线社交网络用户数量的飞速增长,大规模的图存在维度高和数据稀疏性等特征,使得从这些图中挖掘有价值的信息成为一个挑战性问题。网络表示学习通过将图中的节点映射到低维空间中,用低维向量之间的相似度表示节点之间的关系,从而使得对大规模图进行数据分析和挖掘成为可能。网络表示学习得到的低维向量可以应用到诸如节点分类、链接预测和网络可视化等下游任务中。另外,实际网络常常又是一种属性网络,因为其中的节点往往都带有丰富的属性特征。因此,研究属性网络的表示学习方法是很有必要的。社区搜索问题只关心查询节点所在的社区,将问题的规模极大地进行了简化,使得大数据下的图搜索成为可能。属性社区搜索是要找到一个查询节点所在的具有特定属性的社区。现有的社区搜索算法只研究了密集子图的社区结构,但是由于图数据本身的不完整性,导致搜索结果与真实社区相差较大。同时,现有的社区搜索算法以查询节点为社区的中心可能产生社区偏移问题。针对上述问题,本文对网络表示学习模型和基于该模型的属性社区搜索问题进行了研究,具体工作主要包括:首先,提出一种属性网络表示模型,能够提取网络的结构和属性特征,并将结构和属性特征非线性地融合,以得到网络的低维表示矩阵。给出属性网络表示学习问题的相关概念及描述,描述了模型的结构、损失函数和数据在模型中各层之间传递的过程,并给出了模型的训练步骤。最后在Blog Catalog3、Facebook、DBLP三个数据集上进行实验,将学习到的表示向量应用到图重构、多标签分类、链接预测三个任务中,与已有的模型进行比较和分析。实验结果验证了本文所提模型在属性图中有更好的表示学习效果。其次,基于上述的网络表示模型,提出一种加入隐藏关系的属性社区搜索方法。在给出属性社区搜索问题的描述基础上,详细描述了属性社区搜索方法的基本思想和形式化描述。该属性社区搜索方法通过加入社区偏移纠正算法和隐藏关系发现算法,对现有的社区评分方法进行了改进,解决了社区偏移问题和图数据不完整问题。在实验部分,进行了四部分对比实验。实验结果验证了本文所提方法的正确性和可行性,通过实验结果的对比分析,本文所提的社区搜索方法比其他社区搜索算法在F1值上有更好的表现,验证了所提方法的可行性和正确性。
其他文献
本文研究了 一类不连续的分数阶Sturm-Liouville边值问题,其边界条件中带有谱参数,且转移条件是分数阶型的.利用算子理论,我们将边界条件和转移条件中的参数相结合,定义了一个新的内积,然后将分数阶边值问题转化为一个新的Hilbert空间中的算子问题,从而得到主问题的特征值和本征函数与该算子的特征值和本征函数的关系.另外文中给出了基本解,且说明了特征函数的解是我们研究的问题的特征值.文章的最
本文使用高阶逼近公式对分数阶导数进行了离散,并结合有限元方法对三类时间分数阶偏微分方程进行数值求解.第二章研究非线性分布阶亚扩散模型的基于时间两网格(TT-M)的1-Galerkin混合元方法.该算法相比1-Galerkin混合元方法能够提升计算效率,节省计算时间.时间方向采用快速的TT-M Crank-Nicolson格式逼近,其中时间分布阶导数采用FBN-结合复化梯形公式离散.空间方向采用1-
近年来,随着科学技术的进步社会信息化特征逐渐明显,对于数据挖掘技术也提出了更高的要求。复杂网络是数据挖掘的重要研究课题,经大量研究表明,复杂网络中存在社团结构,故而社团检测成为该课题中的一个研究热点。人类在社交过程中的信息传播过程,会表现出亲密关系的不同,用邻接矩阵和聚类系数定义亲密矩阵可以量化这种亲密关系,继而引出舒适区的定义。本文在此基础上给出了两种改进的社团划分算法:一种是在模块度优化模型的
在混合有限元方法,H1-Galerkin有限元方法,扩展混合有限元方法的基础上,结合分裂格式,在时空有限元框架内,分别对一维Sobolev方程和二维Sobolev方程进行数值求解.论文所构造方法既具有时空高阶精度,又避免了求解耦合方程组的困难,同时在对一维Sobolev方程求解过程中,结合H1-Galerkin有限元方法还避免了LBB相容性条件.第一章简单叙述了有限元方法的相关历史背景,求解Sob
内蒙古兴和-清水河黄土丘陵区沟壑峭壁和道路两侧的护坡上可见大面积富含钙的黄土母质,因为当地土壤肥力低,地表土流失较为严重,所以草本植物很难形成稳定的群落,但是短叶对齿藓常在该区域形成大面积藓类结皮层,其必然存在着一系列应答高钙环境的适应特征。本研究以该地区喜钙藓类短叶对齿藓为研究对象,以土壤元素含量为参考,优化组织培养体系。同时使用不同浓度Ca2+对该藓进行处理,通过对生理指标、叶绿体超微结构和离
哺乳动物的有性生殖过程包括生殖细胞(精子和卵子)发生、受精、着床和胚胎发育等环节,其中受精是最为重要的步骤。精子与卵子结合并融合形成受精卵是受精的中心环节,这一环节的分子机制尚不清楚。已发现精子膜蛋白IZUMO1与它在卵细胞膜上的受体蛋白JUNO识别是精卵粘附的先决条件之一,但仅仅有IZUMO1-JUNO相互作用还不足以导致细胞膜融合,应该有其他配子蛋白参与了精卵融合。本实验鉴定了Hedgehog
HeLa细胞是增殖快并能无限增殖的宫颈癌细胞,具有可以连续传代不衰老致死的特点。然而,我们发现长期传代培养至100代后,HeLa细胞形态开始发生变化、细胞生长变慢。为了探究长期培养后HeLa细胞“永生”或衰老特征,本文从HeLa细胞35代(我们拿到的最年轻代细胞)开始,连续传代培养至125代,并每隔5代选取1代,共19个不同代HeLa细胞进行RNA-seq分析,相对35代细胞,得到18个不同代He
学位
学位
结构优化是在给定约束条件下,按某种目标求出最好的设计方案。在结构优化方法中拓扑优化比尺寸和形状优化具备卓越的灵活性、多样性,因此拓扑优化方法已经成为结构优化设计领域的主要研究方向。基于反应扩散方程的水平集拓扑优化方法不但能同时实现结构的尺寸和形状优化,而且能通过正则化参数控制拓扑结构的繁琐程度,抑制棋盘格、灰度单元等数值问题。本文以基于反应扩散方程的水平集拓扑优化方法为基础,对动态优化问题、多约束