基于模糊理论的属性图聚类方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:maozi100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
属性图是由带属性的节点及连接两节点的边所构成的网络,能够广泛地用来表示不同实际应用场景下的诸多复杂系统。作为属性图分析的主要手段,聚类分析的目的是将相似节点划分到同一簇,对更好地理解不同应用中的网络内在组织结构具有重要意义。由于属性图中包含大量的节点属性信息,而传统的图聚类算法很少能够充分地利用属性图中的拓扑信息和属性信息进行聚类以获得具有实际意义的簇。而且,它们大多数无法基于节点和簇之间的隶属度关系来识别可重叠簇,因此在包括生物网络等诸多实际应用中的聚类性能欠佳。另外,现有的图聚类算法难以满足大规模属性图对聚类效率的要求。本文主要针对这两个问题进行了研究,具体研究内容如下:(1)针对现有算法在包括生物网络等诸多实际应用中聚类性能欠佳的问题,本文在前期研究工作的基础上,从拓扑信息和属性信息两个角度量化属性图中节点之间的相似性,并构建了能够广泛适用于各种复杂系统属性图的模糊聚类模型。其中,为了能够从蛋白质相互作用网络中识别蛋白质复合物,我们将该网络利用属性图建模,并在此基础上提出了一种适用于解决蛋白质复合物识别问题的聚类算法,即FCAN-PCI。具体而言,FCAN-PCI从以下几个方面改善了蛋白质复合物识别的准确性:FCAN-PCI从属性信息的角度量化蛋白质之间的相关性时,同时也考虑了蛋白质属性信息的内在语义结构;FCAN-PCI将蛋白质属性信息与网络拓扑一起集成到成熟的模糊聚类模型中,将聚类问题转换为一个对于蛋白质隶属度的最优化问题;FCAN-PCI采用了一种启发式搜索策略,根据蛋白质隶属度分布情况,识别可重叠的蛋白质复合物。通过在多个蛋白质相互作用网络中的一系列实验,证明了FCAN-PCI具有良好的性能,能够准确地识别蛋白质复合物。(2)针对现有的图聚类算法难以满足大规模属性图对聚类效率要求的问题,我们将广义动量法整合到前期提出的模糊聚类模型的求解过程中,从而提出了一个快速的复杂网络模糊聚类算法,即F ~2CAN,以在保证模型聚类准确度的前提下改善其收敛性能,提高运算效率。与前期的模型相比,F ~2CAN从以下两个角度克服了其在大规模复杂网络中聚类效率的缺陷:在模型求解过程中,引入了动量的加速效果,将广义动量法与不动点迭代法相结合,构建隶属度矩阵的快速更新方案,并从理论上证明了其收敛性;提出了算法的并行化解决方案,使得算法可以在并行计算环境中进一步提高聚类效率。通过在多个复杂网络数据集上的实验,表明F ~2CAN在效率和准确性等方面都具有明显的优势。因此,F ~2CAN更有利于对大规模复杂网络进行准确、快速的聚类分析。
其他文献
随着白天和晚上监视数据爆炸性的增长,跨模态行人重识别成为新兴的挑战。与只处理模态之内差异的传统的行人重识别相比,跨模态行人重识别遭受了由不同类型成像系统造成的额外的跨模态差异。因此提出红外图片着色的方法来消除模态差距。但是生成对抗网络的着色方法依然存在一些问题,本文就这些问题进行一些研究。最近的各种研究工作提出了各种生成对抗网络模型,以将可见模态转换为另一个统一模态,旨在弥合跨模态鸿沟。但是,它们
学位
随着大数据、人工智能等技术的发展,数字经济时代已经到来,传统企业的数字变革也是大势所趋。索菲亚是家居定制行业中最早进行数字化转型的企业,最终实现了智能制造以及流程信息全打通的愿景。文章以索菲亚为例,对其数字化转型的动因、路径以及企业的盈利、营运、偿债、成长能力和EVA指标进行分析,以期为其他企业进行数字化转型提供参考。
期刊
叶脉是支撑叶片生长、运输叶片所需养分与光合作用产物的重要结构。叶脉根据所处位置、生长趋势和宽度等因素可以将其分级,例如一级叶脉定义为从叶柄向叶尖延伸的最粗叶脉,叶脉层级相较于叶脉网络更能表征叶脉的特性。叶脉的层级分割对图像分类、叶片建模和分子育种等领域具有重大意义。然而,当前对叶脉的研究大多停留在叶脉网络,由于层级叶脉复杂难以定位,更能发掘叶脉的特性的叶脉层级却少有涉及。一方面各级叶脉在色彩、亮度
学位
生成一直是自动摘要领域的难题,现有的文本自动摘要方法在处理长文本的过程中,存在准确率低、冗余等情况。无法达到令用户满意的性能效果。主要问题有两点:其一,目前以卷积神经网络(CNN)/循环神经网络(RNN)为编码器的抽取式文本摘要模型,在进行长文本抽取时,模型对文本内容的理解不够,抽取效果极不稳定,无法抽取到长文本的主旨句。其二,目前单纯的抽取式摘要模型存在性能瓶颈,由于抽取式文本摘要的粒度过大,进
学位
近年来,生物医学领域研究取得飞速进展,大量携带研究成果的文献被发表。尽管有人力物力去手动整理这些文献中的信息,但仅仅依靠人力对信息进行更新远远跟不上文献发表的速度。与通用领域相比,生物医学文献的信息抽取存在大量的嵌套实体和重叠关系等问题。因此,如何准确的从大量生物医学文献中抽取出有价值的知识,是目前生物医学领域信息抽取的重大挑战。为此,本文研究了生物医学领域的实体识别和关系抽取。对于实体识别,本文
学位
近年来,得益于高性能计算机或分布式系统的超强计算能力,深度学习方法在计算机视觉相关问题上,尤其是对图像分类任务的研究,取得了长足的发展。然而,在实际计算操作或者现实生活中,出于安全或者隐私等方面考虑,常常面临难以获取样本或者图像样本量过少的问题,这在研究领域内被定义为小样本学习问题。而当涉及到小样本问题时,高性能的计算能力或是传统深度学习模型似乎显得力不从心。针对目前计算机视觉中的热门问题,本文对
学位
近年来,汽车产业在移动互联、大数据及云计算等技术的推动下不断向着智能化、网联化方向发展,车联网在支持城市交通系统中安全相关应用方面具有广阔前景。在车联网中,高效的信息传播可以让车辆更好地了解潜在的风险和交通异常,对于提高交通安全性和效率具有重大意义,因此目前有大量的研究集中在车辆间安全消息广播方法的设计上。然而,现有的安全消息广播方法往往基于当前的信道状态或网络拓扑结构进行消息传输,只考虑最小化安
学位
随着深度学习技术和计算机硬件的不断发展,基于深度卷积神经网络的目标检测技术相较于传统机器学习方法在准确性和实时性方面都取得了突破性的提升。尽管如此,大多数目标检测模型仍然依赖于高性能的硬件环境,这限制了目标检测技术在更多实时场景下的应用。近两年提出的基于关键点的目标检测方法即anchor-free方法如Corner Net、Center Net等避免了基于锚框的目标检测方法中大量与锚框相关的Io
学位
交通流速度预测是通过特定方法分析出历史交通流中具有概括性的交通模式,从而自动生成未来交通流速度的过程。准确的交通流速度预测能为管理部门提供合理的决策依据,为驾驶员提供实时的道路状况预警,是交通领域至关重要的问题。交通流数据属于典型的时空数据,因此基于时空特性的预测成为了当前的研究热点。在实际场景中,交通流数据在固定路网的约束和交通事故等外部因素的影响下,具有整体稳定、动态波动的时空特性,给交通流速
学位
随着互联网及科学技术的快速发展,越来越多的人使用多模态数据在社交平台或电子商务网站上表达他们的态度或观点。从这些大规模的数据里提取出其中蕴含的情感,可以帮助人们更好地理解用户对某个事件或主题的态度。因此,如何检测多模态数据中包含的情感成为一大研究热点。然而,多模态情感分析至今仍有诸多难点。如在文本图像情感分类任务中存在以下难点:第一,文本图像模态特征异构。文本特征与图像特征在特征空间中是异构状态,
学位