基于迁移学习的多模态图节点分类方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wjwjwwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入大数据时代,数据挖掘成为数据分析的重要手段。通过数据挖掘,研究者可以获得大数据里的隐含信息并加以研究和应用。但部分特定领域的数据集缺乏完善的数据标注,使得这些领域的发展受到了限制。针对这种需求,迁移学习方法应运而生。迁移学习是一种新的机器学习范式,旨在利用数据、任务、或模型之间的相似性,将在旧领域学习过的模型应用于新领域。此外,随着信息数据爆发式的增长,使用图数据能够更有效地表达实体与实体间的关系。图数据挖掘越来越得到研究者的关注,研究者可以通过网络嵌入表示获得隐含在网络节点和网络结构中的信息。虽然迁移学习在计算机视觉和自然语言处理等领域得到了良好的发展,但是在图挖掘领域上的研究还不是很充分。因此,本文将对在图数据上的迁移学习展开研究。本文研究了基于迁移学习的多源多模态网络节点分类方法,旨在解决目标网络中数据标注稀疏的问题。现有跨网络节点分类算法主要研究对象是同构网络中单源单目标的迁移任务,本文将通过网络差异评估方法,完成多个源域的迁移学习任务。此外,现有的网络嵌入算法主要针对单模态网络,本文将研究如何统一联合表示多模态信息,并提高节点分类任务的准确率。针对同构多模态跨网络节点分类问题,本文提出了一种基于深度网络嵌入的多源多模态同构跨网络节点分类算法(Multi-source Multi-modal Homogeneous Cross-network Node Classification,M~2Ho CNC),该算法首先通过深度多模态网络嵌入模块实现对多模态特征属性的低维嵌入,然后通过动态对抗域判别器完成领域自适应,最后结合节点分类器和网络差异评估完成节点分类任务。在重构的Flickr数据集上的大量实验表明,本文所提出的M~2Ho CNC明显优于其他基线方法。针对异构多模态跨网络节点分类问题,本文提出了一种基于元路径思想的多源多模态异构跨网络节点分类算法(Multi-source Multi-modal Heterogeneous Cross-network Node Classification,M~2He CNC),该算法首先为异构信息网络划分了通道,然后通过共享GCN模块实现网络嵌入,其次结合启发式采样算法,通过通道聚合模块拉近源域和目标域的分布距离,最后结合节点分类器和网络差异评估完成对目标网络的节点分类任务。在重构的Flickr数据集上的大量实验表明,本文所提出的M~2He CNC明显优于其他基线方法,并且在成对数据集上的效果更好。
其他文献
全面深化改革背景下,价格法治的核心目的在于促进价格机制的有效性,实现市场对资源配置的决定性作用。对经营者价格行为的规制,应遵循价格自由优先和特定情境下的公益损害原则。以价格行为规范体系为基础,特定情境可以类型化为非常法律状态、垄断和信息不对称三种情境。公共利益指向由经济安全秩序、公平竞争秩序、公平交易秩序构成的整体价格法秩序,运用比例原则以价格行为规制促进效应和削弱效应的均衡为基准,可实现经营者定
期刊
图像生成技术在人脸合成、AI绘图和风格迁移等方面取得了显著的进展,文字风格保真图像生成技术是图像生成领域的研究热点之一。目前场景文本编辑技术的主流方案是对场景文本图像中的文字进行同风格替换,但现有方法存在以下四个问题:1)缺乏对高维流行空间中图像内容和图像风格的理论分析,导致生成图像的效果一般;2)缺乏对文本风格的细粒度调整的能力,如倾斜角度、颜色、字体类型等;3)由于文本与背景纹理耦合,模型不能
学位
近年来,得益于中国金融服务与产业大数据分析的发展,有效的解决了许多数据问题,金融服务的便利性明显提高,而同样由于近日我国政府陆续出台的《个人信息保护法》、《数据安全法》等有关法律法规,金融机构必须对掌握的大数据进行匿名化后方能与第三方合作分享,这也要求需要相应的信息安全保障技术对数据进行管理。论文围绕如何在数据安全合规的前提下,加快培育数据要素市场这个问题展开研究:即对金融数据进行匿名化处理,最大
学位
报纸
地磁场是地球的重要物理属性之一,内部蕴含着许多重要的地理信息,因此近百年来科学家们对于地磁的研究工作从未停止,尤其是近年在航空磁探领域的应用更是十分广泛。对于采集到的磁探数据来说,常常受到地磁日变数据的影响,因此为了对磁探数据进行补偿需要同步架设日变站采集日变信息。然而当前学者们对于日变数据的研究大都集中在日变的规律和建模上,更多是对日变数据的宏观分析,缺少微观角度的数据分析。在进行日变数据的采集
学位
基于目前视频流量盛行的时代,互联网承载内容的媒介已经从图文转变为了视频。视频流量的激增也带来了新的挑战。视频内容在网络传输中都是通过加密流量形式传输,并且在传输过程中会存在对视频压缩分段的操作,这些加密和分段处理使得网络中的视频流量比图文流量更难检测其内容信息。为了营造清朗绿色的网络环境,需要针对加密视频流量分类方法进行研究,从而增强网络视频内容检测能力,提高网络内容管理水平。本文提出了一种基于B
学位
利用高温热泵回收工业余热具有巨大的节能潜力,为提升高温热泵的供水温度和适用工况范围,在理论循环分析的基础上,研制了R245fa大温跨喷气增焓超高温热泵机组。以193 m~3/h准二级双螺杆压缩式热泵为实验样机,对其动态工况制热性能变化规律及全工况适用性进行实验研究。结果表明:在蒸发进水65℃,冷凝出水120℃下,主阀最佳过热度为7℃,辅阀最佳过热度为6℃,系统能效比为1.96,制热量为110.2
期刊
在自动化设备高速发展的时代,越来越多的机械设备取代了人工操作。其中,伺服电机作为多轴运动控制系统的执行器起到了至关重要的作用。当伺服电机运行环境恶劣或干扰较多时,可能会使其各部件出现不同种类的故障,严重时可能导致整个系统功能瘫痪与损毁,造成不可挽回的损失。所以,对于伺服电机进行实时故障诊断工作的重要性不言而喻。本文基于伺服电机运动控制系统,开发了一套实时在线状态监测平台,同时进行故障诊断方法研究,
学位
学位
网络,即具有图结构的数据,作为一种能够有效表达实体间关系的数据结构,被广泛应用于推荐系统,社交网络分析等领域。但是对图数据进行挖掘和分析需要大量的标注数据,即图节点带有标签。但是在现实生活中得到的图数据往往没有大量的标注信息,只有少量的标注信息甚至完全没有。而图数据往往规模庞大,甚至可能有数十亿个节点,如果进行人工标注将耗费大量的人力、物力和时间。并且可能会导致用户隐私数据泄露的风险。跨网络节点分
学位