【摘 要】
:
关联数据作为数据分析的重要研究对象,广泛存在于生活中的各个领域,它通常被表示为图的形式,节点代表实体,链接代表实体间关联。针对图进行有效地分析和探索可以帮助人们发现隐藏在庞杂信息中的知识,并辅助决策。由于在实际应用中,大型图数据结构十分复杂,用户难以直接高效的分析图结构,需要借助图嵌入等人工智能技术。同样,图嵌入模型也存在可解释性差以及不同模型性能存在差异用户难以比较选择的问题。单独依靠人类智能或
论文部分内容阅读
关联数据作为数据分析的重要研究对象,广泛存在于生活中的各个领域,它通常被表示为图的形式,节点代表实体,链接代表实体间关联。针对图进行有效地分析和探索可以帮助人们发现隐藏在庞杂信息中的知识,并辅助决策。由于在实际应用中,大型图数据结构十分复杂,用户难以直接高效的分析图结构,需要借助图嵌入等人工智能技术。同样,图嵌入模型也存在可解释性差以及不同模型性能存在差异用户难以比较选择的问题。单独依靠人类智能或机器智能都难以完成图分析任务。因此,本研究以国家自然科学基金面上项目和‘十三五’国家重点研发计划课题为背景,将图嵌入与可视分析技术相结合,通过可视分析的方式帮助用户比较图嵌入模型,以选择合适的模型并根据分析需求优化模型,帮助用户高效探索数据中隐含的关联。取得如下成果:提出了一种图嵌入模型组成结构的规范化形式。将图嵌入模型划分为图采样方法、神经网络结构、损失函数三个部分。进一步强化其中的神经网络部分,为只含有编码器的神经网络补充解码器,以使更多的损失函数作用于神经网络,增强模型保留多个图结构特征的能力。使用tensorflow框架,根据规范化结构,将deepwalk、nod2vec、struc2vec和SDNE模型重新构造与实现,方便用户以组合的形式,选择不同的图采样方法、神经网络结构和损失函数构造新的图嵌入模型,以便达到更好的图嵌入效果。提出了一种评价、比较和改进图形嵌入模型的可视化分析方法与系统GEMVis。该方法利用度、偏心度、紧密度等9个节点度量来描述图结构特征,利用交互式方法和颜色映射来帮助用户探索嵌入向量与节点度量之间的关联,利用神经网络回归模型来度量图嵌入模型的保留图结构特征的能力。采用多视图协同的方法支持从嵌入向量、节点度量和原始图结构三个方面对多个嵌入模型定性和定量的比较与分析。支持用户调整模型参数并以组合的形式构造新的图嵌入模型,满足用户对在特定节点度量指标的追求。最后通过三个实例说明本方法的有效性。提出了基于图嵌入的食品安全风险因子可视探索方法。以进出口食品危害物检测数据为研究对象,以食品为节点,根据食品中危害物检出的相似性建立链接,构建关联图。采用图嵌入方法将图转化为一组向量,采用k-means聚类方法将节点聚为若干节点子集。设计了一种新的概览图,采用数据画像技术对各子集中节点的周围结构特征进行画像并展示给用户。用户选择感兴趣的节点集合,可生成其他辅助视图,进一步分析节点的外部属性特征。从图的角度帮助研究人员探索进出口食品危害物检测数据中隐含的风险因子,找出需要关注的食品与危害物。
其他文献
图像作为一种语义丰富的信息载体,在物流管理的实时监控中发挥着越来越重要的作用。一个异常物体通常与特定区域密切相关。对特定区域的异常目标进行检测,有利于提高检测分析的准确性,从而提高物流管理水平。在物流运输领域中,由于快递物品数量很多,快速分拣货物,导致掉件丢件的事情屡见不鲜。而在装卸搬运的过程中,包装底部柔软且凹凸不平等物品在传送带进行传送时产生物品掉落的现象和由于工人工作繁忙,物品遗忘在传送带下
三维数据作为一种新兴的数字媒体,广泛应用于文物修复、医学诊断、数字娱乐、智能制造、智慧城市、3D打印等诸多领域。随着三维扫描设备和技术的发展,三维数据的获取更加的方便和普及。然而在三维数据获取过程中,遮挡、错匹配、抖动等情况不可避免,导致获取的数据缺失和不完整,使得重建出的三维模型存在孔洞,影响后续对模型的分析、编辑等操作,使模型在各领域应用中受限。因此,三维数据修复至关重要。三维数据修复的目标是
随着图像处理需求增多,深度学习的作用显著提高,图像处理深度学习模型在生活、生产、安防等领域的作用显著提升,如YOLO、SSD等目标检测与识别网络,为自动驾驶、行为识别等任务带来了极大的便利。但是,庞大的深度学习网络参数也给计算力提出了要求,大量的参数计算不仅影响了运算结果的实时性,也给要求低功耗的嵌入式端带来了巨大的能量消耗。在深度学习网络、FPGA技术及嵌入式技术的基础上,针对在嵌入式端实现图像
本文针对双流卷积神经网络在处理复杂视频分类时存在的相近种类易发生混淆和识别准确率较低的问题,提出了一种时空关系特征提取结合特征聚合及融合机制的三流深度学习网络框架。将关系流网络引入由空间流网络与时间流网络构成的双流网络中,重点解决双流法在视频特征提取中常常会出现的稳定性差、语义理解不足等问题;同时提出一种基于局部聚合描述符向量的特征聚合方法对时空关系特征进行聚合,可以减小类内差异,对时空关系网络所
在日常生活中,视频监控无处不在,广场、火车站、住宅小区、交通道路等常见场所,分布着大大小小,不计其数的摄像头。视频监控,可实现犯罪预防、交通管制、意外等作用,在维护社会安全中发挥着越来越重要的作用。本文是基于视频内容分析技术针对监控视频中的目标检测和行为识别开展研究,对视频中出现的目标进行检测,跟踪及行为识别。论文的主要工作和成果如下:在目标检测中,由于监控中的行人检测存在背景复杂,目标尺度和姿态
酵母抽提物是具有营养、调味、保健等特性的第四代天然调味料,能显著增强食品的适口性和整体风味,兼具气味特性和滋味特性。对于气味特性,在使用中发现其存在一定的异味,所以本研究着手于酵母抽提物中异味物质的分析,采用气相色谱-嗅闻-质谱联用法进行定性定量。以气-质联用分析中能嗅闻到的异味化合物种类为指标在4种前处理方法:固相微萃取法、动态顶空制样法、溶剂辅助风味蒸发法、搅拌棒吸附萃取法中筛选出当前条件下最
煤矿热动力灾害指由于煤矿致灾因素热动力属性超出控制范围而引发的矿井原发性灾害与继发性灾害。煤矿热动力灾害严重影响着煤矿的安全生产,因此有必要对可能发生的煤矿热动力灾害进行预报。本文结合深度学习的理论和方法对煤矿混合气体组分识别、标志性气体时间序列预测和检测进行研究。主要工作如下:针对多维时间序列数据分类困难的问题,本文提出了基于类图片矩阵和卷积神经网络的混合气体识别方法。该方法在多元气体传感器时间
传统设计和构建三维模型的方法往往依赖于先验知识或引入合适的假设及约束来进行生成,其过程繁琐且方法不具备良好的泛化性。数据驱动的三维模型生成方法将形状知识和几何处理相结合,探索和研究从无到有的建模方式,实现简单便捷的三维模型生成,是目前计算机视觉和计算机图形学领域的研究热点。本文致力于设计有效的三维模型生成算法,通过学习现有数据中所蕴含的视觉外形、结构、功能等信息,自动生成符合语义约束的三维模型。本
白酒是我国传统的发酵蒸馏酒,其发酵组分具有丰富的微生物多样性。本课题采用基于扩增子测序的宏基因组学和培养组学技术对白酒酒糟和窖泥中微生物的群落结构和多样性进行了分析,获得了457株细菌纯培养物和53株丝状真菌纯培养物。扩增子测序结果显示:酒糟样本中的细菌分属于21个门,39个纲,84个目,182个科,384个属中的528个种,乳杆菌属(Lactobacillus)是相对丰度最高的细菌属。窖泥样本中