【摘 要】
:
数据存储技术的飞速发展使得海量数据的存储变得更加简单,数据规模的不断扩大伴随着事物之间的作用关系也愈加复杂,这导致复杂实体间的关系难以再用简单的文本形式加以表示。图结构的出现很好地解决了这一问题,它能更好地对复杂对象之间的关系进行建模,用以系统地分析其特征与属性。针对社交网络、生物网络和蛋白质网络等类似大规模的单个图形网络的相关研究经常出现在最新的学术成果中,在这些图形网络中进行数据挖掘被称为图挖
论文部分内容阅读
数据存储技术的飞速发展使得海量数据的存储变得更加简单,数据规模的不断扩大伴随着事物之间的作用关系也愈加复杂,这导致复杂实体间的关系难以再用简单的文本形式加以表示。图结构的出现很好地解决了这一问题,它能更好地对复杂对象之间的关系进行建模,用以系统地分析其特征与属性。针对社交网络、生物网络和蛋白质网络等类似大规模的单个图形网络的相关研究经常出现在最新的学术成果中,在这些图形网络中进行数据挖掘被称为图挖掘,在该领域中有一个重要的算法是频繁子图挖掘算法,它是许多图相关算法的基础步骤。所以,提高在单个图中的频繁子图挖掘算法的性能一直是该领域一个亟待解决的问题。本文在原有的随机区域选择采样算法进行了改进,一方面结合随机节点选择的思想解决原算法无法准确提供区域数量参数的问题和无法在非连通图中顺利采样的问题,另一方面,本文针对子图同构过程中可能存在冗余节点的问题提出了一种剪枝优化策略,通过删减数量权重过小的节点来进一步减少子图同构的计算次数。算法将该优化策略作为采样的输入参数加入到采样过程中,达到通过设置该参数可以灵活调整采样效果的目的。由于算法在非连通图中采样后的子图之间的连通性往往较低,本文在采样过程结束后引入了增强子图连通性的图归纳技术,使得采样前后的度分布更为相似,提高使用采样图执行频繁子图挖掘算法的准确率。依靠上述思想,本文提出了一种基于随机区域选择采样的大图采样算法RASI(Random Areas Selection Sampling and Graph Induction),并迁移RASI算法到频繁子图挖掘算法GRAMI中,将二者进行结合。在实验部分,本文选取了五个公开的不同类型的图数据集并使用多个评估指标进行实验结果的对比与分析。结果表明,相较于目前现有的可以在非连通图中进行图采样的其它算法,本文提出的RASI算法可以在不同类型的图形网络中生成具有更稳定的度分布属性的采样图且更有效地提高频繁子图挖掘算法的计算性能。同时,相较于原采样算法的采样效果更为充分,发现的子图数量更多。在Tox21-AR-LBD蛋白质数据集中最为显著,在保证准确率的前提下,相较于使用原始图的频繁子图挖掘算法,最多缩短了25分钟的计算时间并保持了与采样前完全一致的子图外观和子图数量。
其他文献
我国轨道交通运营线路里程居世界首位、运营规模位居世界前列、客运量也是全球第一。驾驶员是轨道交通运营的关键作业人员,其精神状态直接影响运营安全,而长期的长时间驾驶工作使得驾驶员的身体状态发生改变,其也伴随着决策能力、运动协调和注意品质等素质能力的下降。一旦出现紧急状况,驾驶员的应激反应决定其是否能沉稳有效地解决问题,因此有必要通过监测驾驶员心生理情况、评估其应激能力状态,在意外发生的时候,及时采取恰
<正>党的十九届五中全会对推动经济体系优化升级、推动绿色低碳发展等作出重要部署,要求全面提高资源利用效率、提升产业链现代化水平、加快数字化发展。目前,以人工智能、大数据、物联网、5G和区块链等为代表的新一代信息技术日臻成熟,并加速向各领域、各行业全面融合渗透,成为推动传统产业转型升级、可持续发展的重要驱动力。2020年,住房和城乡建设部等部门印发了《关于推动智能建造与工业化协同发展的指导意见》《加
模糊C均值(FCM)聚类算法是机器学习中使用最频繁的算法之一。FCM聚类算法是一种无监督学习的方式,并不需要预先知道数据集的先验知识,因此如何确定最佳聚类个数成为决定聚类结果质量的重要条件。而且对于模糊聚类算法来说,模糊划分的引入使其比硬聚类算法更符合现实数据集的结构。因此研究模糊聚类有效性评价方法具有重要的意义。目前,模糊聚类有效性的研究主要体现在模糊聚类有效性函数(FCVI)和组合式模糊聚类有
现代科学的进步对医疗水平的提高起到了巨大的促进作用,也使人们对现代医学技术提出了更高的要求。在医院管理工作中,强化科研成果的转化,是保证医疗卫生体系提供良好服务的重要措施。在管理中应用绩效考核是企事业单位在管理工作中所青睐的管理方式之一,通过实施科学化的管理措施,可以有效推动企事业内部人员的理论创新、实践创新和技术创新。本文将基于三级公立医院的日常管理措施,分析绩效考核工作在科技成果转化中的相关问
牵引电机良好的技术状态是保证地铁车辆安全运营的基本前提,然而频繁的加速、制动以及轨道的不平顺冲击等工况使得牵引电机较为容易出现故障。牵引电机振动数据包含丰富的当前运行状态信息,采集牵引电机振动数据是分析其健康状态的重要前提之一,如何便捷地获取牵引电机振动数据是牵引电机健康状态分析的一个重要的研究方向,所以从现场操作便利和符合地铁车辆实际情况的原则出发,设计并实现一套地铁车辆牵引电机振动无线采集系统
轨道交通的振动和噪声问题是在轨道车辆在行驶过程中,车轮与钢轨产生相对作用从而引起的,该问题是不可避免的,只能采取缓解的方法来解决。目前国内各城市的轨道交通均已采用了大量的减振措施,其中一种措施是在需要减振线路段安装减振扣件,如何选取扣件也成为了一个重要的问题。本文主要研究的对象是快速弹条扣件,快速弹条扣件相比于其他形式的减振扣件,对于快速弹条扣件的结构组成、安装流程、线路试验、使用等问题,国内外对
随着微电子技术、新型传感技术的革新,铁路行业正在越来越多地投入使用具有体积小、寿命长、功耗低等特点地无线传感器。受制于铁路行业地环境特征,采用电池供电的无线传感器维护问题以及安全隐患问题任然没有得到解决。依照目前的形势,通过轨道车辆振动能量的收集,代替传统化学能电池为无线传感器网络节点供电将会是未来铁路运营上的研究热点。振动能量的获取主要有静电式、压电式、电磁式三种,在过去的研究中证实,采用单一能
转向架作为城轨列车的关键部件,不仅用于牵引车辆行驶,还能够减缓和传递来自线路和车体的冲击力与载荷的作用力。滚动轴承作为转向架的关键部件之一,其性能的好坏直接影响转向架乃至车辆的运行状态。转向架滚动轴承从正常到失效往往要经历一个连续的退化过程,在车辆运行过程中如果能对滚动轴承的状态进行监测并对滚动轴承的退化程度进行准确评估,就可以有针对性的制定维修计划,有效防止事故的发生。基于此,本文针对列车转向架
深度学习带来的技术突破使得自然语言处理领域发展迅速,作为自然语言处理的重要方向之一,对话系统成为了学术界和工业界的关注热点。对话系统按照用途可分成三类:可以协助人类完成特定任务的任务型对话系统、可以解答特定知识问题的问答型对话系统、能够在无特定领域下与人们进行交流的闲聊型对话系统。本文主要基于层次循环注意力网络对闲聊型多轮对话系统展开研究,对比分析发现层次循环注意力网络存在回复语句与对话历史相关性
针对传统焊接机器人在复杂焊接工况条件下焊接生产的局限性,对基于BIM的免示教焊接机器人进行研究,采用BIM构造三维虚拟环境,通过数值仿真对机器人焊接路径进行合理规划,并融合激光定位技术对焊接路径进行跟踪和偏差补偿。在雄安新区容西片区配套市政基础设施及给排水设施(一期)项目、上跨南水北调天津干线1~40m钢桁架拱桥建造工程中,对免示教焊接机器人在复杂焊接工况条件下的应用进行研究。结果表明,基于BIM