面向大规模二分图的团枚举算法研究

来源 :深圳大学 | 被引量 : 1次 | 上传用户:tgw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一门实用的学科,它根据具体问题应用具体方案,在繁杂的数据中找到规律,给问题的研究人员提供决策辅助。图论是一门研究客观世界中事物间联系的学科。两者相结合,就是希望通过图模型找到具体解决方案,挖掘出客观世界中数据的客观规律。当今社会,越来越多的数据可以抽象成网络结构,从而在图论领域的数据挖掘问题也越来越多,其中就不乏在二分图领域的数据挖掘问题,前人也在这一问题上获得了许多研究成果。本文研究的主要关注点在于,二分图上的子图结构二分团,以及极大二分团的枚举。极大二分团枚举在现实社会中具有重要意义,可以被应用于多个领域,例如,购买趋势预测,社交网络的统计分析,探讨蛋白质相互作用网络的一些有趣结构,电子商务网站的刷单应用等。为了令研究内容更具有实际意义,笔者首先分析实际二分图数据的特点,发现普遍具有规模大,数据稀疏等特点。而在前人的一些研究成果中,并没有重视这些特点,存在优化空间。在前人对解决极大二分团枚举问题的研究成果中,最好的方法是基于MapReduce框架设计的一个并行解决方案mrMBEA,它具有不错的扩展性和加速比。但同时,这一解决方案存在一定的缺陷,例如没有利用稀疏二分图的结构特点,对任务量估计存在偏差等等。本文为了设计一个效果更好的并行解决方案,首先从串行算法入手,通过设计一个高效的串行算法,然后将它并行化,从而达到目的。经过查阅资料发现,有一个种基于递归迭代的串行算法iMBEA,在解决极大二分团枚举问题上效果显著,但是它也存在很多缺点,例如没有分析稀疏二分图的结构特点,算法过程存在冗余,不易并行等等。本文通过分析和优化,最终设计了一个新的串行算法sMBEA,也通过实验验证它的性能优势,在此基础上,又设计了动态负载均衡策略和共享参数存储结构,得到了并行解决方案psMBEA,并通过实验结果验证了其性能比传统mrMBEA算法更加高效。
其他文献
随着工业控制技术的发展,计算机自动控制系统已广泛应用于工业自动化的各个领域,如间歇过程、连续过程、离散过程等,以及食品、电力、水处理、化工等行业。随着工业控制系统
分布式光纤传感技术以光纤为传感和传输媒介,较点式和准分布式光纤传感器可实现分布式测量,扩展了检测范围。以马赫-曾德尔光纤干涉仪为基础搭建的相位调制型分布式光纤传感
机械振动无线传感器网络作为一种新的信息获取方式,需要具备高频率采样、高精度同步采集和大量数据传输的能力,这些高性能需求将导致现有的机械振动无线传感器网络节点在进行
由于Wi-Fi设备价格低廉、部署简单,近年来实现了大规模覆盖,Wi-Fi通信也得到了广泛应用。Wi-Fi信号因其处于特殊的频段而天然具有穿透性能强、感知范围广等优点。在满足基本
高温气体的辐射特性计算在很多领域均有应用,如高速目标的红外特征探测。结合传统的气体辐射特性参数计算方法,研究拥有更高计算效率的高温气体辐射特性参数计算方法具有重要
图像超分辨率重建技术指的是将给定的一幅低分辨率图像通过特定的算法恢复成相应的高分辨率图像。随着人工智能的不断发展,超分辨率重建技术在视频图像压缩传输、医学成像、
固井是石油工程中的重要作业过程。传统振动固井技术由于振源安装在井口或者井底,振动波在阻尼的作用下不断衰减,对井深达数千米的井振动效果不理想。随行振动固井技术,在充
壳聚糖,几丁质的脱乙酰基产物,具有比几丁质更好的溶解性、可降解性和生物相容性。壳聚糖有抑菌、保湿、调节血脂等优良性能,因而在食品、医药等领域有很大的开发和应用潜力
与高级视频编码标准AVC(Advanced Video Coding)相比,高效率视频编码标准HEVC(High Efficiency Video Coding)大大提高了编码效率,这得益于HEVC采用了许多新的编码技术。但是
核退役工作中,拆除机器人通过快换装置可以换装破碎锤、液压剪和抓斗等工具,以对核设施进行破碎、剪切和搬运等工作,是目前代替人工进入辐射环境对核设施进行拆除解体的主要