大规模图数据交互式可视化分析的性能优化

来源 :贵州大学 | 被引量 : 1次 | 上传用户:jonquil1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对包含大量节点和边的图数据进行快速、高效地分析与挖掘,是当前图分析领域的热点研究问题。本文在认真研究了国内外现状的基础上,结合现有数据分析技术,并基于增量预计算技术和抽样技术,设计实现了高效的图分析原型系统GASys,随后基于节点的近似度分布分层策略,结合现有图抽样算法设计并实现了一系列的分层图抽样算法,解决了现有图抽样算法在一次抽样过程中存在的有偏性问题,提高了抽样算法的抽样准确度,进一步优化了大规模图数据交互式可视化分析性能。在统计学中,抽样被作为一种高效的分析方法,常常被用于大规模图数据分析领域,以提升分析性能。经典的图抽样算法大都存在高度节点或低度节点过度入样的问题,极大影响算法抽样性能。复杂图中节点的度服从幂律分布,节点个体之间存在较大差异。本文首次提出节点的近似度分布概念,在此概念基础上设计并实现了一系列分层图抽样算法。在3个真实的图数据集上的实验结果表明,本文提出的分层图抽样算法相比经典图抽样算法,能够保留更多的图拓扑属性,且执行效率比FFS和ES-i更高。理论分析与实验结果均表明本文的分层图抽样算法在度的无偏性方面优于现有算法,同时为图抽样算法中的有偏性问题提供了一种通用、可行的解决方案。现有的图分析系统大都无法满足大规模图数据分析需求,本文分析研究了当前图分析系统存在的问题,基于增量预计算技术和抽样技术,设计并实现了交互式可视化图分析原型系统GASys,它允许用户高效地执行可视化图分析任务。GASys使用数据缓存技术实现数据的增量式加载,提高了系统的交互性能,这使得GASys能够完成大规模图数据的分析任务。使用基于缓存的增量预计算技术提高了交互分析性能。使用抽样技术实现数据的非全量分析,在保证算法准确性的前提下,非全量分析更快。GASys还集成了大量的图路径算法、图抽样算法、图聚类算法,图布局算法等,使得GASys能够适用于不同的应用场景。
其他文献
硬件设施不足、措施相对松散、系统化程度不足的校内媒体平台和联系性弱、资源不足的校外实践平台,已不能满足持续增长的地方高校新闻专业学生和融媒体形态的社会需求。本研
古建筑是人类几千年来遗留下来的宝贵产物,对于古建筑的传承和复原保护,是一项必要而又具有一定难度的工作,利用3D打印技术不但能将成本降到最低,还能够实现逼真还原。但是在
直招士官试点工作已历经7年,为了了解士官思想政治教育的真实情况,我们选取某高职院实施直招士官思想政治教育的三个年级,共224名士官生,进行不记名问卷调查。通过分析调查结
近年来,随着海洋资源的进一步开发以及海上军事装备的发展,浅海地形探测成为了世界各国关注的重点。然而由于浅海水域的多径干扰以及混响更加复杂,浅海探测的发展受到了很大
工程项目管理是通过科学有效的方式,对多个工程项目进行资金和数据管理、制定项目计划、项目进度控制、项目人员调度、建设单位管理和图形报表生成。随着国内经济的快速发展和建设项目规模的不断扩大,项目管理中考虑的问题也越来越复杂,项目相关信息的增长速度惊人。那么考虑如何利用计算机技术来提高工程项目管理效率,平衡项目支出与项目收益,科学投资预算,考虑如何使用可控制的资源(人力,物料,机器,时间,资金),在一定
我国金融衍生品市场的政府统一监管、行业自律监管及交易所一线监管的三级监管体系呈多头监管、交叉监管、重复监管以及分散监管的特点,监管体系存在一定的弊端,应按照一元二
有机致癌物自身通常缺乏生物反应性,需要经过代谢活化才具有致突变和致癌性。化学物的致突变性筛查通常采用体外细胞遗传毒理学试验,然而,由于常规细胞缺少生物转化酶活性,易
经常有患者问我这样的问题:为何我那么怕冷呢?其实,怕冷的原因很多。比如,肝气不舒,会四肢冰冷;瘀血体质的人,气血不通,会手脚冰凉;血虚的人,天冷的时候,因为缺乏血液温养四肢,手脚也冰冷
报纸
2001年4月5日“海外华文教育未来发展”学术研讨会在厦门大学海外教育学院举行。此次研讨会也是厦大海外教育学院45周年院庆活动的内容之一。国务院侨办、国家对外汉语领导小
在我国现行法律体系中,是否应该增加规定就有关娱乐新闻报道活动进行规范,除了关注公众人物的个人隐私之外,是否还应该考虑保护读者的利益$$ 最近,一位演员的婚外情引起社
报纸