基于云计算分布式技术的海量AIS数据挖掘系统设计与实现

来源 :大连海事大学 | 被引量 : 7次 | 上传用户:yorehi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着海上贸易的蓬勃发展,船舶自动识别系统日渐普及,一方面在各个海事局及其相关系统中沉淀了丰富船舶航行数据,另一方面也对如何高效处理挖掘这些海量的航行数据提出了挑战。而云计算和分布式技术作为一种高效的数据挖掘手段解决方案,正在越来越广泛地应用于各行各业,通过云计算和分布式技术释放的高效强劲的计算资源可以有效的解决海事领域数据挖掘场景下的计算瓶颈。在这样的背景下,本文以船舶航行中的AIS数据为研究对象,采用云计算和分布式技术,结合数据挖掘的方法,设计实现了海量AIS数据挖掘平台,对船舶轨迹进行大数据分析,主要工作包括以下几个方面:(1)基于商用云计算平台和分布式技术平台Hadoop,设计了海量AIS数据挖掘系统技术解决方案和实现框架。开发了分布式AIS数据接收与汇总子系统,并通过分布式日志收集系统Flume对其进行收集,保证信息的实时性和高可用性;建立了 HBase分布式键值对数据库,实现海量数据高并发写入和及时查询的需求;实现了基于联机处理能力(OLAP)的分布式数据仓库,用于各种粒度的AIS数据交互式分析。(2)在云计算分布式环境下,设计并实现了分布式计算的并行DBSCAN算法,采用KD树空间划分算法划分空间数据,用于对海量船舶运行轨迹的挖掘与分析。为了实现对海上交通流态势的实时感知和异常报警,设计了利用Spark流式计算实现对监控水域船舶实时聚类分析的技术方案。(3)采用舟山海区的历史数据和老铁山水道的实时AIS数据对系统进行实例验证。实验结果表明,在大规模数据的情况下,相较于单机系统,基于云计算和分布式技术可以有效的提升船舶轨迹挖掘的计算效率;采用Spark Streaming计算对船舶轨迹进行分布式实时聚类,可以动态实时地发异常行为的船舶,验证了在海事智能监管领域中的可行性及实用价值。
其他文献
水生态功能分区是流域水环境分类、分级、分区、分期管理的基础。回顾总结国内外水生态功能分区工作的基础上,针对我国流域水生态功能一、二级分区工作,提出了一个可供参考的
<正> 长期以来,很少有人深入地揭示《拿来主义》的论证逻辑系统及其写作主旨,至今还存在着:鲁迅是对中国的还是外国的文化遗产问题,构成分歧意见。我们认为:鲁迅“拿来主义”
自媒体是托生于互联网技术的新型媒体。在我国,它的社会影响力正在逐步上升,其中一个主要表现即是对当今社会新媒体事件的参与。本文从媒介逻辑视角出发,通过研究新媒体事件
<正>情景性体育游戏——是指幼儿在有情景的环境创设下开展的运动性游戏。在我们组织体育游戏时,非常注重创设生动有趣的游戏情景,来提高幼儿运动兴趣。因为情景游戏是一种重
<正>台湾著名作家白先勇是前国民党高级将领白崇禧的儿子。他的小说畅销海内外,一部《孽子》好评如潮。他曾在作品中感叹“错生了一根肋骨”,道出了他与众不同的性价值取向。
"党建"是十九大报告中的一个核心问题,是贯穿十九大报告全篇的"纲"和"魂"。本文结合对十九大报告中关于党建内容的提炼与概括,分析了十八大和十九大不同背景下的党建任务的要
目的探讨放散式心理护理对肿瘤患者焦虑及抑郁的影响。方法将205例肿瘤患者随机分为实验组104例和对照组101例。采用焦虑与抑郁相关知识调查问卷、冈谷惠子护患关系信任度量
<正>引言中国土木工程界正在大踏步的迈向国际市场,在此过程中,中国的设计、施工企业将要面对一系列问题,而技术层面的第一个问题就是国外标准规范的学习和应用。本文重点介
《全唐文补遗》(千唐志斋新藏专辑)所收墓志中有许多有关唐代科举的资料,其中进士科年份可考者十九人,年份待考者四十四人,均对《登科记考补正》有补苴价值。
峻岭同志是我非常敬重的诗友、词家,这种敬重不只来自他是我省主抓文化工作的领导,担负着繁荣全省文化事业的重任,更缘于他是一个十分出色的诗人、词家,数十年来他发表了不少诗歌、歌词,有些作品被著名作曲家赵季平、朱良镇、万里、晓耕等谱曲,并被著名歌唱家杨洪基、廖昌永、谭晶等演唱,或在国家省市电视台、电台播放、获奖,或在舞台上展示,或选入一些书刊,影响深远,流传广泛,我为他取得的令人嘱目的成绩而高兴,而祝贺