论文部分内容阅读
为有效挖掘分析全球停泊点信息,利用Hadoop、Spark大数据处理平台存储、分析全球海量船舶自动识别系统的历史动态船舶数据,根据船舶在停泊点附近具有航速低、停泊时间长的特征对网格化的经纬度数据进行筛选,进而采用密度聚类算法与网络爬虫技术确定全球停泊点位置,将所得停泊点结果可视化并与Marinetraffic网页中停泊点参照位置进行比对分析。研究表明:全球共挖掘出5 149个港口和19 804个停泊点,可视化结果显示其均分布在海岸沿线且几乎覆盖了全球区域。同时,挖掘所得停泊点位置与Marinetraffi