论文部分内容阅读
摘 要:针对传统水路货运OD调查样本少、成本高等问题,本次融合AIS数据、报港数据、港口地理信息数据等多源水运数据,建立了基于大数据技术的水路货运OD特征挖掘算法,实现了对水上货物运输总量及主要货种运输流量、流向的分析,对辅助管理部门制定经济发展规划、水运基础设施规划具有重要意义。
关键词:AIS数据;水路货运OD;挖掘算法
中图分类号:U695.2 文献标识码:A 文章编号:1006—7973(2021)09-0094-03
1 概述
水运是综合运输体系中的一种重要运输方式,具有运量大、能耗低、污染少等特点。水路货运的起讫点(Origin and Destination,OD)不仅清晰地反映了地区经济的发展情况以及地区经济之间的直接联系,而且反映了水运基础设施(包括港口、航道、船闸、锚地等)的利用情况,因此及时准确地获取水路货运OD,对于辅助交通运输管理部门制定经济发展规划、港口航道基础设施规划具有重要意义。
传统的水路货运OD主要通过人工调研的方式获得,通过人工在主要航道上记录船舶及货物的运输情况,同时辅以交通统计年鉴资料、航道观测点的交通量观测资料、港口吞吐量统计资料,可基本分析出船舶和货物的流量、流向规律。由于传统方法仅为某段时间的调研数据,同时需要花费较大的人力物力,局限性较大,因此本次基于AIS数据、报港数据、港口地理信息数据等多源水运大数据,提出了全新的水路货运OD计算方法。
2 多源水运数据准备
2.1 AIS数据
AIS数据来自于船舶自动识别系统,AIS报文信号经过解析可以解读为静态信息、动态信息、航次信息、安全信息等四种不同类型的信息。其中,靜态信息包括船舶MMSI编号、船名、型宽、船上定位天线的位置等;动态信息包括UTC时间、对地航向、对地航速、船首向、航行状态、倾角、转向率等;航次相关信息包括船舶吃水深度、船舶运载的危险货物类型、目的港口与预达时间、航线计划等;安全信息主要为与船舶航行相关的航权消息等。
AIS数据主要用以判断船舶和货物的流向,本次以2019年某段时间内的江苏省AIS数据为例开展研究,所需要用到的AIS数据信息主要有:MMSI(船舶呼号)、NAME1(船舶名称)、L(船舶所在经度)、B(船舶所在纬度)、TYPE1(船舶类型);STAT(船舶状态)、CTIME(测定该位置时的时间)。
2.2 报港数据
报港数据记录了各港口船舶的装卸信息,主要用于在货物流向的基础上进一步确定货物的流量,报港数据信息具体包括船舶的中文船名、海船内河船标志、船舶种类、进(出)港标志、进(出)港时间、查验机构、海事机构、签证方式、总吨、载重吨、实载货量、载/卸货量、前吃水以及后吃水。
2.3 港口基础设施地理信息数据
水路货运OD以港口为起讫点,因此,本次应用GIS系统采集了江苏省沿江沿海港口各作业区的地理信息数据,主要包括作业区名称、位置坐标、所属港区、所属港口、所属区县、所属城市、所属省等信息。
3 货运OD特征挖掘算法
3.1 数据预处理
AIS等运行数据在传输采集的过程中易出现信息缺失、错误、重复、异常等状况,会对大数据的挖掘分析造成干扰,影响分析效果,因此需要对数据进行数据清理、数据集成、数据变换、数据归约等预处理工作,本次主要对AIS船舶运行数据进行数据清理操作。
3.2 货运OD特征挖掘算法
对水路货运OD特征挖掘的关键在于通过船舶AIS轨迹数据准确地判断船舶停靠点。本次利用聚类分析方法,将行驶速度小于0.5km/h,行驶距离大于10km,停泊时间大于3h的停靠点初步判断为水路货运OD点;结合港口地理信息数据,应用射线法,进一步检验确定船舶的OD位置,同时结合报港数据确定每次货运OD的货种及运量。具体货运OD特征挖掘技术路线如下图所示。
3.3 货运OD特征挖掘计算结果
图4-图7为本次江苏省内水路货运OD挖掘分析结果,可以看出该时段内江苏省内沿江沿海船舶运输主要在长江沿线城市间进行,泰州市、苏州市、南通市等城市之间货运联系强度较大;同时研究时段内,干、散货运输区县间货运量较大的运输线路主要为太仓市—靖江市、太仓市—镇江市区、太仓市—南通市区、南京市区—太仓市区;集装箱运输区县间货运量较大的运输线路主要为海门市—南京市区、南京市区—常熟市、镇江市区—海门市。
4 结语
本次利用AIS数据、报港数据、港口地理信息数据等多源数据,提出了基于大数据方法的水路货运OD计算框架,实现了对水上货物运输总量及主要货种运输的流量、流向分析。由于原始数据信息内容的限制,目前船舶货运种类只能区分出散货、集装箱等货运大类,因此,本计算方法在船舶货运种类的细分上仍有进一步提升的需要,未来可以考虑通过进一步融合船舶身份信息、港口类别信息的方法,提升各水运货种OD计算的准确性。
参考文献:
[1]羌鹏. AIS船舶时空大数据分析和可视化技术研究 [D]. 大连:大连海事大学, 2020.
[2]陈龙彪,张大庆,李石坚等.基于海事大数据的港口感知计算 [J].地球信息科学,2016,18(11):1485-1493.
关键词:AIS数据;水路货运OD;挖掘算法
中图分类号:U695.2 文献标识码:A 文章编号:1006—7973(2021)09-0094-03
1 概述
水运是综合运输体系中的一种重要运输方式,具有运量大、能耗低、污染少等特点。水路货运的起讫点(Origin and Destination,OD)不仅清晰地反映了地区经济的发展情况以及地区经济之间的直接联系,而且反映了水运基础设施(包括港口、航道、船闸、锚地等)的利用情况,因此及时准确地获取水路货运OD,对于辅助交通运输管理部门制定经济发展规划、港口航道基础设施规划具有重要意义。
传统的水路货运OD主要通过人工调研的方式获得,通过人工在主要航道上记录船舶及货物的运输情况,同时辅以交通统计年鉴资料、航道观测点的交通量观测资料、港口吞吐量统计资料,可基本分析出船舶和货物的流量、流向规律。由于传统方法仅为某段时间的调研数据,同时需要花费较大的人力物力,局限性较大,因此本次基于AIS数据、报港数据、港口地理信息数据等多源水运大数据,提出了全新的水路货运OD计算方法。
2 多源水运数据准备
2.1 AIS数据
AIS数据来自于船舶自动识别系统,AIS报文信号经过解析可以解读为静态信息、动态信息、航次信息、安全信息等四种不同类型的信息。其中,靜态信息包括船舶MMSI编号、船名、型宽、船上定位天线的位置等;动态信息包括UTC时间、对地航向、对地航速、船首向、航行状态、倾角、转向率等;航次相关信息包括船舶吃水深度、船舶运载的危险货物类型、目的港口与预达时间、航线计划等;安全信息主要为与船舶航行相关的航权消息等。
AIS数据主要用以判断船舶和货物的流向,本次以2019年某段时间内的江苏省AIS数据为例开展研究,所需要用到的AIS数据信息主要有:MMSI(船舶呼号)、NAME1(船舶名称)、L(船舶所在经度)、B(船舶所在纬度)、TYPE1(船舶类型);STAT(船舶状态)、CTIME(测定该位置时的时间)。
2.2 报港数据
报港数据记录了各港口船舶的装卸信息,主要用于在货物流向的基础上进一步确定货物的流量,报港数据信息具体包括船舶的中文船名、海船内河船标志、船舶种类、进(出)港标志、进(出)港时间、查验机构、海事机构、签证方式、总吨、载重吨、实载货量、载/卸货量、前吃水以及后吃水。
2.3 港口基础设施地理信息数据
水路货运OD以港口为起讫点,因此,本次应用GIS系统采集了江苏省沿江沿海港口各作业区的地理信息数据,主要包括作业区名称、位置坐标、所属港区、所属港口、所属区县、所属城市、所属省等信息。
3 货运OD特征挖掘算法
3.1 数据预处理
AIS等运行数据在传输采集的过程中易出现信息缺失、错误、重复、异常等状况,会对大数据的挖掘分析造成干扰,影响分析效果,因此需要对数据进行数据清理、数据集成、数据变换、数据归约等预处理工作,本次主要对AIS船舶运行数据进行数据清理操作。
3.2 货运OD特征挖掘算法
对水路货运OD特征挖掘的关键在于通过船舶AIS轨迹数据准确地判断船舶停靠点。本次利用聚类分析方法,将行驶速度小于0.5km/h,行驶距离大于10km,停泊时间大于3h的停靠点初步判断为水路货运OD点;结合港口地理信息数据,应用射线法,进一步检验确定船舶的OD位置,同时结合报港数据确定每次货运OD的货种及运量。具体货运OD特征挖掘技术路线如下图所示。
3.3 货运OD特征挖掘计算结果
图4-图7为本次江苏省内水路货运OD挖掘分析结果,可以看出该时段内江苏省内沿江沿海船舶运输主要在长江沿线城市间进行,泰州市、苏州市、南通市等城市之间货运联系强度较大;同时研究时段内,干、散货运输区县间货运量较大的运输线路主要为太仓市—靖江市、太仓市—镇江市区、太仓市—南通市区、南京市区—太仓市区;集装箱运输区县间货运量较大的运输线路主要为海门市—南京市区、南京市区—常熟市、镇江市区—海门市。
4 结语
本次利用AIS数据、报港数据、港口地理信息数据等多源数据,提出了基于大数据方法的水路货运OD计算框架,实现了对水上货物运输总量及主要货种运输的流量、流向分析。由于原始数据信息内容的限制,目前船舶货运种类只能区分出散货、集装箱等货运大类,因此,本计算方法在船舶货运种类的细分上仍有进一步提升的需要,未来可以考虑通过进一步融合船舶身份信息、港口类别信息的方法,提升各水运货种OD计算的准确性。
参考文献:
[1]羌鹏. AIS船舶时空大数据分析和可视化技术研究 [D]. 大连:大连海事大学, 2020.
[2]陈龙彪,张大庆,李石坚等.基于海事大数据的港口感知计算 [J].地球信息科学,2016,18(11):1485-1493.