论文部分内容阅读
随着市场经济的繁荣以及网上购物的兴起,快递行业得到了迅速的发展,快递服务逐渐融入人们的日常生活。而随着复杂网络与大数据技术的不断进步,通过物流大数据来认识快递网络、分析快递网络并解决快递行业的相关问题已经成为了可能。一方面,深入研究快递网络的拓扑以及交通流的动态特征有利于企业更好地运营快递网络,提高经济效益。另一方面,准确掌握快件邮寄所花的时间不仅有利于企业更好地提升快递服务,而且有助于用户更便捷地使用快递。因此,本文提出了一套通用的快递网络研究框架,开展了系统性的工作,基于快递物流数据对快递网络进行深入地分析与建模。本文首先搭建了快递物流数据分析平台,后续的快递网络分析与建模工作都将在此平台上展开。该平台包含物流数据的自动爬取、数据分布式处理等模块,通过数据爬虫自动采集了1600万条快递物流记录,并搭建了业界流行的大数据处理框架—Hadoop分布式数据处理集群来处理分析物流数据。然后,本文基于物流数据分析了快递网络的拓扑特性、交通流特性以及快件时延,发现了快递网络拓扑的三级结构划分、节点度分布的幂律特性以及节点之间多条可选路径并存等特征。快件交通流在空间上是倾斜分布的,少数节点和路径承受了大部分快件流量,而交通流在时间上表现出了很强的每日/每周的周期变化规律性,反映了人们日常生活与工作的规律性,同时也能为用户何时投递快件提供指导建议。由于快件的交通动态特性较为复杂,本文最后基于物流数据对快件运送过程进行了马尔科夫建模,利用此模型刻画快件运送动态性并进一步预测快件时延,通过实际物流数据的验证表明模型具有较高的时延预测精度。最后给出了模型实际应用的步骤,并提出了通过定期利用最新的物流数据来更新模型的策略以应对快递网络可能发生的变化,以使模型保持较高的精度。本文的工作不仅有利于快递企业更好的理解快递网络的实际运营状况,为企业改进、提高快递网络性能提供理论支撑,同时有利于用户更合理方便地使用快递服务。另外本文以数据驱动的研究工作也将启发其它领域以数据为基础的相关研究。