论文部分内容阅读
物流信息化的迅速发展使得物流数据规模呈几何级增长。目前的众多物流信息平台拥有庞大数据库,但其中的数据却缺乏有效的分析和挖掘,从而隐藏了数据背后的规律和价值,因此建立一个基于物流信息平台的数据挖掘系统十分必要。本文主要基于国家交通运输物流公共信息平台的数据进行数据挖掘系统的设计与实现。首先对系统进行了需求分析,然后设计了聚类分析、运输优化和统计分析三大功能模块,最后实现了系统。为运输交管部门、企业和个人用户的决策提供了有效的科学依据。本文研究的主要工作和成果:(1)进行了基于物流信息平台的数据挖掘系统的需求分析,梳理了国家交通运输物流公共信息平台的现有数据,提出了系统建设目标,确立了危险品运输聚类分析、运输优化分析和统计分析三大数据挖掘的功能模块,并且针对每一功能提出了更详尽的需求场景描述,共提出了 12个数据挖掘需求场景。(2)对基于物流信息平台的数据挖掘系统进行了设计,包括系统的总体设计、系统数据库设计和算法的设计。其中,系统设计部分分别从设计方案、总体架构、功能子模块和操作流程四个方面进行了全面设计;系统数据库设计中,使用E-R图描述了数据库的概念模型,并采取我国经纬度数据进行网格的划分,最终建立了 8张主要的数据表;算法设计中,聚类分析模块采用了 K-means算法对国家物流信息平台的重点危险品运输数据的进行聚类分析,路径寻优模块将关联规则算法和A*算法相结合,实现路径寻优,统计分析模型借助可视化工具Qliksense进行了货品行业用途分析和区域货品载重能力分析。(3)开发实现了基于物流信息平台的数据挖掘系统,系统集成了三个模型的功能,以物流信息平台的数据为数据源,对18个挖掘和分析场景下的结果进行可视化展示,并将挖掘出来的知识与传统经验形成的结果加以比较,验证了挖掘系统的合理性。