论文部分内容阅读
摘要:交通大数据是智能交通系统发展的必然结果,可视分析技术为我们提供了一种直观有效的方法,它将复杂的交通数据及其分析结果通过可视化方式直观地展现出来并支持对结果的交互式筛选和浏览,进一步加强对其的研究非常有必要,从而提高大数据的利用率。基于此本文分析了交通大数据可视分析。
关键词:交通;大数据;可视分析
1、交通大数据可视化流程中的核心要素
数据可视化流程中的核心要素包括3个方面。
1.1数据表示与变换
数据可视化的基础是数据表示和变换。为了允许有效的可视化、分析和记录,输入数据必须从原始状态变换到一种便于计算机处理的结构化数据表示形式。通常这些结构存在于数据本身,需要研究有效的数据提炼或简化方法以最大程度地保持信息和知识的内涵及相应的上下文。
1.2数据的可视化呈现
将数据以一种生动直观,容易理解和方便操作的方式呈现给用户,才能向用户传播准确有效而有价值的信息。然而数据的呈现方式有多种多样,如何有效地从众多多样性呈现方式中选择出最佳的视觉编码形式是数据可视化的重要任务。判断一个视觉编码是否符合可视化呈现的因素包括很多方面,如数据本身的属性以及用户感知与认知系统的特性等。大量的数据采集通常是以流的形式实时获取的,针对静态数据发展起来的可视化显示方法不能直接拓展到动态数据。
1.3用户交互
对数据进行可视化和分析的最终目的是解决特定的任务,这些目标任务通常有生成假设、验证假设和视觉呈现三类任务。数据可视化可以用于从数据中探索新的假设,也可以证实相关假设与数据是否吻合,还可以帮助数据专家向公众展示其中的信息。交互是通过可视的手段辅助分析决策的直接推动力。
2、交通大数据可视方法
大数据可视化技术分为科学可视化和信息可视化,信息可视化在挖掘信息等方面扮演着重要的作用。信息可视化是将数据信息转化为视觉形式的过程,增强数据显示效果,使用户直观的观察和浏览数据,从而发现数据中隐藏的特性、模式以及规律。早期的可视化主要使用简单的图表将复杂的数据简化,而进入20世纪,随着计算機技术的发展、处理数据能力的提升,用户可以使用更多的可视化方法观察自己的数据,主要领域有数据挖掘可视化、网络数据可视化、社交可视化、交通可视化、文本可视化、生物医药可视化等。
2.1平行坐标系
多维数据是指研究的对象具有三个属性以上的数据。多维数据难以在平面或空间中建立模型,因此人们对多维数据的认知也相对困难。但由于多维数据分析可以揭示不同维度属性间的隐藏关系,所以近年对多维可视化的研究成为热点。其中,平行坐标系为研究应用较广泛的多维可视化技术。
2.2热力图
热力图是用一个带有颜色的数据矩阵表示图形。起初,热力图是由软件设计师CormacKinney在1991年首先提出并注册,用二维矩阵显示描述金融市场信息。随着热力图的发展,呈现了很多不同种类的热力图:网络热力图、生物热力图、树图等。使用热力图可以直观、清晰的看到数据随着时间或地理位置的变化状态,无需任何分析经验。热力图中的每个热力点(HeatPoint)由三个部分组成(X,Y,Weight),每一个热点都有一个位置和权重,权重越大,该点越显著,也就代表渐变的一个衰变因素。热力图的实现:统计筛选所有点,根据权重值和范围值算法计算权重值,并获取最大和最小权重的热力点;对照颜色表,采用具体的插值算法获取权重值对应的颜色。
2.3漏斗图
漏斗图为数据可视化的一种表达方式,在GoogleAnalytics中表示目标和渠道,在WebTrends中代表场景分析,在Omniture的SiteCatalyst里则为产品转换漏斗。漏斗图适用于业务流程比较规范、周期长、环节多的流程分析,通过漏斗图各环节数据的比较,能够直观的发现和说明问题所在。使用漏斗图进行分析的场景有电商代表的网站、营销推广等,它具有快速发现问题、直观展示两端数据、提高业务转化率、提高最终转化率等特点。将漏斗图应用于交通流量数据中,统计交通地感线圈的总流量,按照流量的大小依次递减分布,颜色的深浅也表示流量的多少,增强表示了地感线圈流量的排列。获取一定的时间段中每条路总流量分布情况,了解哪条上车流量较多,哪条路上车流量较少。
3、交通数据可视化平台系统应用
3.1数据存储
数据处理是交通数据可视化分析的基础,为数据分析可视化提供可靠的数据来源,从两部分对数据进行处理:数据库中提取数据、交通数据预处理。从数据库中提取原始数据需要根据时间、空间的需要进行筛选,构建相应的python语句查询满足要求的数据。本文使用的数据库为MongoDB,该数据库有高性能、易部署、存储方便、模式自由等特点,是一个基于分布式文件存储的数据库。将结构化、非结构化的交通数据存储在MongoDB数据库中,从而可以对数据进行查询、搜索、分析等操作。
3.2逻辑处理
逻辑处理是使用交通数据对不同应用进行分析的过程,包括交通状态、拥堵路段的判断,上下客热点区域的聚类,具体的理论过程已在第三、四章中进行了描述。
3.3可视分析
可视分析为原型系统的展示部分,定义各个可视化组件的交互事件,实现了组件之间的交互协同,实现不同组件间的交互作用,更好的实现交通数据的可视化。
3.4交通状态判别的指标
交通状态判别是判断交通道路的状态是畅通、轻微拥堵、拥堵或是严重拥堵。本质上,交通状态判断是对道路拥挤程度的判断。而拥堵状态可以分为偶然发生的拥堵和经常发生的拥堵。偶然发生的拥堵一般由交通事件引起的不定时、不定点的拥堵,如大型活动(足球赛、演唱会等)、突发交通事故、恶劣的天气、道路施工养护等。虽然偶然发生的交通拥堵预测困难,但是对于有计划的活动引起的交通拥堵可以估测出时间和地点。
总之,可视分析通过丰富的交互手段为用户提供从概览到细节的探索能力,其图形化的分析结果展示方式也便于用户理解数据中蕴藏的规律。因此,可视分析近年来在智能交通领域受到极大的关注,需要重点加强研究。
参考文献:
[1]郝娜,李鑫.基于大数据的智能交通系统浅析[J].石家庄职业技术学院学报,2018,30(04):31-33.
[3]梁荣华.“大数据可视分析”专栏序[J].中国图象图形学报,2015,20(04):453.
(作者单位:南京市城市与交通规划设计研究院股份有限公司)
关键词:交通;大数据;可视分析
1、交通大数据可视化流程中的核心要素
数据可视化流程中的核心要素包括3个方面。
1.1数据表示与变换
数据可视化的基础是数据表示和变换。为了允许有效的可视化、分析和记录,输入数据必须从原始状态变换到一种便于计算机处理的结构化数据表示形式。通常这些结构存在于数据本身,需要研究有效的数据提炼或简化方法以最大程度地保持信息和知识的内涵及相应的上下文。
1.2数据的可视化呈现
将数据以一种生动直观,容易理解和方便操作的方式呈现给用户,才能向用户传播准确有效而有价值的信息。然而数据的呈现方式有多种多样,如何有效地从众多多样性呈现方式中选择出最佳的视觉编码形式是数据可视化的重要任务。判断一个视觉编码是否符合可视化呈现的因素包括很多方面,如数据本身的属性以及用户感知与认知系统的特性等。大量的数据采集通常是以流的形式实时获取的,针对静态数据发展起来的可视化显示方法不能直接拓展到动态数据。
1.3用户交互
对数据进行可视化和分析的最终目的是解决特定的任务,这些目标任务通常有生成假设、验证假设和视觉呈现三类任务。数据可视化可以用于从数据中探索新的假设,也可以证实相关假设与数据是否吻合,还可以帮助数据专家向公众展示其中的信息。交互是通过可视的手段辅助分析决策的直接推动力。
2、交通大数据可视方法
大数据可视化技术分为科学可视化和信息可视化,信息可视化在挖掘信息等方面扮演着重要的作用。信息可视化是将数据信息转化为视觉形式的过程,增强数据显示效果,使用户直观的观察和浏览数据,从而发现数据中隐藏的特性、模式以及规律。早期的可视化主要使用简单的图表将复杂的数据简化,而进入20世纪,随着计算機技术的发展、处理数据能力的提升,用户可以使用更多的可视化方法观察自己的数据,主要领域有数据挖掘可视化、网络数据可视化、社交可视化、交通可视化、文本可视化、生物医药可视化等。
2.1平行坐标系
多维数据是指研究的对象具有三个属性以上的数据。多维数据难以在平面或空间中建立模型,因此人们对多维数据的认知也相对困难。但由于多维数据分析可以揭示不同维度属性间的隐藏关系,所以近年对多维可视化的研究成为热点。其中,平行坐标系为研究应用较广泛的多维可视化技术。
2.2热力图
热力图是用一个带有颜色的数据矩阵表示图形。起初,热力图是由软件设计师CormacKinney在1991年首先提出并注册,用二维矩阵显示描述金融市场信息。随着热力图的发展,呈现了很多不同种类的热力图:网络热力图、生物热力图、树图等。使用热力图可以直观、清晰的看到数据随着时间或地理位置的变化状态,无需任何分析经验。热力图中的每个热力点(HeatPoint)由三个部分组成(X,Y,Weight),每一个热点都有一个位置和权重,权重越大,该点越显著,也就代表渐变的一个衰变因素。热力图的实现:统计筛选所有点,根据权重值和范围值算法计算权重值,并获取最大和最小权重的热力点;对照颜色表,采用具体的插值算法获取权重值对应的颜色。
2.3漏斗图
漏斗图为数据可视化的一种表达方式,在GoogleAnalytics中表示目标和渠道,在WebTrends中代表场景分析,在Omniture的SiteCatalyst里则为产品转换漏斗。漏斗图适用于业务流程比较规范、周期长、环节多的流程分析,通过漏斗图各环节数据的比较,能够直观的发现和说明问题所在。使用漏斗图进行分析的场景有电商代表的网站、营销推广等,它具有快速发现问题、直观展示两端数据、提高业务转化率、提高最终转化率等特点。将漏斗图应用于交通流量数据中,统计交通地感线圈的总流量,按照流量的大小依次递减分布,颜色的深浅也表示流量的多少,增强表示了地感线圈流量的排列。获取一定的时间段中每条路总流量分布情况,了解哪条上车流量较多,哪条路上车流量较少。
3、交通数据可视化平台系统应用
3.1数据存储
数据处理是交通数据可视化分析的基础,为数据分析可视化提供可靠的数据来源,从两部分对数据进行处理:数据库中提取数据、交通数据预处理。从数据库中提取原始数据需要根据时间、空间的需要进行筛选,构建相应的python语句查询满足要求的数据。本文使用的数据库为MongoDB,该数据库有高性能、易部署、存储方便、模式自由等特点,是一个基于分布式文件存储的数据库。将结构化、非结构化的交通数据存储在MongoDB数据库中,从而可以对数据进行查询、搜索、分析等操作。
3.2逻辑处理
逻辑处理是使用交通数据对不同应用进行分析的过程,包括交通状态、拥堵路段的判断,上下客热点区域的聚类,具体的理论过程已在第三、四章中进行了描述。
3.3可视分析
可视分析为原型系统的展示部分,定义各个可视化组件的交互事件,实现了组件之间的交互协同,实现不同组件间的交互作用,更好的实现交通数据的可视化。
3.4交通状态判别的指标
交通状态判别是判断交通道路的状态是畅通、轻微拥堵、拥堵或是严重拥堵。本质上,交通状态判断是对道路拥挤程度的判断。而拥堵状态可以分为偶然发生的拥堵和经常发生的拥堵。偶然发生的拥堵一般由交通事件引起的不定时、不定点的拥堵,如大型活动(足球赛、演唱会等)、突发交通事故、恶劣的天气、道路施工养护等。虽然偶然发生的交通拥堵预测困难,但是对于有计划的活动引起的交通拥堵可以估测出时间和地点。
总之,可视分析通过丰富的交互手段为用户提供从概览到细节的探索能力,其图形化的分析结果展示方式也便于用户理解数据中蕴藏的规律。因此,可视分析近年来在智能交通领域受到极大的关注,需要重点加强研究。
参考文献:
[1]郝娜,李鑫.基于大数据的智能交通系统浅析[J].石家庄职业技术学院学报,2018,30(04):31-33.
[3]梁荣华.“大数据可视分析”专栏序[J].中国图象图形学报,2015,20(04):453.
(作者单位:南京市城市与交通规划设计研究院股份有限公司)