论文部分内容阅读
摘要:信息时代,数据无处不在,数据分析正在以我们未曾想象过的方式影响着我们的生活。而图表设计则是进行数据分析的常用方法,通常设计者利用图表来对数据包含的信息进行可视化呈现,这样能极大的帮助用户从纷杂的数据中快速获取有价值的信息,但在日常图表设计工作中,存在诸多图表使用不当或信息表达不合理的情况。本文将从图表设计概述、设计过程以及基本设计原则等方面,浅谈如何设计出优秀的图表。
关键词:数据分析;图表设计
一、图表设计概述
图表设计是数据可视化的重要手段,它是视觉设计与统计学相结合而产生的一个重要科学成果,其特点是感性与理性并重。十八世纪50年代左右,英国流行病学家约翰·思洛通过信息分析绘制了一张位置图表,图中标出了霍乱疫情的病人所在位置,进而通过该图表找到了霍乱疫情源头所在(图1)。由此开始,经过人们的不断努力,它在各行各业都已发挥着不可替代的作用。
在对复杂信息进行表述时之所以选用视觉图形化的图表设计方式,而非大段的纯文本描述,是因为人类的大脑对视觉信息的处理优于对文本信息的处理,因此,用眼睛直接查看可视化数据是一种更清晰更有效传达与沟通信息的方式。使用图表、图形和设计元素把数据进行可视化,可以帮助人们更容易的解释数据模式、趋势、统计规律和数据相关性,而这些“信息背后的信息”是在其他呈现方式下很难被发现。
二、图表体现的信息关系
通常情况下,图标可以体现出以下几种数据关系:
2.1构成
如图2,构成主要关注每个部分所占整体的百分比,如果想表达的信息包括:“份额”、“百分比”以及“预计将达到百分之多少”,此时可以用到饼图、堆积面积图等。
2.2比较
如图3,比较不仅可以展示数据的排列顺序 —— 是差不多,还是一个比另一个更多或更少呢?“大于”、“小于”或者“大致相当”都是比较相对关系中的关键词,此时这可选择柱图、条形图等;另外也可展示数据如何随时间变化而变化,每周、每月、每年的变化趋势是增长、减少、上下波动或基本不变,此时折线图则能更好额表现指标随时间呈现的趋势。
2.3分布
如图4,分布是关心各数值范围内各含了多少项目,典型的信息会包含:“集中”、“频率”与“分布”等,这时候使用柱图;还可以根据地理位置数据,通过地图展示不同分布特征。
2.4联系
如图5,联系主要查看变量之间是否表达出我们预期所要证明的模式关系,比如预期销售额可能随着折扣幅度的增长而增长而增长,这时候可以用气泡图来展示,用于表达“与……有关“、“随……而增长”、“随……而不同”变量间的关系。
三、图表设计过程
数据可视化的本质是将数据通过各种视觉通道映射成图形,可以使得用户更快、更准确的理解数据。因此数据可视化要解决的问题是如何将数据通过视觉可观测的方式表达出来,同时需要考虑美观、可理解性,需要解决展示空间(画布)有限的情况下覆盖、杂乱、冲突等问题,再以交互的形式查看数据的细节。
其过程大致可以分为以下几个步骤:
3.1弄清需求定义问题
首先明确数据可视化是要让用户看懂数据,理解数据,所以开始数据可视化前一定要弄明白用户的需求,以使后期的设计符合目标用户的认知特性和行为特性。
3.1确定要展示的数据
进行数据可视化首先要有数据,由于画布大小限制,过量的数据不能够直接显示出来,所以要确定展示的数据:
l我要展示的数据是否已经加工好,是否存在空值?
l是列表数据还是树形数据?
l数据的规模有多大?
l是否对数据进行聚合,是否要分层展示数据?
l如何加载到页面,是否需要在前端对数据处理?
3.3确定数据维度与指标
维度是针对对象的描述性特征或属性,比如城市的分级、性别、行业等;指标是用户用户衡量对象的单位或方法。维度与指标一般成对出现,共同构成一组数据。例如,我们要对比2020年某几个部队全年会议数量,那么部队就是维度,会议数量就是指标。
操作过程中,我们得到的数据表中存储着多个主体的多个指标数据,但是不是所有的维度和指标是需要我们关注的。因此,我们通常会通过维度或者指标,对将要提取的数据进行限制,避免数据量级过大,同时也避免我們的注意力分散。
3.4对承载数据的图表进行设计
前期工作中已经确定好用户的需求以及需要展示的数据,现在就需要对承载数据的图表进行设计,我们可以根据前面讲的数据关系对图表类型进行选择,也可以进行针对性的个性化图表设计。在此阶段,设计者必须要明白什么是优秀的图表,什么是失败的图表。
优秀的图表 失败的图表
?能把复杂变得简单;
?讲述一个清晰的故事;
?正确表达数据的意义;
?按照需求揭示细节。
?太多元素,造成视觉混乱;
?最基本的问题需要很长时间才能找到答案;
?缺少组织逻辑,图表随意拼装;
?图表根本产生不了任何洞察。
3.5确定图表的交互
交互通常被认为是图表设计时需要考虑的次要问题,但是它一旦被用户感知到,细微的交互就能给用户创造一种愉悦的超预期体验,从而提升该图表的价值。
四、图表设计准则
无规矩不成方圆,图表设计自然也不是随意为之,它的表达方式选择、色彩搭配、交互形式等等都需要在一定规则的约束下进行。
下面是设计图表时应该遵守的六项原则。
(一)数据准确性和完整性至上,请勿扭曲或混淆信息的修饰或局部性,强调清晰度和透明度。
关键词:数据分析;图表设计
一、图表设计概述
图表设计是数据可视化的重要手段,它是视觉设计与统计学相结合而产生的一个重要科学成果,其特点是感性与理性并重。十八世纪50年代左右,英国流行病学家约翰·思洛通过信息分析绘制了一张位置图表,图中标出了霍乱疫情的病人所在位置,进而通过该图表找到了霍乱疫情源头所在(图1)。由此开始,经过人们的不断努力,它在各行各业都已发挥着不可替代的作用。
在对复杂信息进行表述时之所以选用视觉图形化的图表设计方式,而非大段的纯文本描述,是因为人类的大脑对视觉信息的处理优于对文本信息的处理,因此,用眼睛直接查看可视化数据是一种更清晰更有效传达与沟通信息的方式。使用图表、图形和设计元素把数据进行可视化,可以帮助人们更容易的解释数据模式、趋势、统计规律和数据相关性,而这些“信息背后的信息”是在其他呈现方式下很难被发现。
二、图表体现的信息关系
通常情况下,图标可以体现出以下几种数据关系:
2.1构成
如图2,构成主要关注每个部分所占整体的百分比,如果想表达的信息包括:“份额”、“百分比”以及“预计将达到百分之多少”,此时可以用到饼图、堆积面积图等。
2.2比较
如图3,比较不仅可以展示数据的排列顺序 —— 是差不多,还是一个比另一个更多或更少呢?“大于”、“小于”或者“大致相当”都是比较相对关系中的关键词,此时这可选择柱图、条形图等;另外也可展示数据如何随时间变化而变化,每周、每月、每年的变化趋势是增长、减少、上下波动或基本不变,此时折线图则能更好额表现指标随时间呈现的趋势。
2.3分布
如图4,分布是关心各数值范围内各含了多少项目,典型的信息会包含:“集中”、“频率”与“分布”等,这时候使用柱图;还可以根据地理位置数据,通过地图展示不同分布特征。
2.4联系
如图5,联系主要查看变量之间是否表达出我们预期所要证明的模式关系,比如预期销售额可能随着折扣幅度的增长而增长而增长,这时候可以用气泡图来展示,用于表达“与……有关“、“随……而增长”、“随……而不同”变量间的关系。
三、图表设计过程
数据可视化的本质是将数据通过各种视觉通道映射成图形,可以使得用户更快、更准确的理解数据。因此数据可视化要解决的问题是如何将数据通过视觉可观测的方式表达出来,同时需要考虑美观、可理解性,需要解决展示空间(画布)有限的情况下覆盖、杂乱、冲突等问题,再以交互的形式查看数据的细节。
其过程大致可以分为以下几个步骤:
3.1弄清需求定义问题
首先明确数据可视化是要让用户看懂数据,理解数据,所以开始数据可视化前一定要弄明白用户的需求,以使后期的设计符合目标用户的认知特性和行为特性。
3.1确定要展示的数据
进行数据可视化首先要有数据,由于画布大小限制,过量的数据不能够直接显示出来,所以要确定展示的数据:
l我要展示的数据是否已经加工好,是否存在空值?
l是列表数据还是树形数据?
l数据的规模有多大?
l是否对数据进行聚合,是否要分层展示数据?
l如何加载到页面,是否需要在前端对数据处理?
3.3确定数据维度与指标
维度是针对对象的描述性特征或属性,比如城市的分级、性别、行业等;指标是用户用户衡量对象的单位或方法。维度与指标一般成对出现,共同构成一组数据。例如,我们要对比2020年某几个部队全年会议数量,那么部队就是维度,会议数量就是指标。
操作过程中,我们得到的数据表中存储着多个主体的多个指标数据,但是不是所有的维度和指标是需要我们关注的。因此,我们通常会通过维度或者指标,对将要提取的数据进行限制,避免数据量级过大,同时也避免我們的注意力分散。
3.4对承载数据的图表进行设计
前期工作中已经确定好用户的需求以及需要展示的数据,现在就需要对承载数据的图表进行设计,我们可以根据前面讲的数据关系对图表类型进行选择,也可以进行针对性的个性化图表设计。在此阶段,设计者必须要明白什么是优秀的图表,什么是失败的图表。
优秀的图表 失败的图表
?能把复杂变得简单;
?讲述一个清晰的故事;
?正确表达数据的意义;
?按照需求揭示细节。
?太多元素,造成视觉混乱;
?最基本的问题需要很长时间才能找到答案;
?缺少组织逻辑,图表随意拼装;
?图表根本产生不了任何洞察。
3.5确定图表的交互
交互通常被认为是图表设计时需要考虑的次要问题,但是它一旦被用户感知到,细微的交互就能给用户创造一种愉悦的超预期体验,从而提升该图表的价值。
四、图表设计准则
无规矩不成方圆,图表设计自然也不是随意为之,它的表达方式选择、色彩搭配、交互形式等等都需要在一定规则的约束下进行。
下面是设计图表时应该遵守的六项原则。
(一)数据准确性和完整性至上,请勿扭曲或混淆信息的修饰或局部性,强调清晰度和透明度。