2010-05-28 12:12:42 阅读8 评论0 字号:大中小
图表的应用已经有上千年的历史。在近几十年,也有很多深入的研究。比如贝尔实验室的Cleveland在七十年xx始的一系列著作,对图表及其所涉及到的不同方面做了很详尽的分析。
但作为实际操作中可以很快应用的,还要算Tufte教授提出的数据墨水的概念。数据墨水,是指把所有显示的点分为数据和非数据的显示。图表设计的目标,是在不影响数据的表达的前提下,尽量提高数据墨水对非数据墨水的比例。
这个概念理解起来是很容易的。但实际操作中,往往会遇到很多模糊的时候。Tufte的建议是想象你有一个橡皮擦,然后分析每一种显示的点,看看擦掉它会不会影响数据的显示。在没有点开擦的时候,这个图表就达到了{zy}的状态。
但对那些是可擦,那些不可擦,是一个很主观的判断。需要很多练习和对人的视觉的理解。我们在此应用一个例子,通过对数据墨水的概念做一个实际的应用,来探讨一下这过程中平衡的掌握。
下面是在北京统计局网站找到的一个统计图。我们来通过数据墨水来分析一下这个图表的可改进点。
我想每个人{dy}次看到这个图表,注意力都会很自然地被吸引到很浓重的背景色去。从数据墨水的角度分析,背景色是xx的非数据墨水。它没有显示任何有用的信息,反而占用了读者宝贵的注意力。首先是应该去掉的。
其它还有以下的非数据墨水问题:
1. 图中的Legendxx没有必要。因为图表只显示了一组数据,同时已经在标题上显示了。如果我们把它擦掉,不会损失如何信息。
2. 折线下面有一点阴影。也是非数据墨水性质的。
3. 图里的格线也有一些过多,可以适当减弱。
因为不知道这个图所用的工具,我们不能一步一步的显示每一种改变的效果。下图是一个用StyleScope重新实现的图表。
在这个图里,还做了一个小的改动。零的格线做了一点小的加深。这样可以比较容易的判断数据是正还是负。总体来讲,数据所占的比重比原来大了很多。{dy}眼不会再把读者吸引到和数据无关的部分去。
其实对减低非数据墨水的概念,并不是没有争议的。很多BI厂家以做出绚丽的图形为荣,而不太多的考虑图表的有效性。我们建议在实际操作中{zh0}能达到一个平衡。在不影响数据的显示的情况下,图表的美观确是需要做的尽量好。但前提是美观的外表不影响的数据的{zh0}的表达。