1 伦敦霍乱(1854)与约翰·斯诺的死亡地图
18世纪60年代,工业革命在英国拉开序幕,蒸汽机车的喇叭声催动着英国全方位的工业化,也迫使农村人口不断涌入城市。19世纪中期的英国首都伦敦,是当时世界上工业化程度最高的城市,也是当时世界上人口最多、增长最快的城市—在18世纪早期,伦敦人口有50万人左右;到19世纪初,人口在100万左右;但到1858年,伦敦的人口已经达到了250万。
工业化虽然带来了更高级的技术和更便捷的生活,却没有为这座城市带来更优雅的城市环境。在工业发达的盛名之下的伦敦实则是一个脏乱拥挤的城市,卫生基础建设远远滞后于工业化进程。如果说在曾经工业化前的城市人口下还能勉力为之,那当伦敦的城市系统面对倍增的城市人口时已经无以为继:垃圾堆满街道、老鼠跳蚤横行、泰晤士河恶臭难闻。
恶劣的城市卫生环境带来了流行病的肆虐。各种流行病导致19世纪中期英国城市的死亡率相较于世纪初翻了一倍,而霍乱正是罪魁祸首,时至今日,即便医疗技术手段得到极大提升,霍乱依旧是全球非常严重的烈性传染病之一。19世纪的伦敦,每次霍乱爆发都会导致数百人的死亡,但更可怕的是,人们不但对霍乱束手无策,甚至不能明确霍乱如何产生、如何扩散。在当时,微生物致病的观念还不为大家所接受,显微镜技术也不成熟,但人们对街道上弥漫着的恶臭空气都有真切的体验。因此,平民和绝大多数专家都相信这种臭气是由腐烂物质构成的有毒蒸汽会引起疾病。19世纪中期,伦敦的著名的卫生改革家埃德温·查德威克就是“瘴气学说”的忠实拥趸,他有一句名言:"所有的气味都是疾病(All Smell is Disease)。"一旦霍乱爆发,人们便会归咎于恶臭的空气并对其源头避之不及。
但当时的一位麻醉师约翰·斯诺并不认同这一学说,他发现霍乱患者的呼吸系统没有受到破坏,但却会排出大量脏水粪便,这一发现促使斯诺推断霍乱是被人摄入的,而不是吸入的,而在伦敦1848年的霍乱中,斯诺发现两家自来水公司覆盖地的霍乱死亡率相差10倍之多。结合此前的判断,斯诺认为,霍乱是由某种尚未确定的病原体引起的,患者通过直接接触其他患者的体液,或者更有可能是通过饮用被该废物污染的水而摄入的,与污浊的空气无关。
1854年,伦敦Soho区的宽街附近爆发了一次霍乱。Soho区坐落于伦敦市中心,不可避免地有很多来自污水池、牲畜以及工厂的臭气,因此人们自然而然地将原因归咎于“瘴气”。出于对自己理论的坚信,斯诺孤身一人在宽街挨家走访,记录得病和死亡的病例,并记录他们的生活习惯。斯诺将每个死亡病例都由一个黑色小横线在地图上表示,绘制出了著名的死亡地图(图1)。这张地图有惊人的视觉冲击力,因为地图明确地标示出霍乱死亡病例并不是随机分散在整个Soho区宽街附近,而是仅仅从宽街水泵这个点辐射出去的,其余的水泵周围也并没有病例。
从地图上可以看出,离宽街水泵越近,死亡病例越多;离宽街水泵越远,死亡病例越少。然而斯诺从当局打交道的经验中知道,这种证据是不能说服瘴气专家的。因为这可能说明恰恰是宽街那个水泵蒸发出来毒气,而这附近的人就是在呼吸了毒气后便感染了霍乱。
斯诺继续走访发现,圣詹姆斯济贫院和狮子啤酒厂离水泵都很近,却无人死于霍乱。进行深入调查后,斯诺发现济贫院和啤酒厂都有私人供水管道,且人们都没有喝过宽街水泵的水。而远在郊区的汉普斯特德却有两例死亡病例:一位曾经居住在宽街的老妇和她的侄女。斯诺通过调查发现,由于老妇怀念宽街水泵水的味道,虽并未亲身回到宽街,却一直派遣仆人运送宽街的水到汉普斯特德,而她和她的侄女就在这次霍乱中喝过宽街水泵中的水。
这三个特殊案例的发现,帮助斯诺排除了瘴气的感染,得以确定宽街水泵的水是此次霍乱的源头。斯诺的调查结果和地图成为强有力的证据,得以说服当局在9月7日拆除了水泵把手,杜绝了居民取水的可能。此后霍乱迅速平息。几个月后,人们找到了此次霍乱的源头.宽街疫情爆发前夕,一名女婴死于霍乱。女婴的母亲将洗过婴儿衣物的脏水倒进了污水池,而这个污水池离宽街水泵对应的水井仅三英尺。人们挖掘之后发现,这个污水池的池壁早已损坏,正是这个污水池污染了水井,一切真相大白,水泵一经拆除,周围的感染人数迅速下降,伦敦整体的霍乱疫情也随之迅速的稳定了下来。自此之后,霍乱病的水源说假设终于让人毋庸置疑,斯诺医生的光辉故事也永载史册。

图1 伦敦鬼图
2 伦敦地铁系统交通图
对于当今的我们,每天乘坐地铁都可以容易地在地铁线路图中找到所乘线路和换乘路线,但它并不是一张真正的地图,而是一张图表,因为它根本无法准确反映伦敦的真实地理位置——但它清晰的彩色线条和曲线塑造了无数人想象伦敦的方式。
现在世界上大多数地铁都采用这种地铁线路图的样式图,但在当时,这样一张革命性的地铁线路图的诞生却没那么简单,这一切归功于哈里·贝克(Harry Beck),一位英国工程师。随着时间更迭,该地图已经从仅有首都的第一条铁路发展到一个不断覆盖新线路的综合可视化网络图。在今天,伦敦地铁交通路线图以各种各样的形式出现在乘客的视线中,但这张标志性地图的故事却鲜为人知。
第一张地图:
伦敦的第一张公共交通地图由分别在19世纪60年代、70年代建立的大都会和大都会区铁路公司制作。这些地图显示了服务时间和公交车的站点,也包括旅游景点,地图上能显示乘客相对于街道的位置。但随着地铁在19世纪末随着新线路的开通而扩展,地图必须涵盖更多方面的信息,因此开始了第一次修改。

图2 第一张铁路地图,1899年版
1908年,伦敦地铁局制作了一张地图,来宣传其地铁公交的综合系统。这张标准地图以海报和袖珍地图的形式印刷,来作为地铁指南,为乘客提供帮助。然而,由Underground Group公司制作的地图及其后续地图导致每条线的末端导致中心区域非常拥挤,难以阅读。
1926年,一位名叫Fred Stingemore的地图制作者通过修改车站之间的间距来改善前面的问题,并对其进行了一些艺术化的改善,最终得到了一张不再代表伦敦真实地形的路线图。 新地图不仅更整洁,而且具有社交功能。在地图上,类似埃奇韦尔和里士满的边远车站距离伦敦市中心只有极短的距离,从而促进了伦敦市中心和郊区之间的社区融合。但是这张地图无法很好的呈现地铁系统的边缘地区:贝克卢、大都会和地区线会在边缘被切断。

图3 UERL发行的袖珍地下地图,1908年
我们今天知道的第一张地铁图的作者是Harry Beck,他曾是地铁管理局(UERL)的一名工程绘图员,但由于UERL资金紧张,1928年,贝克失去了在地铁的工作。但他对伦敦的交通系统保持着浓厚的兴趣,后来他开始私下整理地铁地图——“拉直线路,尝试对角线构图并调整车站之间的距离”。1931年,他根据这些原则完成了他的第一张地铁地图:相较于外围区域相对于外围区域,密集的中心部分被放大,这才使两者都能更清晰地。该地图摒弃了传统的地理准确性,旨在让乘客更快速、更简单地了解网络。它只使用水平线、垂直线和45º线,而地下线则由一组标准颜色表示。贝克的想法最初被地铁宣传部门拒绝,但贝克并没有放弃,第二年他再次尝试将其发送给UERL,这一次对方同意以10英镑来购买他的革命性设计。

图4 1933年贝克绘制的地铁线路图
在准备出版地图的过程中,贝克做了一些调整,特别是使站名更加突出,并用现在熟悉的矩形“记号”代替了代表站的圆形“斑点”,经过修改后于1933年制作了一个试用版本的袖珍地图(图4),结果一炮而红——首发印出的75万张一个月就销售一空。
伦敦地铁地图是国际公认的卓越图形和信息设计的典范。许多其他城市的铁路,包括纽约、悉尼和圣彼得堡地铁,都借鉴了贝克的概念来制作线路图。2006年,在BBC电视台的节目《探索英国伟大设计作品》中,贝克的地图位列英国伟大设计作品的第二名。共有超过20万的观众参与评选,而参选的作品中包括了迷你裙、E型捷豹以及甲壳虫专辑《佩珀中士》的封面等引人注目的设计。
贝克设计的这版地铁线路图改变了自地图诞生以来的历史面貌,开创了现代地图新模式。如今,它不仅是伦敦的一种象征,也成为了世界各地交通地图的模板,影响着全球众多的地铁图设计,同时也启发了当时众多的艺术家与设计师。地铁线路图设计伟大的前世带来了辉煌的今生。
3 玫瑰图-南丁格尔
南丁格尔(Florence Nightingale)是我们耳熟能详的“提灯女士”,她不仅是现代护理的鼻祖及现代护理专业的创始人,而且是历史上使用极坐标面积图的先驱,南丁格尔在数据可视化领域的独特贡献是她被称为“coxcomb”或“rose”的图表。这种图形外形如玫瑰,因此后来也称之为玫瑰图,其主要构思是用“花瓣”的面积表示统计数值的大小。
19世纪50年代,英国、法国、土耳其和俄国进行了克里米亚战争。南丁格尔主动申请,自愿担任战地护士。当时的医院卫生条件极差,甚至连干净的水源与厕所都没有,伤病士兵死亡率高达42%,直到1855年卫生委员会来到医院改善整体的卫生环境后,死亡率才陡然地降至2.5%。当时的南丁格尔注意到这件事,认为政府应该改善战地医院的条件来拯救更多年轻的生命。出于对资料统计的结果会不受人重视的忧虑,她发明出一种色彩缤纷的图表形式,让数据能够更加让人印象深刻,图5就是南丁格尔报告这件事时所用的图表,以表达军医院季节性的死亡率,从整体上来看:这张图是用来说明、比较战地医院伤患中英国军队自1854年4月至1856年3月的逐月死亡人数,每块扇形代表着各个月份中的死亡人数,面积越大代表死亡人数越多。

其中,右图为1854年4月至1855年3月的死亡人数,左图为1855年4月至1856年3月的死亡人数。玫瑰图不仅清楚展示了这两年军队死亡人数的变化,而且更重要的是,她将每个月的三种死亡情况也分别用不同颜色标记出来:蓝色表示死于可预防的疾病、红色表示死于战争伤害、黑色表示死于其它原因。这样我们可以清楚知道军队伤亡原因的结构,尤其是“绝大多数士兵死于可预防的疾病”(图中最高的花瓣)。凭借这一条重要信息,她让英国政府意识到,真正影响战争伤亡的并非战争本身,而是由于军队缺乏有效的医疗护理。
南丁格尔的重大贡献在于使得英国政府意识到真正影响战争伤亡的并非战争本身,而是由于军队缺乏有效的医疗护理,导致大量的士兵死于可预防的疾病。英国卫生部部长称:对于某些传染病的死亡“实际上是不可避免的”。但南丁格尔并不认同,她的“玫瑰图”像一场向外辐射的爆炸,粉碎了高官的这一主张,并呼吁政府采取更多行动。1857年,在她的努力下,英国皇家陆军卫生委员会成立。同年,军医学校成立。最终在玫瑰图的广泛传播的助力下,南丁格尔成功说服政府,相信”缺乏有效护理是导致非战斗死亡的主要原因“,开始对战地医疗条件改善和建立护理制度进行投入。
4 拿破仑远征图:
1812年6月24日,拿破仑率领的691,501人的大兵团——同时也是欧洲历史上集结的最大规模的部队—开赴莫斯科。但等他们到达那里,看到的只是一座空城。城里的人都被遣散,所有的供给也被中断。由于没有正式的投降,拿破仑觉得俄国人从他那剥夺了一场传统意义上的胜利。
因此军队不得不撤退,在归程中,因为天气过于恶劣,给军队提供补给几乎是不可能的。马匹因为缺少粮草而变得虚弱,所有的马要么饿死,要么被饥饿的士兵拿去果腹。没有了坐骑,法国骑兵们成了步兵,大炮和马车被迫丢弃,部队没了装甲。饥饿与疾病带来惨重的伤亡,而逃兵数目也直线上升。大军团的小分队在维亚济马和波洛茨克也被俄国人击溃。法国军队在渡贝尔齐纳河时遭到俄军两面夹击,伤亡惨重,这也是法军在俄国遭遇的最后一场灾难。1812年12月14日,大军团被驱逐出俄国领土。在这场远征俄罗斯的战役中,拿破仑的士兵只有大约22,000人得以幸存。

图6 拿破仑远征图
这一历史事件被Charles Joseph Minard用一张二维平面图形记录了下来,Minard是一位法国工程师,他以在工程和统计中应用图形而闻名。图6就是他的著名作品:在一张二维图形中,他成功地展示了如下信息:
1.军队的位置和前进方向,以及一路上军队的分支和汇合情况
2.士兵数目的减少(图形顶端最粗的线条表示最初渡河的422,000人,他们一路深入到俄国领土,在莫斯科停下来的时候还有100,000人左右。从右到左,他们朝西走回头路,渡过Niemen河的时候,仅仅剩下10,000。随着大部队和余部会师(比如在渡贝尔齐纳河之前),图中显示的数字降中也有升)
3.撤退时的气温变化(参见图的下半部分,可知当时气候条件极其恶劣)
这幅图形在统计图形界内享有至高无上的地位,被Edward Tufte(统计图形和信息可视化领域的领军人物,人称“数据达芬奇”)称为“有史以来最好的统计图形”。为何这张图能被Edward Tufte如此称赞,首先,这个图形非常直观,只需要简单告诉读者条形区域的宽度代表行军人数,就能很快阅读到该图的主要含义,这是所有优秀统计图形最重要的特点。其次,信息量丰富,所谓“一图胜千言”,用一张简单的二维图形展现了丰富的数据信息,比起文字描述要方便得多。如果同时满足这两个条件,一定会是好的统计图形。如果只满足第二个条件的话,在使用的过程中要注意场合,如果刻意地去追求图形中信息量的丰富,而使图形变得不直观,甚至造成误导,是得不偿失的事情。强行使用图形在很多时候甚至还不如直接用文字或者表格进行描述,真正优秀的可视化图形一定是直观的,这张100多年前的拿破仑远征图就是典型的例子。
5 时变数据可视化:
时间通常被认为是一种主观上的体验,然而在可视化中,时间却成了一个结构化的维度。时间是一个非常重要的属性及维度,它可以帮助我们构筑稳健而直观的可视化框架,帮助我们动态地看待各个事件的发展。事物都是随着时间变化的,因此时间维度,就代表着一个历史,代表着一种过程,从宏观的角度来看,时间就代表着过去、现在和未来。随着时间变化或者带有时间相关属性的数据,我们通常称为时变型数据,时变型数据主要有以时间轴排列的时间序列的数据,比如零售企业销售数据、股市交易数据、传感器的监测数据等。也有不以时间为变量的,但是其也拥有一定的顺序,如DNA测序、化学质谱等,这类数据可以将变化的顺序作为时间轴来处理。上述两种数据类型都是有序型数据。时变型数据在实际生活以及各个领域中已经应用非常广泛,从人口数量的增长规律到企业业务中年报月报的制作,再到日常的销售趋势等,我们都能感受到时间线的身影。下面简单介绍几种常见的时间序列数据图:
1)折线图:
折线图是表示时间序列数据的最简单的方法。优点是直观、易于制作。折线图使用将各个数据点用线进行连接来显示因变量和自变量的变化。顾名思义,自变量不受其他参数的影响,而因变量取决于自变量的变化方式。对于时间可视化,时间始终是自变量,绘制在水平轴上。然后将因变量绘制在垂直轴上。

上图欧洲和爱尔兰的人口是因变量,时间是自变量,该图表记录了从1740年到2010年左右欧洲和爱尔兰的人口增长情况。它直观的显示了1840年代爱尔兰人口的骤然下降,我们从历史书中可以了解到这是爱尔兰马铃薯饥荒导致恶果,
另一方面,该图对其两个因变量(欧洲和爱尔兰的人口)使用了不同的y轴刻度。如果不注意两边Y轴的差异,可能会得出这样的结论:直到1920年左右,欧洲的人口才超过了爱尔兰的人口。
因此我们在使用折线图是,要注意变量的刻度和表示的内容,如果需要在折线图上呈现多个变量,就应对所有因变量使用相同的y轴以避免混淆。如果难以统一,可以按照上图所示使用不同的颜色来表示两个Y轴线。最后,在绘制折线图时,变量数量尽量不要超出4个,这样会导致每个轴刻度变得难以区分和理解。
2)流图
流图看起来像流动的液体,因而得名为流图。流图本质上是堆积面积图的另一种形式,但流图是围绕中心水平轴来移动的。下图是一个音乐领域的流图,改图显示了随机选择的听众的last.fm音乐收听习惯随时间的变化。

流图非常适合用来表示和比较多个变量的时间序列数据。因此,流图多适用于大型数据集的描述。但在绘制流图时,颜色的选择非常重要,尤其是有很多变量时,如果颜色选择不当,数值较低的变量可能会高数值变量淹没。
3)热图
热图在地理空间可视化方面应用较为广泛,因为它们可以快速帮助识别重点地区或给定变量的高浓度区域。若想要了解时变可视化,热图是必不可少的,因为热图可以显示二维数组中的两个时间序列。
下图显示了1973年至1999年间在美国出生的婴儿的生日。纵轴代表一个月中的31天,横轴代表一年中的12个月。从这张图表中,我们可以发现大部分新生婴儿实在7月、8月和9月下旬出生的。
热图一般适用于两层时间框架,例如,将每一周的7天放在在一年的52周中,或者将每一天的24小时放在在一个月的30天中进行变量表示。热图相较于折线图和条形图等基本图形来说更具视觉冲击力,但在热图中只能显示一个变量,两个或多个变量之间的比较难以完美地呈现,所以图表形式的选择要取决于实际的应用情况。


