目录

  • 1 绪论
    • 1.1 课前学习要求
    • 1.2 什么是统计学
    • 1.3 为什么要学习统计学
    • 1.4 描述性统计和推断性统计
    • 1.5 无处不在的统计学
    • 1.6 第一章课后作业
  • 2 数据产生
    • 2.1 课前学习要求
    • 2.2 基本概念
    • 2.3 数据来源
    • 2.4 随机性和抽样误差
    • 2.5 数据类型
    • 2.6 数据还能“撒谎”?
    • 2.7 第二章课后作业
    • 2.8 统计报告案例阅读
  • 3 数据展示
    • 3.1 课前学习要求
    • 3.2 数据预处理
    • 3.3 数据整理
    • 3.4 数据展示
    • 3.5 统计图表的使用
    • 3.6 数据可视化
    • 3.7 第三章课后作业
  • 4 数据描述
    • 4.1 课前学习要求
    • 4.2 数据分布特征描述
    • 4.3 相关和因果
    • 4.4 第四章课后作业
  • 5 概率论
    • 5.1 课前学习要求
    • 5.2 什么是概率
    • 5.3 离散型随机变量
    • 5.4 连续性随机变量
    • 5.5 中心极限定理的百年
  • 6 统计推断
    • 6.1 课前学习要求
    • 6.2 抽样分布
    • 6.3 大数定律和中心极限定理
    • 6.4 数值型数据统计推断
    • 6.5 假设检验
    • 6.6 品质数据统计推断
  • 7 统计指数
    • 7.1 课前学习要求
    • 7.2 基本概念
    • 7.3 总指数
    • 7.4 指数体系
    • 7.5 常用经济指数
数据可视化

数据可视化是数据描述的图形表示,旨在一目了然地揭示数据中的复杂信息。可视化的美丽之处在于其艺术设计,细节的优雅展示,能够有效地产生对数据的洞察和新的理解[1]。现实生活中我们经常看到数据可视化作品,演讲、报告中的统计图表,任何避免歪曲数据的精美设计图表都是可视化的最佳作品。数据可视化是为了一下吸引住阅读者的注意力,并从中得到重要信息,可以帮助我们理解数据背后的意义。

数据可视化是一门艺术。图1是截至2021年4月3日世界新冠肺炎确诊和死亡人数可视化、可交互的全球疫情地图[2]

                             

图1  全球新冠肺炎确诊和死亡人数地图

1的左侧展示了全球累计确诊数据,下面是从多到少排序后的各个国家、地区的确诊数据,中间是以全球地图为背景的累计病例气泡图,可以按比例尺放大或缩小地图看到不同国家或地区的具体情况,也可以点击下面的发病率、致死率和检测率查看相应数据。右侧数据则显示了全球死亡数据,排序后的各国、地区的死亡数据及美国的检测结果。右下角显示了依时间序列显示的每日发病、死亡病例的柱形图以及累计发病、累计死亡、发病人数对数值的折线图。数据不但是实时更新的,也是可以交互的,用户也可以按照自己的喜好更换不同版式的地图。

来看几幅有特色的统计图,精美设计的图胜过千言万语,甚至有些图不需要多余的解释也能看懂。

 


图2 北上广餐厅数量分布[3]

 


图3 小吃排行[4]

此外,针对统计图展示组别过多时影响阅读,比如展示近20年国内各省地区生产总值的变化图、世界主要城市近60年的人口数等,一般可以采用动态方法展示,可以使用Flourish进行展示[5]


数据可视化改变了传统统计图呈现方式单一的缺陷,实现数据重要信息的有效传达,融合艺术性和功能性,通过多样、恰当且精细的设计,以交互方式或动态展现数据特征、规律。请记住一点,只有在不歪曲、不扭曲结论的情况下进行展示是基本前提。


[1]有兴趣的同学可以参阅:Julie Steele, Noahlliinsky . 数据可视化之美. 机械工业出版社, 2011.

 [2]图片来源:约翰·霍普金斯大学疫情地图,https://coronavirus.jhu.edu/map.html

[3]统计图来源:https://zhuanlan.zhihu.com/p/30377997

[4]统计图来源:https://zhuanlan.zhihu.com/p/360707683

[5] https://app.flourish.studio/