课程门户-章节详情

余凌胡昌龙严庆田萌

1 数据可视化概述
- 1.1 思政导读
- 1.2 数据可视化基础
- 1.3 数据可视化作用
- 1.4 数据可视化的目标
- 1.5 数据可视化的特征与应用
- 1.6 本章课件
- 1.7 分享阅读-AaronKoblin人性的艺术表达
2 数据可视化原理
- 2.1 思政导读
- 2.2 视觉
- 2.3 色彩
- 2.4 视觉编码原则
- 2.5 数据可视化流程
- 2.6 本章课件
- 2.7 分享阅读-
3 数据可视化图表
- 3.1 思政导读
- 3.2 理解图表
- 3.3 图表元素的增强控制
- 3.4 图表类型选择
- 3.5 图表制作技巧
- 3.6 本章课件
- 3.7 数据可视化图表基础及图表设计+第二次作业要求
- 3.8 分享阅读-
4 数据可视化设计
- 4.1 思政导读
- 4.2 设计原则与技巧
- 4.3 可视化设计步骤
- 4.4 可视化框架
- 4.5 本章课件
- 4.6 分享阅读-
5 时变数据可视化
- 5.1 思政导读
- 5.2 时间属性的可视化
- 5.3 地理空间数据可视化
- 5.4 文本与文档可视化
- 5.5 本章课件
- 5.6 分享阅读-
6 数据挖掘与数据处理
- 6.1 思政导读
- 6.2 数据
- 6.3 数据集
- 6.4 数据获取与预处理
- 6.5 数据存储
- 6.6 数据组织与管理
- 6.7 数据挖掘与分析
- 6.8 本章课件
- 6.9 分享阅读-
7 数据可视化工具
- 7.1 Echarts
- 7.2 Python集成开发环境Jupyter
- 7.3 本章课件
8 数据可视化评测实例
- 8.1 案例1
- 8.2 案例2
- 8.3 本章课件
9 数据可视化趋势及挑战
- 9.1 思政导读
- 9.2 数据可视化资源
- 9.3 数据可视化研究
- 9.4 未来趋势
- 9.5 研究挑战
- 9.6 本章课件
10 数据可视化案例
- 10.1 经典数据可视化案例
- 10.2 用Excel实现数据可视化—快速实现业务报表可视化
- 10.3 “好服务”零售品牌文献研究现状分析
- 10.4 数据分析师招聘可视化分析
- 10.5 长江中游城市群创新网络演变可视化
- 10.6 分享阅读-2020级优秀作品展示
- 10.7 分享阅读-2021级学生优秀作品
11 电子商务数据可视化实例
- 11.1 电商数据的采集与预处理
- 11.2 商品数据分析
- 11.3 市场数据与竞争数据分析
- 11.4 流量与转化数据分析
- 11.5 电商采购与销售数据分析
- 11.6 库存数据分析
- 11.7 客户画像分析
12 推荐课外阅读
- 12.1 《深度学习——智能时代的核心驱动力量
- 12.2 《AIGC：智能创作时代》
- 12.3 《天才与算法》
- 12.4 《5000天后的世界》
- 12.5 《AI未来进行式》
- 12.6 《数据型思维》
- 12.7 《做成大事的艺术》
- 12.8 《新媒体的语言》
- 12.9 《开放式创新》
- 12.10 《别相信直觉》
- 12.11 《为什么伟大不能被计划》
- 12.12 《智识分子》
- 12.13 《算法的陷阱》
- 12.14 《崛起的超级智能》
- 12.15 《人工不智能：计算机如何误解世界》
- 12.16 《销售脑科学》

数据可视化流程

2.5.1数据可视化流程简介

数据可视化不是简单的视觉映射，而是一个以数据流向为主线的一个完整流程，主要包括数据采集、数据处理和变换、可视化映射、用户交互和用户感知。一个完整的可视化过程，可以看成数据流经过一系列处理模块并得到转化的过程，用户通过可视化交互从可视化映射后的结果中获取知识和灵感。通用的数据可视化流程模型如图2-31所示。

图2-31通用的数据可视化流程模型

2.5.2可视化流程模型

（1）线性模型

基于1990年RobertB.Haber和DavidA.McNabb提出的线性模型，我们可以绘制可视化线性流程模型，如图2-32所示。

图2-32可视化线性流程模型

这个处理模型非常先进，整个流程是线性的。它把数据分成五大阶段，分别要经历四个流程，每个过程的输入是上一个过程的输出。从图上看非常直观，很好理解。

（2）嵌套模型

另一种模型是嵌套模型，如图2-33所示。

图2-33嵌套模型

嵌套模型的上半部分基本上就是我们之前说的分析、处理两步，下半部分是对可视化结果的各类验证。本质上就是一个验证加迭代的过程。

（3）循环模型

我们知道很多事都不是一蹴而就的，需要不断迭代，所以有人提出了循环模型。循环模型的两张图其实都是把线性模型首尾连起来，如图2-34所示。

图2-34循环模型

（4）目前应用最广的模型

对比之前的线性模型，其实也很类似，不过其在最后加入了用户交互的部分，且让每个步骤都变成了循环的。这是目前应用最广的可视化流程模型，后继几乎所有著名的信息可视化系统和工具都支持、兼容这个模型。如图2-35所示。

图2-35目前应用最广的模型

2.5.3数据可视化流程的实施步骤

可视化整体可分为三步：分析-处理-生成。在这里只做简要介绍，具体实施会在后文详细介绍。

（1）分析

进行一个可视化任务时，我们首当其冲的当然是要分析，分析又分为三部分：任务、数据、领域。

首先，我们要分析我们这次可视化的出发点和目标是什么。我们遇到了什么问题、要展示什么信息、最后想得出什么结论、验证什么假说等等。数据承载的信息多种多样，不同的展示方式会使侧重点有天壤之别。只有想清楚以上问题，才能确定我们要过滤什么数据、用什么算法处理数据、用什么视觉通道编码等等。

其次，我们要分析我们的数据，这是至关重要的一步。因为每次可视化任务拿到的数据都是不同的，数据类型、数据结构均有变化，数据的维度也可能成倍增加。抽象的数据类型如何对应现实中的概念，不同的数据类型如何进行视觉编码，这些我们在下一篇数据模型中进行介绍。

最后，我们针对不同的领域，也要进行相应的分析。毕竟术业有专攻，可视化的侧重点要跟着领域做出相应的变化。

（2）处理

处理可以分为两部分：对数据的处理和对视觉编码的处理。

①数据处理

在可视化之前我们要对数据进行数据清洗、数据规范、数据分析。

数据清洗和规范是必不可少的步骤。首先把脏数据、敏感数据过滤掉，其次再剔除和我们目标无关的冗余数据，最后调整数据结构到我们系统能接受的方式。

数据分析中最简单的方法当然是一些基本的统计方法，如求和、中值、方差、期望等等；复杂的方法有数据挖掘种的各种算法，这是又一个领域了，在此不赘述。

最后的可视化结果中我们肯定不可能把所有的数据统统展示出来，于是又涉及到包括标准化（归一化）、采样、离散化、降维、聚类等数据处理的方法，这些概念之后可以单独写篇文章来介绍。

②设计视觉编码

视觉编码的设计是指如何使用位置、尺寸、灰度值、纹理、色彩、方向、形状等视觉通道，以映射我们要展示的每个数据维度。在视觉编码2.3小节有所提及。

（3）生成

这个阶段基本上就是把之前的分析和设计付诸实践，在制作或写代码过程中，再不断调整需求、不断地迭代（有可能要重复前两步），最后产出我们想要的结果。

图片预览