数据可视化

余凌 胡昌龙 严庆 田萌

目录

  • 1 数据可视化概述
    • 1.1 思政导读
    • 1.2 数据可视化基础
    • 1.3 数据可视化作用
    • 1.4 数据可视化的目标
    • 1.5 数据可视化的特征与应用
    • 1.6 本章课件
    • 1.7 分享阅读-AaronKoblin人性的艺术表达
  • 2 数据可视化原理
    • 2.1 思政导读
    • 2.2 视觉
    • 2.3 色彩
    • 2.4 视觉编码原则
    • 2.5 数据可视化流程
    • 2.6 本章课件
    • 2.7 分享阅读-
  • 3 数据可视化图表
    • 3.1 思政导读
    • 3.2 理解图表
    • 3.3 图表元素的增强控制
    • 3.4 图表类型选择
    • 3.5 图表制作技巧
    • 3.6 本章课件
    • 3.7 数据可视化图表基础及图表设计+第二次作业要求
    • 3.8 分享阅读-
  • 4 数据可视化设计
    • 4.1 思政导读
    • 4.2 设计原则与技巧
    • 4.3 可视化设计步骤
    • 4.4 可视化框架
    • 4.5 本章课件
    • 4.6 分享阅读-
  • 5 时变数据可视化
    • 5.1 思政导读
    • 5.2 时间属性的可视化
    • 5.3 地理空间数据可视化
    • 5.4 文本与文档可视化
    • 5.5 本章课件
    • 5.6 分享阅读-
  • 6 数据挖掘与数据处理
    • 6.1 思政导读
    • 6.2 数据
    • 6.3 数据集
    • 6.4 数据获取与预处理
    • 6.5 数据存储
    • 6.6 数据组织与管理
    • 6.7 数据挖掘与分析
    • 6.8 本章课件
    • 6.9 分享阅读-
  • 7 数据可视化工具
    • 7.1 Echarts
    • 7.2 Python集成开发环境Jupyter
    • 7.3 本章课件
  • 8 数据可视化评测实例
    • 8.1 案例1
    • 8.2 案例2
    • 8.3 本章课件
  • 9 数据可视化趋势及挑战
    • 9.1 思政导读
    • 9.2 数据可视化资源
    • 9.3 数据可视化研究
    • 9.4 未来趋势
    • 9.5 研究挑战
    • 9.6 本章课件
  • 10 数据可视化案例
    • 10.1 经典数据可视化案例
    • 10.2 用Excel实现数据可视化—快速实现业务报表可视化
    • 10.3 “好服务”零售品牌文献研究现状分析
    • 10.4 数据分析师招聘可视化分析
    • 10.5 长江中游城市群创新网络演变可视化
    • 10.6 分享阅读-2020级优秀作品展示
    • 10.7 分享阅读-2021级学生优秀作品
  • 11 电子商务数据可视化实例
    • 11.1 电商数据的采集与预处理
    • 11.2 商品数据分析
    • 11.3 市场数据与竞争数据分析
    • 11.4 流量与转化数据分析
    • 11.5 电商采购与销售数据分析
    • 11.6 库存数据分析
    • 11.7 客户画像分析
  • 12 推荐课外阅读
    • 12.1 《深度学习——智能时代的核心驱动力量
    • 12.2 《AIGC:智能创作时代》
    • 12.3 《天才与算法》
    • 12.4 《5000天后的世界》
    • 12.5 《AI未来进行式》
    • 12.6 《数据型思维》
    • 12.7 《做成大事的艺术》
    • 12.8 《新媒体的语言》
    • 12.9 《开放式创新》
    • 12.10 《别相信直觉》
    • 12.11 《为什么伟大不能被计划》
    • 12.12 《智识分子》
    • 12.13 《算法的陷阱》
    • 12.14 《崛起的超级智能》
    • 12.15 《人工不智能:计算机如何误解世界》
    • 12.16 《销售脑科学》
地理空间数据可视化

地理空间数据可视化表达运行可以帮助用户发现蕴含于地理空间数据中的难以直接发掘的规律,可以将想象力信息结合起来。地理空间信息要能被计算机所接受和处理就必须转换为数字信息存入计算机中。这些地理空间数据对于计算机来说是可识别的,但对于人的肉眼来说是不可识别的,必须将这些地理空间数据转换为人眼可识别的地图图形才具有实用的价值。

地理空间数据可视化是近代计算机科学与雷达、电视及图像处理技术的发展汇合而产生的硕果,相关可视化图形有泡沫图、河滨图等。

5.2.1地图投影

地图映射,是将数据中的地理坐标转换成屏幕上的坐标。按照曲面映射过程中的优化目标区分,地图映射主要包含以下三种类型:

1)等角度(正形投影):源曲面和目标曲面(即投影前后)任何位置的局部切向和法向方向组成的角度保持不变

2)等面积:地图上任何图形面积经主比例尺放大以后与实地上相应图形面积大小保持不变

3)等距离:在标准经纬线上无长度变形,即投影后任何点到原点的距离保持不变

5.2.2点数据的可视化

点数据描述的对象是地理空间中离散的点,具有经度和纬度的坐标,但不具备大小尺寸。最直接可视化点数据的方法:根据坐标直接标识在地图上。圆点是最常用的标识符号。

其它标识符号:向量箭头、六边形蜂窝网格

5.2.3线数据的可视化

线数据通常指的连接两个或更多点的线段或者路径,具有长度属性、连接关系。线数据可视化的基本思路:构建网格反映图的连接关系、控制点网格的边、安排路径寻找一系列控制点。

5.2.4区域数据的可视化

等值线图又称轮廓线图,计算方法为:等值线抽取(真实数据的采样)和距离场计算(所属区域中心的距离)。

Choropleth地图(等值区间地图)可视化:假设数据的属性在一个区域内部平均分布,因此一个区域用同一种颜色来表示其属性(Choropleth地图最大的问题在于数据分布和地理区域大小的不对称)

输入:平面多边形网格和每个区域对应的数值

目标:使变形后每个网格多边形的面积和数值成正比;最小化形状误差和面积误差的空间优化问题

CartoDraw方法:采样扫描线算法逐渐调整多边形的顶点位置,允许交互控制形变,最小化两个误差

多元关系地图:为了显示地理空间不同位置上的区域属性直接的多元关系,可以采用连线、集合等方法表达(城市的住宅区属于同一类物业,城市的绿地则属于公共区域)

5.2.5地理信息可视化的应用

1)地球与生存环境

人类长期以来对地球和周遭自然环境进行观测来研究和了解自己生存的自然空间,科学家们也通过建立数学模型来模拟环境的变化。这些观测和模拟得到的数据通常包含了地理空间中的位置信息,因此自然需要用到地理信息可视化来呈现数据,最常见的是与气象相关的数据。

2)城市与日常生活

关注人类活动的地理分布,以及赖以生存的城市和地区中的各种相关信息,通过获取并理解这些数据,不但能帮助我们更好地安排日常生活,更能推动城市的有效运转。

3)地理时空数据

包括地理空间的位置,也包括随时间变化的信息,称为地理时空数据。针对这类数据,可视化需要揭示空间与时间之间的变化,因此常用的可视化方法是顺序动画。

4)复杂地理数据的可视分析

地图是地理空间信息的载体,可以承载各种类型的复杂信息,形成多重语义地图。对这类地图的理解、探索与发现需要结合可视化与分析方法。例如,经济合作与发展组织(OECD)的地区数据包括了人口分布、经济、就业市场、教育、医疗保健和环境等30多项指数。对各地去的相关指数进行分析,发现潜在的模式,需要一个不仅支持地理信息可视化,更支持对多变量数据分析的可视化系统。OECDRegionalExplorer提供了多个同步链接的视图,让分析师通过不同的视图来观察数据中不同变量的分布和关联。同时OECDRegionalExplorer作为一个在线系统,还提供了非常方便的使用模式和直观的用户交互。

5.2.6地理信息可视化的其他挑战

1)地图标注

地图标注指如何将文字或图形的标识合理地放置在地图上。标注与对应的地理物体的相对位置的布局,要避免标注之间相互重叠的情况。为实现标注布局的优化,有各种不同的近似解法被提出,如基于规则的穷举搜索、贪婪算法、线性规划和进化算法等。另外,随着在线互动地图的出现,在用户交互的过程中根据当前的缩放比例和视点实时地选择合适的标识布局也带来了新的研究课题。

2)地图综合

在很多情况下,根据不同的需求,需要对同一个区域绘制大尺寸的详图或者小尺寸的简图。由于空间的限制,在全国地图上无法显示像街区地图那样详细的信息。地图综合研究如何根据地图的显示尺寸对地图中的信息进行筛选和绘制的问题。

3)在线地图

随着在线应用的普及,如何通过网络传输地图信息,并实时绘制地图成为非常重要的课题。制作在线地图比传统的手工制作图更具有挑战性的是可扩展性问题,如何通过网络的有限带宽和计算资源提供用户和地图之间的实时互动。这里分两种情形:如何在用户移动地图或缩放时,实时刷新地图;如何让地图基于流数据实时更新。普遍做法是将地图分层分块,根据用户当前的地图坐标和缩放层级,从地图服务器里快速的索取相应的地图块。