数据可视化

余凌 胡昌龙 严庆 田萌

目录

  • 1 数据可视化概述
    • 1.1 思政导读
    • 1.2 数据可视化基础
    • 1.3 数据可视化作用
    • 1.4 数据可视化的目标
    • 1.5 数据可视化的特征与应用
    • 1.6 本章课件
    • 1.7 分享阅读-AaronKoblin人性的艺术表达
  • 2 数据可视化原理
    • 2.1 思政导读
    • 2.2 视觉
    • 2.3 色彩
    • 2.4 视觉编码原则
    • 2.5 数据可视化流程
    • 2.6 本章课件
    • 2.7 分享阅读-
  • 3 数据可视化图表
    • 3.1 思政导读
    • 3.2 理解图表
    • 3.3 图表元素的增强控制
    • 3.4 图表类型选择
    • 3.5 图表制作技巧
    • 3.6 本章课件
    • 3.7 数据可视化图表基础及图表设计+第二次作业要求
    • 3.8 分享阅读-
  • 4 数据可视化设计
    • 4.1 思政导读
    • 4.2 设计原则与技巧
    • 4.3 可视化设计步骤
    • 4.4 可视化框架
    • 4.5 本章课件
    • 4.6 分享阅读-
  • 5 时变数据可视化
    • 5.1 思政导读
    • 5.2 时间属性的可视化
    • 5.3 地理空间数据可视化
    • 5.4 文本与文档可视化
    • 5.5 本章课件
    • 5.6 分享阅读-
  • 6 数据挖掘与数据处理
    • 6.1 思政导读
    • 6.2 数据
    • 6.3 数据集
    • 6.4 数据获取与预处理
    • 6.5 数据存储
    • 6.6 数据组织与管理
    • 6.7 数据挖掘与分析
    • 6.8 本章课件
    • 6.9 分享阅读-
  • 7 数据可视化工具
    • 7.1 Echarts
    • 7.2 Python集成开发环境Jupyter
    • 7.3 本章课件
  • 8 数据可视化评测实例
    • 8.1 案例1
    • 8.2 案例2
    • 8.3 本章课件
  • 9 数据可视化趋势及挑战
    • 9.1 思政导读
    • 9.2 数据可视化资源
    • 9.3 数据可视化研究
    • 9.4 未来趋势
    • 9.5 研究挑战
    • 9.6 本章课件
  • 10 数据可视化案例
    • 10.1 经典数据可视化案例
    • 10.2 用Excel实现数据可视化—快速实现业务报表可视化
    • 10.3 “好服务”零售品牌文献研究现状分析
    • 10.4 数据分析师招聘可视化分析
    • 10.5 长江中游城市群创新网络演变可视化
    • 10.6 分享阅读-2020级优秀作品展示
    • 10.7 分享阅读-2021级学生优秀作品
  • 11 电子商务数据可视化实例
    • 11.1 电商数据的采集与预处理
    • 11.2 商品数据分析
    • 11.3 市场数据与竞争数据分析
    • 11.4 流量与转化数据分析
    • 11.5 电商采购与销售数据分析
    • 11.6 库存数据分析
    • 11.7 客户画像分析
  • 12 推荐课外阅读
    • 12.1 《深度学习——智能时代的核心驱动力量
    • 12.2 《AIGC:智能创作时代》
    • 12.3 《天才与算法》
    • 12.4 《5000天后的世界》
    • 12.5 《AI未来进行式》
    • 12.6 《数据型思维》
    • 12.7 《做成大事的艺术》
    • 12.8 《新媒体的语言》
    • 12.9 《开放式创新》
    • 12.10 《别相信直觉》
    • 12.11 《为什么伟大不能被计划》
    • 12.12 《智识分子》
    • 12.13 《算法的陷阱》
    • 12.14 《崛起的超级智能》
    • 12.15 《人工不智能:计算机如何误解世界》
    • 12.16 《销售脑科学》
可视化框架

4.4.1问题刻画层

在第一层中,可视化设计人员采用以人为本的设计方法,与目标用户群相处大量时间,了解目标受众的需求。设计人员首先要了解目标用户的任务需求和数据属于哪个特定的目标领域。在通常情况下,对特定领域工作流程特征的描述是一个详细的问题集或者用户收集异构数据的工作过程。描述务必要细致,因为这可能是对领域问题的直接复述或整个设计过程中数据的描述。在大多数情况下,用户知道如何处理数据,但难以将需求转述为数据处理的明确任务。因此,设计人员需要收集与问题相关的信息,建立系统原型,并通过观察用户与原型系统的交互过程来判断所提出方案的实际效果。

第一层的首要问题是,用户可能根本不需要数据可视化来帮助解决问题。解决方法之一是采访和观察用户,定性地验证任务的实际内容;解决方法之二是调研相关软件或工具中数据可视化方法的实际使用率。

4.4.2数据层

第二层将第一层确定的任务和数据从采用特定领域的专有名词的描述转化为更抽象、更通用的信息可视化术语的描述。将这些不同领域的需求转化为不依赖于特定领域概念的通用任务是可视化设计人员面临的挑战之一。例如,高层次的通用任务分类包括不确定性计算、关联分析、求证和参数确定等。与数据相关的底层通用任务则包括取值、过滤、统计、极值计算、排序、确定范围、提取分布特征、离群值计算、异常检测、趋势预测、聚簇和关联。而从分析角度看,通用任务包括识别、判断、可视化、比较、推断、配置和定位。在数据抽象过程中,可视化设计人员需要考虑是否要将用户提供的数据集转化为另一种形式,以及使用何种转化方法,以便于选择合适的可视编码,完成分析任务。

第二层的主要风险在于选定的任务和数据类型无法解决既定任务目标。检验的关键是由用户测试系统。方法之一是让目标用户试用工具,看工具是否能帮助发现新见解或证实了某些假设;方法之二是以一种长期的局部研究的方式观察并记录用户如何在日常工作中使用系统。

4.4.3编码和交互层

第三层是可视化研究的核心内容:设计可视编码和交互方法。视觉编码和交互这两个层面通常相互依赖。为应对一些特殊需求,第二层确定的抽象任务应被用于指导视觉编码方法的选取。第四层设计与前三个层次匹配的具体算法,相当于一个细节描述的过程。它与第三层的不同之处在于第三层确定应当呈现的内容以及如何呈现,而第四层解决的是如何完成的问题。当然,两层之间相互影响和制约。

第三层的风险是选定的设计方法的视觉编码效果不佳。第一种方法是根据感知和认知理论判断设计是否合理。如果不确定可视化设计是否违反了某种指导原则,启发式评价和专家评审则可以有效地弥补这方面的缺陷。第二种方法以用户实验的方式进行规范的用户研究,通过定量或定性分析统计结果或者用户偏好来检验所使用的设计方案的效率。第三种方法是向测试人员展示可视化结果(图像或视频),报告设计结果并做定性讨论。第四种方法是定量地评估可视化结果(图像或视频)。例如,应用可计算的美学标准、与标准结果比较差异等。

4.4.4实现算法和交互

第四层是算法层,通过算法挖掘出数据中的价值信息,目标是解决问题。第四层的风险在于算法的性能和精度无法达到要求。方法之一是分析算法的计算复杂度,或测试算法的实际运行时间及内存开销。为了测试算法的正确性,可以通过输出可视化结果或计算某些统计量来完成。