数据可视化

彭超华

目录

  • 1 数据可视化课程导学
    • 1.1 课程教学大纲
    • 1.2 课程教学进度安排(教学日历)
    • 1.3 课程教学方案设计(教案)
    • 1.4 课程反思
    • 1.5 课堂反思
    • 1.6 课程教学目标
    • 1.7 课程考核方式
    • 1.8 课程推荐书目及资源
    • 1.9 课前软件安装准备:Anaconda3
  • 2 数据可视化概述
    • 2.1 引言(课程介绍、大纲介绍)
    • 2.2 数据可视化概述
    • 2.3 Jupyter Notebook的安装和使用
    • 2.4 本章实训:绘制词云图
  • 3 python程序设计基础(自学)
    • 3.1 python语言基础语法
    • 3.2 python的内置数据类型
    • 3.3 python的自定义函数
  • 4 Numpy数值基础
    • 4.1 Numpy多维数组、数组读写
    • 4.2 数组的索引、切片和运算
    • 4.3 NumPy中的数据统计与分析
  • 5 Pandas统计分析基础
    • 5.1 Pandas 数据结构的创建和文件读取
    • 5.2 Pandas数据预处理
    • 5.3 Pandas 查询与编辑
    • 5.4 数据分组与透视
  • 6 Matplotlib数据可视化
    • 6.1 Matplotlib绘图基础、Pyplot动态rc参数、折线图
      • 6.1.1 jupyter课件
    • 6.2 常用绘图:柱形图
      • 6.2.1 jupyter课件
    • 6.3 常用绘图:饼图、散点图、直方图
      • 6.3.1 jupyter课件
    • 6.4 常见绘图:箱线图、雷达图和表格
      • 6.4.1 jupyter课件
    • 6.5 Pandas可视化
    • 6.6 Pandas可视化实训
    • 6.7 Matplotlib可视化实训
  • 7 Seaborn可视化
    • 7.1 Seaborn简介及风格设置
    • 7.2 常用绘图:关系类图
    • 7.3 常用绘图:分类图
    • 7.4 常用绘图:分布图、回归图和矩阵图
    • 7.5 Seaborn实训
  • 8 Pyecharts可视化(选学)
    • 8.1 Pyecharts基本使用方法
    • 8.2 Pyecharts常用图表
    • 8.3 Pyecharts实训
  • 9 数据可视化综合实训
    • 9.1 数据可视化综合实训
  • 10 课程复习与总结(课程设计)
    • 10.1 课程复习与总结(课程设计)
Seaborn实训

1、任务题目:关于XX问题的Seaborn可视化

以小组为单位,获取(收集或者爬虫)感兴趣的话题数据,进行适当的数据处理与分析,用python的Seaborn库(必要时,也可以用Matplotlib库和Pandas库)实现数据可视化,并得出相应的结论。

要求:至少包含6种图形的仪表板图形,可绘制多个仪表板。可视化图形包括但是不限于:柱形图、条形图、折线图、饼图、散点图、直方图、箱线图、雷达图等。


2、任务内容:

(1)    数据准备:选择一个具有挑战性的实际问题,例如:全球气候变化趋势、股票市场价格波动、城市人口分布等,获取并整理相关数据。

(2)    数据探索:利用Python数据分析工具(如Pandas)对数据进行探索性分析,理解数据的基本特征和规律。

(3)    可视化设计:根据数据的特点和分析需求,设计合适的可视化图表或图像,例如线图、柱状图、散点图、热力图等。

(4)    可视化实现:使用Seaborn库将设计好的可视化图表或图像实现出来,对图表进行精细的调整和优化,使其符合数据分析的规范和要求。

(5)    分析与报告:对可视化的结果进行深入分析,发现数据中的规律、趋势或异常点,形成分析报告,并在课堂上进行展示和讲解。

任务流程:

(1)    学生自主选择或接受老师分配的XX问题,并按照自己的兴趣和能力进行组队;

(2)    学生通过查阅资料、在线学习、小组讨论等方式,学习和掌握相关数据获取、整理以及分析的技能和方法;

(3)    学生根据所学的知识和技能,对XX问题进行数据探索和可视化设计;

(4)    学生将可视化结果进行课堂展示和讲解,并接受老师和其他同学的提问和评价;

(5)    老师根据学生的展示和报告,对学生的学习成果进行总结和评价,并给出建议和反馈。

提交内容: WORD报告+html程序文件

3、参考选题

(1)多变量数据分析

选择一个多变量数据集,例如用户行为数据、电商购买数据等,利用Seaborn库绘制散点图矩阵,以展示不同变量之间的关系和分布情况。

使用Seaborn库中的散点图矩阵来展示不同变量之间的关系和分布情况,并进一步探讨变量之间的相互作用和影响。

(2)高维数据降维分析

选择一个高维数据集,例如基因组数据、客户画像数据等,利用Seaborn库以及其他Python库(如scikit-learn等)绘制降维后的散点图和分类图,以展示高维数据的降维效果和分类情况。

使用Seaborn库和其他Python库来进行高维数据的降维处理和分类,并使用散点图来展示降维后的数据分布情况。

(3)时间序列数据的季节性和趋势分析

选择一个时间序列数据集,例如天气数据、股票市场数据等,利用Seaborn库绘制时间序列的季节性和趋势图,以展示时间序列数据的特征和变化情况。

使用Seaborn库中的线图和面积图来展示时间序列数据的走势和波动情况,并进一步探讨时间序列数据的季节性和趋势性。

(4)金融市场相关性分析

选择多个金融市场的数据集,例如股票市场、债券市场、商品市场等,利用Seaborn库绘制相关性的热力图,以展示不同市场之间的相关性情况。

使用Seaborn库中的热力图来展示不同市场之间的相关性,并进一步探讨市场之间的联动关系和影响因素。

(5)自然语言处理情感分析

选择一个自然语言处理领域的数据集,例如文本数据、情感数据等,利用Seaborn库以及其他Python可视化库绘制情感热力图和分类结果图,以展示文本数据的情感分布和分类情况。

使用Seaborn库中的热力图来展示文本数据的情感分布情况,并使用其他Python可视化库来展示情感分类结果和准确性情况。