数据可视化

彭超华

目录

  • 1 数据可视化课程导学
    • 1.1 课程教学大纲
    • 1.2 课程教学进度安排(教学日历)
    • 1.3 课程教学方案设计(教案)
    • 1.4 课程反思
    • 1.5 课堂反思
    • 1.6 课程教学目标
    • 1.7 课程考核方式
    • 1.8 课程推荐书目及资源
    • 1.9 课前软件安装准备:Anaconda3
  • 2 数据可视化概述
    • 2.1 引言(课程介绍、大纲介绍)
    • 2.2 数据可视化概述
    • 2.3 Jupyter Notebook的安装和使用
    • 2.4 本章实训:绘制词云图
  • 3 python程序设计基础(自学)
    • 3.1 python语言基础语法
    • 3.2 python的内置数据类型
    • 3.3 python的自定义函数
  • 4 Numpy数值基础
    • 4.1 Numpy多维数组、数组读写
    • 4.2 数组的索引、切片和运算
    • 4.3 NumPy中的数据统计与分析
  • 5 Pandas统计分析基础
    • 5.1 Pandas 数据结构的创建和文件读取
    • 5.2 Pandas数据预处理
    • 5.3 Pandas 查询与编辑
    • 5.4 数据分组与透视
  • 6 Matplotlib数据可视化
    • 6.1 Matplotlib绘图基础、Pyplot动态rc参数、折线图
      • 6.1.1 jupyter课件
    • 6.2 常用绘图:柱形图
      • 6.2.1 jupyter课件
    • 6.3 常用绘图:饼图、散点图、直方图
      • 6.3.1 jupyter课件
    • 6.4 常见绘图:箱线图、雷达图和表格
      • 6.4.1 jupyter课件
    • 6.5 Pandas可视化
    • 6.6 Pandas可视化实训
    • 6.7 Matplotlib可视化实训
  • 7 Seaborn可视化
    • 7.1 Seaborn简介及风格设置
    • 7.2 常用绘图:关系类图
    • 7.3 常用绘图:分类图
    • 7.4 常用绘图:分布图、回归图和矩阵图
    • 7.5 Seaborn实训
  • 8 Pyecharts可视化(选学)
    • 8.1 Pyecharts基本使用方法
    • 8.2 Pyecharts常用图表
    • 8.3 Pyecharts实训
  • 9 数据可视化综合实训
    • 9.1 数据可视化综合实训
  • 10 课程复习与总结(课程设计)
    • 10.1 课程复习与总结(课程设计)
Matplotlib可视化实训

实训题目:关于XX问题的数据可视化

1、实训题目:

关于XX问题的数据可视化

以小组为单位,获取(收集或者爬虫)感兴趣的话题数据,进行适当的数据处理与分析,用python的Matplotlib库和Pandas库实现数据可视化,并得出相应的结论。

要求:至少包含6种图形的仪表板图形,可绘制多个仪表板。可视化图形包括但是不限于:柱形图、条形图、折线图、饼图、散点图、直方图、箱线图、雷达图等。


2、任务内容:

(1)    数据准备:选择一个具有挑战性的实际问题,例如:全球气候变化趋势、股票市场价格波动、城市人口分布等,获取并整理相关数据。

(2)    数据探索:利用Python数据分析工具(如Pandas)对数据进行探索性分析,理解数据的基本特征和规律。

(3)    可视化设计:根据数据的特点和分析需求,设计合适的可视化图表或图像,例如线图、柱状图、散点图、热力图等。

(4)    可视化实现:使用Matplotlib库将设计好的可视化图表或图像实现出来,对图表进行精细的调整和优化,使其符合数据分析的规范和要求。

(5)    分析与报告:对可视化的结果进行深入分析,发现数据中的规律、趋势或异常点,形成分析报告,并在课堂上进行展示和讲解。

任务流程:

(1)    学生自主选择或接受老师分配的XX问题,并按照自己的兴趣和能力进行组队;

(2)    学生通过查阅资料、在线学习、小组讨论等方式,学习和掌握相关数据获取、整理以及分析的技能和方法;

(3)    学生根据所学的知识和技能,对XX问题进行数据探索和可视化设计;

(4)    学生将可视化结果进行课堂展示和讲解,并接受老师和其他同学的提问和评价;

(5)    老师根据学生的展示和报告,对学生的学习成果进行总结和评价,并给出建议和反馈。

提交内容: WORD报告+html程序文件


3、参考选题

(1)股票市场分析

选择一个股票市场的数据集,例如某支股票的历史价格数据,利用Matplotlib库绘制该股票的历史价格走势图,并进行分析和解读。

可以进一步使用其他Python库(如NumPy或Pandas)对股票市场的其他指标(如市盈率、市净率等)进行计算和分析,并将结果进行可视化。

(2)气候变化趋势

选择全球气候变化的相关数据集,例如全球气温数据、二氧化碳浓度数据等,利用Matplotlib库绘制相关的气候变化趋势图,并进行深入分析和解读。

可以进一步探讨气候变化对人类生活、生态环境等方面的影响,提出应对气候变化的建议和措施。

(3)人口分布和迁移

选择一个地区的人口普查数据集,例如某个城市或国家的人口数量、年龄、性别等数据,利用Matplotlib库绘制相关的人口分布图和迁移图,并进行深入分析和解读。

可以进一步探讨人口分布和迁移的原因、影响因素以及其对城市或国家发展的影响。

(4)电商销售数据分析

选择一个电商平台的销售数据集,例如某个商品的销售数量、销售额、客户评价等数据,利用Matplotlib库绘制相关的销售数据分析图表,并进行深入分析和解读。

可以进一步探讨电商销售数据的季节性、周期性等特征,提出针对商品的促销策略或改进方案。

(5)疫情数据分析

选择一个地区的疫情数据集,例如某城市或国家的确诊病例数、死亡病例数、康复病例数等数据,利用Matplotlib库绘制相关的疫情数据分析图表,并进行深入分析和解读。

可以进一步探讨疫情数据的趋势和影响因素,为政府和相关部门提供针对疫情控制的建议和措施。

参考课件: