目录

  • 1 课程导学
    • 1.1 课程概述
    • 1.2 课程思政
  • 2 数据分析概述
    • 2.1 教学设计
    • 2.2 数据的性质和分析
  • 3 Python与数据分析
    • 3.1 教学设计
    • 3.2 Python简介
    • 3.3 Python与数据分析的关系
    • 3.4 Python数据分析常用的类库
    • 3.5 Python环境搭建
  • 4 Python语言基础
    • 4.1 教学设计
    • 4.2 Python的基础语法
    • 4.3 Python的数据类型
    • 4.4 Python的函数
  • 5 NumPy数组与矢量计算
    • 5.1 教学设计
    • 5.2 NumPy概述
    • 5.3 NumPy数组对象、操作及矢量计算
  • 6 用 NumPy进行简单统计分析
    • 6.1 教学设计
    • 6.2 文件读写操作
    • 6.3 使用NumPy函数进行统计分析
  • 7 数据可视化——Matplotlib库
    • 7.1 教学设计
    • 7.2 Matplotlib概述
    • 7.3 使用pyplot创建图形
    • 7.4 Matplotlib参数配置
    • 7.5 分析变量间关系图
    • 7.6 分析变量数据分布和分散状况
  • 8 pandas数据分析基础
    • 8.1 教学设计
    • 8.2 pandas概述
    • 8.3 数据分析方法
  • 9 用pandas进行数据预处理
    • 9.1 教学设计
    • 9.2 数据清洗、合并和抽取
    • 9.3 重塑层次化索引
    • 9.4 映射与数据转换
    • 9.5 排列与随机抽样
  • 10 机器学习库scikit-learn
    • 10.1 教学设计
    • 10.2 数据准备
    • 10.3 数据降维
    • 10.4 数据分类
    • 10.5 回归
    • 10.6 聚类
    • 10.7 模型选择
Python与数据分析的关系

 常用的数据分析工具有Python语言、R语言、MATLAB等,但在大数据分析领域,Python是最受欢迎的主流程序语言。究其原因主要有:

 第一,Python是一种解释型编程语言。

 第二,Python语言拥有和数据分析相关的大量开源库和分析框架,可直接使用,非常方便。

 第三, Python其实不是只能专用于数据分析,它还有很多其他方面的用途。如Python是一门通用型的编程语言,它也可以作为脚本来使用,还能操作数据库;而且由于Django等框架的问世,Python近年来还用于开发Web应用。