目录

  • 1 课程导学
    • 1.1 课程概述
    • 1.2 课程思政
  • 2 数据分析概述
    • 2.1 教学设计
    • 2.2 数据的性质和分析
  • 3 Python与数据分析
    • 3.1 教学设计
    • 3.2 Python简介
    • 3.3 Python与数据分析的关系
    • 3.4 Python数据分析常用的类库
    • 3.5 Python环境搭建
  • 4 Python语言基础
    • 4.1 教学设计
    • 4.2 Python的基础语法
    • 4.3 Python的数据类型
    • 4.4 Python的函数
  • 5 NumPy数组与矢量计算
    • 5.1 教学设计
    • 5.2 NumPy概述
    • 5.3 NumPy数组对象、操作及矢量计算
  • 6 用 NumPy进行简单统计分析
    • 6.1 教学设计
    • 6.2 文件读写操作
    • 6.3 使用NumPy函数进行统计分析
  • 7 数据可视化——Matplotlib库
    • 7.1 教学设计
    • 7.2 Matplotlib概述
    • 7.3 使用pyplot创建图形
    • 7.4 Matplotlib参数配置
    • 7.5 分析变量间关系图
    • 7.6 分析变量数据分布和分散状况
  • 8 pandas数据分析基础
    • 8.1 教学设计
    • 8.2 pandas概述
    • 8.3 数据分析方法
  • 9 用pandas进行数据预处理
    • 9.1 教学设计
    • 9.2 数据清洗、合并和抽取
    • 9.3 重塑层次化索引
    • 9.4 映射与数据转换
    • 9.5 排列与随机抽样
  • 10 机器学习库scikit-learn
    • 10.1 教学设计
    • 10.2 数据准备
    • 10.3 数据降维
    • 10.4 数据分类
    • 10.5 回归
    • 10.6 聚类
    • 10.7 模型选择
Python数据分析常用的类库

Python数据分析中常用的库有NumPy、pandas、Matplotlib和SciPy等,这些库在数据分析中起着很重要的作用。

① NumPy(NumericalPython的简称)是Python科学计算的基础包。

② pandas是Python数据分析的核心库,它是基于NumPy 构建的含有复杂数据结构和工具的数据分析包。

③ Matplotlib是最流行的用于绘制数据图表的Python库,它非常适合创建出版物中用的图表。Matplotlib提供了一整套和MATLAB相似的命令API,十分适合交互式地进行制图。

④ SciPy是一组专门用于科学计算的开源Python库,它是构建于NumPy之上,提供了一个用于在Python中进行科学计算的工具集。SciPy经常与NumPy、 pandas、Matplotlib和IPython这些核心库一起使用。

⑤ scikit-learn是一个简单有效的数据挖掘和数据分析工具,scikit-learn是建立在NumPy、SciPy和Matplotlib的基础之上,对一些常用的算法方法进行了封装。Scikit-learn的基本功能主要被分为六大部分:分类,回归,聚类,数据降维,模型选择和数据预处理。

 ⑥ IPython是Python科学计算标准工具集组成部分,它为交互式和探索式计算提供了一个高效率的开发环境。