目录

  • 1 R语言与统计分析概述
    • 1.1 配置R环境与了解R
    • 1.2 统计分析方法概述
    • 1.3 本章小结
    • 1.4 本章习题
    • 1.5 章节测验
  • 2 R语言中的数据管理及预处理
    • 2.1 基本数据类型
    • 2.2 数据结构
    • 2.3 数据的读入和写出
    • 2.4 数据集管理及预处理
    • 2.5 数据集的进阶操作和dplyr包的介绍
    • 2.6 本章小结
    • 2.7 本章习题
  • 3 R的基本统计分析
    • 3.1 基本描述统计量
    • 3.2 汇总分析
    • 3.3 本章小结
    • 3.4 本章习题
  • 4 数据描述与可视化
    • 4.1 统计表格
    • 4.2 数据可视化基础
    • 4.3 数据可视化进阶
    • 4.4 本章小结
    • 4.5 本章习题
  • 5 参数估计与假设检验
    • 5.1 总体、样本和样本量
    • 5.2 参数估计
    • 5.3 假设检验
    • 5.4 单因素方差分析
    • 5.5 本章小结
    • 5.6 本章习题
  • 6 线性回归
    • 6.1 理论
    • 6.2 实例分析
  • 7 逻辑回归
    • 7.1 理论
    • 7.2 实例分析
  • 8 R的聚类分析
    • 8.1 理论
    • 8.2 实例分析
  • 9 R的线性判别分析
  • 10 R的降维分析
  • 11 R的因子分析
本章小结

本章详细介绍了各种统计图表及它们在R语言中的绘制方法。想要准确地使用统计图表来表达信息,首先要明确需要进行可视化的变量个数与变量类型。

针对一堆变量,主要关注变量的分布形态。因此,对于一堆定性变量,可以绘制频数柱状图和饼图;对于一堆定量变量,可以绘制直方图。

对于双变量之间的交互关系,首先要确认双变量的类型。对于两个定性变量,首先分组柱状图对其进行展示;对于定量与定性变量之间的交互关系,推荐使用分组箱线图或者均值柱状图展示;对于两个定量变量,可以使用散点图,或者将其中一个离散化后绘制分组箱线图来展示。

对于多维数据,则可以采用相关系数图的方式来探索变量之间的两两相关关系。

对于一组数据完成描述分析,也就对数据规律有了初步了解。接下来将结合统计分析、建模的知识,对数据规律进行进一步的探索。