目录

  • 1 R语言与统计分析概述
    • 1.1 配置R环境与了解R
    • 1.2 统计分析方法概述
    • 1.3 本章小结
    • 1.4 本章习题
    • 1.5 章节测验
  • 2 R语言中的数据管理及预处理
    • 2.1 基本数据类型
    • 2.2 数据结构
    • 2.3 数据的读入和写出
    • 2.4 数据集管理及预处理
    • 2.5 数据集的进阶操作和dplyr包的介绍
    • 2.6 本章小结
    • 2.7 本章习题
  • 3 R的基本统计分析
    • 3.1 基本描述统计量
    • 3.2 汇总分析
    • 3.3 本章小结
    • 3.4 本章习题
  • 4 数据描述与可视化
    • 4.1 统计表格
    • 4.2 数据可视化基础
    • 4.3 数据可视化进阶
    • 4.4 本章小结
    • 4.5 本章习题
  • 5 参数估计与假设检验
    • 5.1 总体、样本和样本量
    • 5.2 参数估计
    • 5.3 假设检验
    • 5.4 单因素方差分析
    • 5.5 本章小结
    • 5.6 本章习题
  • 6 线性回归
    • 6.1 理论
    • 6.2 实例分析
  • 7 逻辑回归
    • 7.1 理论
    • 7.2 实例分析
  • 8 R的聚类分析
    • 8.1 理论
    • 8.2 实例分析
  • 9 R的线性判别分析
  • 10 R的降维分析
  • 11 R的因子分析
本章小结

本章介绍了R语言中的基本数据类型和数据结构,以及常用的数据操作。

基本数据类型有5种,即数值型、字符型、逻辑型、因子型和时间型。

数据结构即数据的组织方式,常用的5种数据结构是向量、矩阵、数组、数据框和列表。其中,向量、矩阵、数组仅支持存储单数据类型的数据;数据框、列表可以存储多数据类型的数据。

本章介绍了4种常见的数据读入方法:直接输入数据、从带分隔符的文本文件中导入数据、导入Excel数据和逐行读入数据。介绍了3个数据写出的函数,即write()函数、write.table()函数和write.csv()函数。

数据集管理和预处理是数据分析实战中需要反复用到的技能,可以为后续分析工作打好基础。

数据预处理的基本流程包括了解数据概况、变量类型转换、时间型数据的操作、数据集合并及处理数据缺失值和异常值。