目录

  • 1 R语言与统计分析概述
    • 1.1 配置R环境与了解R
    • 1.2 统计分析方法概述
    • 1.3 本章小结
    • 1.4 本章习题
    • 1.5 章节测验
  • 2 R语言中的数据管理及预处理
    • 2.1 基本数据类型
    • 2.2 数据结构
    • 2.3 数据的读入和写出
    • 2.4 数据集管理及预处理
    • 2.5 数据集的进阶操作和dplyr包的介绍
    • 2.6 本章小结
    • 2.7 本章习题
  • 3 R的基本统计分析
    • 3.1 基本描述统计量
    • 3.2 汇总分析
    • 3.3 本章小结
    • 3.4 本章习题
  • 4 数据描述与可视化
    • 4.1 统计表格
    • 4.2 数据可视化基础
    • 4.3 数据可视化进阶
    • 4.4 本章小结
    • 4.5 本章习题
  • 5 参数估计与假设检验
    • 5.1 总体、样本和样本量
    • 5.2 参数估计
    • 5.3 假设检验
    • 5.4 单因素方差分析
    • 5.5 本章小结
    • 5.6 本章习题
  • 6 线性回归
    • 6.1 理论
    • 6.2 实例分析
  • 7 逻辑回归
    • 7.1 理论
    • 7.2 实例分析
  • 8 R的聚类分析
    • 8.1 理论
    • 8.2 实例分析
  • 9 R的线性判别分析
  • 10 R的降维分析
  • 11 R的因子分析
本章习题

1.如何理解R语言中的“向量化”操作?请举一个例子说明。

2.请描述R语言中矩阵和数据框之间的两个不同点。

3.对矩阵进行如下操作:

a.在R中生成下面的矩阵A;b. 计算矩阵A的转置矩阵B和逆矩阵C;c. 求矩阵A和矩阵B的乘积。

4.使用电视剧网播量数据集,该数据集收集了4266条电视剧的信息。请完成以下任务。

a.获取数据集,查看数据概况;b. 删除数据集中剧名缺失的值;c. 不考虑缺失数据影响,计算电视剧的平均得分。

5.手机游戏数据集收集了1141条手机游戏信息及评分,请使用该数据集完成以下任务。

a.获取数据集,查看数据概况。

b.提取热度中的数值部分,计算各游戏类型的热度均值,找出平均热度最高的游戏类型。

c.计算各游戏类型的平均评分、最高评分、最低评分、评分标准差,并作简要分析。