本章小结
上一节
下一节
本章介绍了R语言中的基本数据类型和数据结构,以及常用的数据操作。
基本数据类型有5种,即数值型、字符型、逻辑型、因子型和时间型。
数据结构即数据的组织方式,常用的5种数据结构是向量、矩阵、数组、数据框和列表。其中,向量、矩阵、数组仅支持存储单数据类型的数据;数据框、列表可以存储多数据类型的数据。
本章介绍了4种常见的数据读入方法:直接输入数据、从带分隔符的文本文件中导入数据、导入Excel数据和逐行读入数据。介绍了3个数据写出的函数,即write()函数、write.table()函数和write.csv()函数。
数据集管理和预处理是数据分析实战中需要反复用到的技能,可以为后续分析工作打好基础。
数据预处理的基本流程包括了解数据概况、变量类型转换、时间型数据的操作、数据集合并及处理数据缺失值和异常值。

