数据清洗
上一节
下一节
1.重复值
①检测重复值
②处理重复值
2.缺失值
①检测缺失值
②处理缺失值
u删除法
u固定值替代法
u填充法 (常用处理方式)
②处理缺失值
u插值法
•线性插值
•多项式插值(拉格朗日插值)
•样条插值
3.异常值
①检测异常值
u箱线图
u散点图
②处理异常值
u1、删除
u2、视为缺失值
u3、平均值修正

