实验2:数据预处理及规范化
上一节
下一节
本次实验要求完成如下功能:
(1)分别使用均值替代和全局替代的方式,对给定数据集中nan缺失值进行填充,并汇总输出每个属性列完成了多少频次的数据填充;
(2)对给定的数据样本,自编函数实现min-max,Z-score以及sigmoid函数规范化;
(3)对给定的数据样本,通过调用preprocessing包库的相关函数,实现min-max,Z-score以及sigmoid函数规范化;
(4)比较所列举的三种数据规范化函数的特点,并分析每种方法的优缺点;
(5)使用欧式空间距离,分别评价数据规范化前后数据样本两两之间的相似度。

