数据分析步骤
上一节
下一节
数据分析的流程:
数据获取:抽样调查、实验设计、网络爬虫、传感集成
探索性分析:数据清洗、识别异常点、插补缺失值
数据转换:无量纲化、正态化、标准化
数据挖掘与建模:机器学习、统计模型
机器学习包括:监督学习、半监督学习、费监督学习、主动学习、深度学习
统计模型包括:计量经济模型、时间序列分析、多元统计分析、非参数统计、高维数据分析
模型检验:交叉验证、显著性检验、拟合优度检验
解释和预测:影响因素分析、相关分析、多变量交互作用、风险和决策
研究报告:可视化、可复制性

