本单元包括十二个知识点:数据挖掘概述、数据采集、数据的质量分析、数据的特征分析1、数据的特征分析2、数据的特征分析3、数据的特征分析4、数据预处理、分类、预测、聚类分析、关联规则。完成本单元学习可能花费您4个小时的学习时间(包括单元测试与讨论)。
本课程将根据布鲁姆学习能力金字塔描述知识单元的学习目标。
识记 | 能描述以下内容:数据挖掘概念、数据采集方法、数据质量分析方法、数据特征分析方法。 |
理解 | 能解释和举例说明以下内容:数据的对比分析、贡献度分析、周期性分析、相关分析、分布分析、统计分析;数据清洗、数据集成、数据变换、数据规约 |
运用 | 能灵活使用的内容:使用箱型图找出异常值;使用等频分组法、等距分组法、聚类分组法对数据进行离散分箱;对分布的数据进行分析,查找近似中位数 |
分析 | 能运用数据分析基本方法,对数据进行预处理 |
评价 | 能利用思维导图总结数据挖掘方法 |
创造 | 能针对具体案例场景要求,利用数据挖掘技术,构建数据挖掘模型 |

单元学习目标:通过本知识单元的学习,您将能够:
● 能阐述了什么是数据挖掘全过程
● 能阐述数据采集的方法和原则
● 能阐述数据的质量分析方法,以及箱形图的含义与绘制
● 能阐述数据的特征分析,以及分析方法(对比分析、贡献度分析、周期性分析、皮尔逊相关分析)
● 能阐述数据的分布分析方法,以及用分布分析解决实际问题
● 能阐述数据的集中统计分析,数据集中统计相关概念,以及近似中位数的计算
● 能阐述什么是数据的离散统计分析?数据离散统计的相关概念
● 能阐述数据预处理的四种方法(数据清洗、数据集成、数据变换、数据规约)
● 能阐述贝叶斯分类原理、决策树分类原理
● 能阐述线性回归的原理,用Excel绘制一元线性回归模型
● 能阐述聚类的原则,系统聚类的方法和步骤,以及用系统聚类解决聚类问题
● 能阐述什么是关联规则?以及如何用Aprior算法解决关联问题
知识点 | 课堂活动 | 评价方法 |
数据挖掘概述 | 1、课前: (1)登录课程网站,观看第8章数据挖掘基础相关12个教学视频,完成视频中的弹题 (2)阅读知识点对应的图文教程,完成对应的巩固练习和主题讨论 (3)完成本章的章节测验 2、课中: 理论课: (1)教师讲授数据挖掘过程。 (2)学生参与课堂互动和小组讨论 实验课: (1)使用EXCEL和WEKA数据挖掘软件,对数据进行分析和挖掘 (2)独立完成PBL个人项目 3、课后: (1)阅读本章的延伸学习 (2)完成课后练习8-1、8-2 (3)分组完成综合性案例 | (1)MOOC视频任务点完成率 (2)课堂讨论和回答问题次数 (3)知识点巩固练习分数 (4)知识点的主题讨论次数 (5)章节测验分数 (6)课堂互动分数 (7)课后练习分数 (8)本次PBL个人项目分数 (9)综合性案例分数 (10)第三阶段单元考试分数 |
数据采集 | ||
数据的质量分析 | ||
数据的特征分析1 | ||
数据的特征分析2 | ||
数据的特征分析3 | ||
数据的特征分析4 | ||
数据预处理 | ||
分类 | ||
预测 | ||
聚类分析 | ||
关联规则 |


