个人介绍
数据仓库与数据挖掘A

主讲教师:胡彦蓉

数据仓库与数据挖掘是信管专业的专业模块课。通过课程学习,使学生能够了解数据仓库及数据挖掘的产生和发展历史,掌握如何设计并实现比较规范的数据仓库系统,掌握数据挖掘的基本概念、技术和应用方法。培养学生应用数据仓库和数据挖掘理论和技术解决实际问题的能力。
教学大纲


《数据仓库与数据挖掘》课程思政教学大纲

 

一、课程基本信息

课程名称

数据仓库与数据挖掘

课程代码

E3521106

英文名称

Data Warehouse and Data Mining

归属学科

(系、部)

智能科学

学分

3

   时

56,其中实验16学时

开课学期

3

预修课程

离散数学、概率论与数理统计、C++、数据结构

面向专业

智能科学与技术专业


 二、课程的毕业要求覆盖表

毕业要求

支撑度

教学方式

考核方式

毕业要求1:工程知识:能够将数学、自然科学、工程基础和专业知识用于解决复杂工程问题

L

课堂知识性教学与实验教学

作业及实验

毕业要求2:问题分析:能够应用数学、自然科学和工程科学的基本原理,识别、表达、并通过文献研究分析复杂工程问题,以获得有效结论。

L

课堂知识性教学与实验教学

作业及实验

毕业要求3:设计/开发解决方案:能够设计针对复杂工程问题的解决方案,设计满足特定需求的系统、单元(部件)或工艺流程,并能够在设计环节中体现创新意识,考虑社会、健康、安全、法律、文化以及环境等因素。

M

课堂知识性教学与实验教学

作业及实验

毕业要求4:研究:能够基于科学原理并采用科学方法对复杂工程问题进行研究,包括设计实验、分析与解释数据、并通过信息综合得到合理有效的结论。

M

课堂知识性教学与实验教学

作业及实验

毕业要求5:使用现代工具:能够针对复杂工程问题,开发、选择与使用恰当的技术、资源、现代工程工具和信息技术工具,包括对复杂工程问题的预测与模拟,并能够理解其局限性。




毕业要求6:工程与社会:能够基于工程相关背景知识进行合理分析,评价专业工程实践和复杂工程问题解决方案对社会、健康、安全、法律以及文化的影响,并理解应承担的责任。




毕业要求7:环境和可持续发展:能够理解和评价针对复杂工程问题的专业工程实践对环境、社会可持续发展的影响。




毕业要求8:职业规范:具有人文社会科学素养、社会责任感,能够在工程实践中理解并遵守工程职业道德和规范,履行责任。




毕业要求9:个人和团队:能够在多学科背景下的团队中承担个体、团队成员以及负责人的角色。




毕业要求10:沟通:能够就复杂工程问题与业界同行及社会公众进行有效沟通和交流,包括撰写报告和设计文稿、陈述发言、清晰表达或回应指令。并具备一定的国际视野,能够在跨文化背景下进行沟通和交流。




毕业要求11:项目管理:理解并掌握工程管理原理与经济决策方法,并能在多学科环境中应用。




毕业要求12:终身学习:具有自主学习和终身学习的意识,有不断学习和适应发展的能力。

L

思考与讨论

后续课程的学习

  L——低相关支撑;M——中相关支撑;H——高相关支撑


 
三、课程性质与教学目标

  1. 课程教学目标

《数据仓库与数据挖掘》是信息管理与信息系统的专业基础课之一,通过讲述数据库、数据库管理系统和数据仓库的相关概念,数据仓库的原理、基本模型以及设计流程,联机分析处理(OLAP)技术及其发展方向,数据预处理技术(包括数据清理、数据集成和转换、数据归约的方法),数据挖掘技术等内容,使学生掌握数据仓库以及数据挖掘的原理、方法及应用,了解数据仓库与数据挖掘技术的最新进展,能运用课程所学知识设计数据仓库,并运用数据挖掘技术解决现实中的一些具体问题。

  2. 思政育人目标

通过典型案例,引导学生思考分析其中的人生感悟,培养学生的良好品质,成为有理想信念、敢于担当、德才兼备、复合型人才。

四、教学章节与学时安排

类别

教学内容与章节

学时数

理论教学

部分

1.第一章 数据分析与数据挖掘

4

2.第二章 数据

4

3.第三章 数据预处理

4

4.第四章 数据仓库与联机分析处理

4

5.第五章 关联分析

6

6.第六章 序列模式挖掘

4

7.第七章 聚类分析

8

8.第八章 离群点检测

4

复习

2

合计

40

实验教学

部分

1.python使用入门

2

2.数据探索实验

4

3.数据预处理实验

4

4.关联规则实验

2

5.聚类分析实验

2

6.离群点检测实验

2

   计

16

 

五、教学内容与教学方法

(一)理论教学内容

1.第一章  绪论

主要内容:数据分析,分析与挖掘的数据类型,数据分析与数据挖掘的方法,数据分析与数据挖掘使用的技术。

掌握:分析与挖掘的数据类型,数据分析与数据挖掘的方法。

理解:了解数据分析与数据挖掘使用的技术。

主要教学方法:讲授法、谈论法、演示法。

教学方式:线上教学、混合式教学、案例式、课堂讲授等。

重点与难点:分析与挖掘的数据类型,数据分析与数据挖掘的方法。

课程思政要点:结合社会主义国家的价值目标,通过介绍各国人工智能领域的激烈竞争和我国迅速发展的现状,激发民族自豪感和报国使命感,树立远大理想

2.第二章  数据

主要内容:数据对象与属性类别,数据的基本统计描述,数据的相似性与相异性度量。

掌握:数据的相似性与相异性度量。

理解:了解数据对象与属性类别,数据的基本统计描述。

主要教学方法:讲授法、谈论法、演示法。

教学方式:线上教学、混合式教学、案例式、课堂讲授等。

重点与难点:数据的相似性与相异性度量。

课程思政要点:法制、诚信。以美国Facebook公司数据泄露事件为例,让学生了解在大数据时代尤其要关注数据来源的合法性,保护用户数据安全等。

3.第三章  数据预处理

主要内容:数据预处理及任务,数据清理,数据集成,数据规约,数据变换与数据离散化。

掌握:数据任务,数据集成,数据规约。

理解:了解数据变换与数据离散化。

主要教学方法:讲授法、谈论法、演示法。

教学方式:线上教学、混合式教学、案例式、课堂讲授等。

重点与难点:数据清理,数据集成,数据规约。

课程思政要点:爱国、敬业、诚信。通过电商平台网络(如京东和淘宝网)文本挖掘,让学生懂得遵守道德规范,自觉抵制不良信息,注意保护信息隐私。

4.第四章  数据仓库与联机分析处理

主要内容:数据仓库基本概念,数据仓库设计,数据仓库实现,联机分析处理,元数据模型。

掌握:数据仓库基本概念,联机分析处理。

理解:了解数据仓库设计,数据仓库实现。

主要教学方法:讲授法、谈论法、演示法。

教学方式:线上教学、混合式教学、案例式、课堂讲授等。

重点与难点:数据仓库基本概念,联机分析处理。

5. 第五章 关联分析

主要内容:关联分析的概念, Apriori算法,FP-growth算法,关联模型评估。

掌握:关联分析的概念, Apriori算法,FP-growth算法。

理解:了解关联模型评估。

主要教学方法:理论讲解、探讨式教学、启发式教学。

教学方式:线上教学、混合式教学、案例式、课堂讲授等。

重点与难点:Apriori算法。

6. 第六章 序列模式挖掘

主要内容:序列模式挖掘概述, Apriori类算法,模式增长框架的序列挖掘算法。

掌握:序列模式挖掘概述, Apriori类算法。

理解:了解模式增长框架的序列挖掘算法。

主要教学方法:理论讲解、探讨式教学、启发式教学。

教学方式:线上教学、混合式教学、案例式、课堂讲授等。

重点与难点:Apriori类算法,FP-growth算法。

7. 第七章 聚类分析

主要内容:聚类概述,基于划分的聚类算法,基于层次的聚类算法,基于密度的聚类算法,基于网格的聚类算法。

掌握:基于划分的聚类算法,基于层次的聚类算法。

理解:了解模式增长框架的序列挖掘算法。

主要教学方法:理论讲解、探讨式教学、启发式教学。

教学方式:线上教学、混合式教学、案例式、课堂讲授等。

重点与难点:基于划分的聚类算法;基于层次的聚类算法。

课程思政要点:基于K均值聚类算法在手机机主识别中的应用示例实现过程,强化探索意识和创新精神。

8. 第八章 离群点检测

主要内容:离群点的定义与类型,离群点检测。

掌握:离群点检测。

理解:了解离群点的定义与类型。

主要教学方法:理论讲解、探讨式教学、启发式教学。

教学方式:线上教学、混合式教学、案例式、课堂讲授等。

重点与难点:离群点的定义与类型。

课程思政要点:爱国、敬业、诚信。在讲述数据挖掘实例(如信用等级分类、电信欺诈等案例)后引出四点感悟:识大局、拘小节、懂规矩、强能力,进而引申到做人做事上,引导学生懂规矩、守纪律,努力学习,不断提高自己的能力。

(二)实验教学内容

1.实验一:python使用入门

掌握python的基本命令,数据结构,以及如何添加第三方扩展库,了解python数据分析工具及使用。

2.实验二:数据探索实验

掌握数据质量分析、数据特征分析和python主要数据探索函数,具体包括缺失值分析、异常值分析、一致性分析、统计分析等。

3.实验三:数据预处理实验

    掌握数据清洗、数据集成、数据变换和数据规约。

4.实验四:关联规则实验

    通过餐饮企业实际数据,掌握Apriori算法及序列模式算法。

5.实验五:聚类分析实验

    通过餐饮企业实际数据,掌握K-均值聚类算法,同时学会对算法的评价。

6.实验六:离群点检测实验

通过餐饮企业实际数据,掌握利用离群点检测方法对异常数据的处理。 

六、主要教材及参考用书

教材:

《数据分析与数据挖掘》(第二版),喻梅等编,清华大学出版社,标准书号:9787302558682.

《数据仓库与数据挖掘实践》,李春葆等编著,电子工业出版社,2014年,标准书号:9787121244926.

参考用书:

《数据仓库理论与实例》,王晖等著,经济科学出版社,2012年,标准书号:9787514118148.

《数据挖掘算法与应用》,黄添强著,厦门大学出版社,2011年,标准书号:9787561540046.

《数据挖掘:概念与技术》(第三版),Jiawei Han等著,范明等译,机械工业出版社,2012年,标准书号:9787111391401.

《数据挖掘导论》(第二版),(美)陈封能等著,段磊等译,机械工业出版社,2019年,标准书号:9787111631620. 

七、考核与评价

1) 本课程为考试课,课程总成绩  = 平时成绩*40% + 期末成绩*60%

2) 考核方式:考试

其中平时成绩=考勤*10%+课后作业*30%+实验报告*40%+课堂考核*20%

过程性评价的项目内容如下:

序号

评价项目

评价内容

1

考勤

全勤给予满分,缺勤一次扣一分,扣完为止

2

课后作业

2次课后作业

3

实验报告

6次实验报告

4

课堂考核

根据课程内容,安排2次课堂考核

5



 

                              编制:胡彦蓉              审核:徐达宇

思政大纲

普通大纲


授课计划

1.第一章 数据分析与数据挖掘

4

2.第二章 数据

4

3.第三章 数据预处理

4

4.第四章 数据仓库与联机分析处理

4

5.第五章 关联分析

6

6.第六章 序列模式挖掘

4

7.第七章 聚类分析

8

8.第八章 离群点检测

4

复习

2


图书资料



课程章节

提示框
取消 进入课程
提示框
确定要报名此课程吗?
确定取消

京ICP备10040544号-2

京公网安备 11010802021885号