《数据仓库与数据挖掘》课程思政教学大纲
一、课程基本信息
课程名称 | 数据仓库与数据挖掘 | 课程代码 | E3521106 |
英文名称 | Data Warehouse and Data Mining | 归属学科 (系、部) | 智能科学 |
学分 | 3 | 学 时 | 56,其中实验16学时 | 开课学期 | 3 |
预修课程 | 离散数学、概率论与数理统计、C++、数据结构 |
面向专业 | 智能科学与技术专业 |
二、课程的毕业要求覆盖表
毕业要求 | 支撑度 | 教学方式 | 考核方式 |
毕业要求1:工程知识:能够将数学、自然科学、工程基础和专业知识用于解决复杂工程问题 | L | 课堂知识性教学与实验教学 | 作业及实验 |
毕业要求2:问题分析:能够应用数学、自然科学和工程科学的基本原理,识别、表达、并通过文献研究分析复杂工程问题,以获得有效结论。 | L | 课堂知识性教学与实验教学 | 作业及实验 |
毕业要求3:设计/开发解决方案:能够设计针对复杂工程问题的解决方案,设计满足特定需求的系统、单元(部件)或工艺流程,并能够在设计环节中体现创新意识,考虑社会、健康、安全、法律、文化以及环境等因素。 | M | 课堂知识性教学与实验教学 | 作业及实验 |
毕业要求4:研究:能够基于科学原理并采用科学方法对复杂工程问题进行研究,包括设计实验、分析与解释数据、并通过信息综合得到合理有效的结论。 | M | 课堂知识性教学与实验教学 | 作业及实验 |
毕业要求5:使用现代工具:能够针对复杂工程问题,开发、选择与使用恰当的技术、资源、现代工程工具和信息技术工具,包括对复杂工程问题的预测与模拟,并能够理解其局限性。 |
|
|
|
毕业要求6:工程与社会:能够基于工程相关背景知识进行合理分析,评价专业工程实践和复杂工程问题解决方案对社会、健康、安全、法律以及文化的影响,并理解应承担的责任。 |
|
|
|
毕业要求7:环境和可持续发展:能够理解和评价针对复杂工程问题的专业工程实践对环境、社会可持续发展的影响。 |
|
|
|
毕业要求8:职业规范:具有人文社会科学素养、社会责任感,能够在工程实践中理解并遵守工程职业道德和规范,履行责任。 |
|
|
|
毕业要求9:个人和团队:能够在多学科背景下的团队中承担个体、团队成员以及负责人的角色。 |
|
|
|
毕业要求10:沟通:能够就复杂工程问题与业界同行及社会公众进行有效沟通和交流,包括撰写报告和设计文稿、陈述发言、清晰表达或回应指令。并具备一定的国际视野,能够在跨文化背景下进行沟通和交流。 |
|
|
|
毕业要求11:项目管理:理解并掌握工程管理原理与经济决策方法,并能在多学科环境中应用。 |
|
|
|
毕业要求12:终身学习:具有自主学习和终身学习的意识,有不断学习和适应发展的能力。 | L | 思考与讨论 | 后续课程的学习 |
注L:——低相关支撑;M——中相关支撑;H——高相关支撑
三、课程性质与教学目标
1. 课程教学目标
《数据仓库与数据挖掘》是信息管理与信息系统的专业基础课之一,通过讲述数据库、数据库管理系统和数据仓库的相关概念,数据仓库的原理、基本模型以及设计流程,联机分析处理(OLAP)技术及其发展方向,数据预处理技术(包括数据清理、数据集成和转换、数据归约的方法),数据挖掘技术等内容,使学生掌握数据仓库以及数据挖掘的原理、方法及应用,了解数据仓库与数据挖掘技术的最新进展,能运用课程所学知识设计数据仓库,并运用数据挖掘技术解决现实中的一些具体问题。
2. 思政育人目标
通过典型案例,引导学生思考分析其中的人生感悟,培养学生的良好品质,成为有理想信念、敢于担当、德才兼备、复合型人才。
四、教学章节与学时安排
类别 | 教学内容与章节 | 学时数 |
理论教学 部分 | 1.第一章 数据分析与数据挖掘 | 4 |
2.第二章 数据 | 4 |
3.第三章 数据预处理 | 4 |
4.第四章 数据仓库与联机分析处理 | 4 |
5.第五章 关联分析 | 6 |
6.第六章 序列模式挖掘 | 4 |
7.第七章 聚类分析 | 8 |
8.第八章 离群点检测 | 4 |
复习 | 2 |
合计 | 40 |
实验教学 部分 | 1.python使用入门 | 2 |
2.数据探索实验 | 4 |
3.数据预处理实验 | 4 |
4.关联规则实验 | 2 |
5.聚类分析实验 | 2 |
6.离群点检测实验 | 2 |
合 计 | 16 |
五、教学内容与教学方法
(一)理论教学内容
1.第一章 绪论
主要内容:数据分析,分析与挖掘的数据类型,数据分析与数据挖掘的方法,数据分析与数据挖掘使用的技术。
掌握:分析与挖掘的数据类型,数据分析与数据挖掘的方法。
理解:了解数据分析与数据挖掘使用的技术。
主要教学方法:讲授法、谈论法、演示法。
教学方式:线上教学、混合式教学、案例式、课堂讲授等。
重点与难点:分析与挖掘的数据类型,数据分析与数据挖掘的方法。
课程思政要点:结合社会主义国家的价值目标,通过介绍各国人工智能领域的激烈竞争和我国迅速发展的现状,激发民族自豪感和报国使命感,树立远大理想
2.第二章 数据
主要内容:数据对象与属性类别,数据的基本统计描述,数据的相似性与相异性度量。
掌握:数据的相似性与相异性度量。
理解:了解数据对象与属性类别,数据的基本统计描述。
主要教学方法:讲授法、谈论法、演示法。
教学方式:线上教学、混合式教学、案例式、课堂讲授等。
重点与难点:数据的相似性与相异性度量。
课程思政要点:法制、诚信。以美国Facebook公司数据泄露事件为例,让学生了解在大数据时代尤其要关注数据来源的合法性,保护用户数据安全等。
3.第三章 数据预处理
主要内容:数据预处理及任务,数据清理,数据集成,数据规约,数据变换与数据离散化。
掌握:数据任务,数据集成,数据规约。
理解:了解数据变换与数据离散化。
主要教学方法:讲授法、谈论法、演示法。
教学方式:线上教学、混合式教学、案例式、课堂讲授等。
重点与难点:数据清理,数据集成,数据规约。
课程思政要点:爱国、敬业、诚信。通过电商平台网络(如京东和淘宝网)文本挖掘,让学生懂得遵守道德规范,自觉抵制不良信息,注意保护信息隐私。
4.第四章 数据仓库与联机分析处理
主要内容:数据仓库基本概念,数据仓库设计,数据仓库实现,联机分析处理,元数据模型。
掌握:数据仓库基本概念,联机分析处理。
理解:了解数据仓库设计,数据仓库实现。
主要教学方法:讲授法、谈论法、演示法。
教学方式:线上教学、混合式教学、案例式、课堂讲授等。
重点与难点:数据仓库基本概念,联机分析处理。
5. 第五章 关联分析
主要内容:关联分析的概念, Apriori算法,FP-growth算法,关联模型评估。
掌握:关联分析的概念, Apriori算法,FP-growth算法。
理解:了解关联模型评估。
主要教学方法:理论讲解、探讨式教学、启发式教学。
教学方式:线上教学、混合式教学、案例式、课堂讲授等。
重点与难点:Apriori算法。
6. 第六章 序列模式挖掘
主要内容:序列模式挖掘概述, Apriori类算法,模式增长框架的序列挖掘算法。
掌握:序列模式挖掘概述, Apriori类算法。
理解:了解模式增长框架的序列挖掘算法。
主要教学方法:理论讲解、探讨式教学、启发式教学。
教学方式:线上教学、混合式教学、案例式、课堂讲授等。
重点与难点:Apriori类算法,FP-growth算法。
7. 第七章 聚类分析
主要内容:聚类概述,基于划分的聚类算法,基于层次的聚类算法,基于密度的聚类算法,基于网格的聚类算法。
掌握:基于划分的聚类算法,基于层次的聚类算法。
理解:了解模式增长框架的序列挖掘算法。
主要教学方法:理论讲解、探讨式教学、启发式教学。
教学方式:线上教学、混合式教学、案例式、课堂讲授等。
重点与难点:基于划分的聚类算法;基于层次的聚类算法。
课程思政要点:基于K均值聚类算法在手机机主识别中的应用示例实现过程,强化探索意识和创新精神。
8. 第八章 离群点检测
主要内容:离群点的定义与类型,离群点检测。
掌握:离群点检测。
理解:了解离群点的定义与类型。
主要教学方法:理论讲解、探讨式教学、启发式教学。
教学方式:线上教学、混合式教学、案例式、课堂讲授等。
重点与难点:离群点的定义与类型。
课程思政要点:爱国、敬业、诚信。在讲述数据挖掘实例(如信用等级分类、电信欺诈等案例)后引出四点感悟:识大局、拘小节、懂规矩、强能力,进而引申到做人做事上,引导学生懂规矩、守纪律,努力学习,不断提高自己的能力。
(二)实验教学内容
1.实验一:python使用入门
掌握python的基本命令,数据结构,以及如何添加第三方扩展库,了解python数据分析工具及使用。
2.实验二:数据探索实验
掌握数据质量分析、数据特征分析和python主要数据探索函数,具体包括缺失值分析、异常值分析、一致性分析、统计分析等。
3.实验三:数据预处理实验
掌握数据清洗、数据集成、数据变换和数据规约。
4.实验四:关联规则实验
通过餐饮企业实际数据,掌握Apriori算法及序列模式算法。
5.实验五:聚类分析实验
通过餐饮企业实际数据,掌握K-均值聚类算法,同时学会对算法的评价。
6.实验六:离群点检测实验
通过餐饮企业实际数据,掌握利用离群点检测方法对异常数据的处理。
六、主要教材及参考用书
教材:
《数据分析与数据挖掘》(第二版),喻梅等编,清华大学出版社,标准书号:9787302558682.
《数据仓库与数据挖掘实践》,李春葆等编著,电子工业出版社,2014年,标准书号:9787121244926.
参考用书:
《数据仓库理论与实例》,王晖等著,经济科学出版社,2012年,标准书号:9787514118148.
《数据挖掘算法与应用》,黄添强著,厦门大学出版社,2011年,标准书号:9787561540046.
《数据挖掘:概念与技术》(第三版),Jiawei Han等著,范明等译,机械工业出版社,2012年,标准书号:9787111391401.
《数据挖掘导论》(第二版),(美)陈封能等著,段磊等译,机械工业出版社,2019年,标准书号:9787111631620.
七、考核与评价
(1) 本课程为考试课,课程总成绩 = 平时成绩*40% + 期末成绩*60%
(2) 考核方式:考试
其中平时成绩=考勤*10%+课后作业*30%+实验报告*40%+课堂考核*20%
过程性评价的项目内容如下:
序号 | 评价项目 | 评价内容 |
1 | 考勤 | 全勤给予满分,缺勤一次扣一分,扣完为止 |
2 | 课后作业 | 2次课后作业 |
3 | 实验报告 | 6次实验报告 |
4 | 课堂考核 | 根据课程内容,安排2次课堂考核 |
5 |
|
|
编制:胡彦蓉 审核:徐达宇
思政大纲
普通大纲