个人介绍
数据分析与挖掘技术(2024-2025-1)

主讲教师:李敏

第2期

学校: 重庆工程学院
开课院系: 大数据与人工智能学院
开课专业: 数据科学与大数据技术
学分: 3
课时: 48
课程介绍
一、课程定位与目标
(一)定位
本课程是数据科学与大数据技术、智能科学与技术的一门专业课。通过本课程的学习,学生能够理解数据分析与数据挖掘的基本概念,基本具备能够根据不同的数据集合和分析需求,选择合适的数据挖掘与分析方法的能力,并能够通过Python语言编程实现,从而为后续课程的学习和今后从事数据分析相关工作奠定技术基础和编程能力。
(二)目标 
1.知识目标
(1)了解数据分析与数据挖掘的基本概念与区别;
(2)了解Python常用的数据分析与可视化第三方库,如Numpy、pandas、matplotlib等;
(3)理解数据挖掘的基本原理和建模过程;
(4)理解数据探索的基本内容和基本方法;
(5)理解数据预处理的基本内容与基本方法; 
(6)理解并掌握数据分析与挖掘中线性回归、决策树、K-means、关联规则等常用模型或算法。
2.能力目标
(1)能够利用Python语言及第三方函数库进行初步的数据分析; 
(2)能够利用Python语言实现常用的数据挖掘模型或算法; 
(3)初步具备依据数据分析与挖掘实际问题提出相应解决方案的能力。 
3.素养目标
(1)培养对数据的敏感性,增强基于数据表达现实问题的意识,养成通过数据思考问题的习惯; 
(2)积累依托数据探索事务本质、关联和规律的活动经验,养成面对数据时专注精细的工匠精神;
(3)培养学生的数据安全意识和社会责任感,增强工程伦理意识。 
二、考核方式
(一)课程考核成绩构成
过程性考核:平时成绩*10%+实验20%+阶段测试20%
期末考试:50%
课程考核成绩=过程性考核*50%+期末考试*50%
(二)过程性考核说明
表5  过程性考核一览表
序号	          考核内容	考核方式	过程性考核中权重	备注
1	         平时成绩	         作业	         20%	
2	           实验	      代码或报告          40%	
3	 教学内容前四个        考试          	 20%	
           知识模块测验	
4	教学内容后四个        考试	                 20%	
           知识模块测验	 
                 合计			                100%	
1.平时成绩
(1)平时成绩主要由作业成绩构成,可采用百分制或等级制。
①采用百分制的平时成绩计算:(所有作业成绩之和/作业次数)。
②采用等级制的平时成绩计算:首先换算为百分制,A级-90分、B级-80分,C级-70分、D级-60分,E级50分。然后按公式:(所有作业成绩之和/作业次数)计算平时成绩。
(2)平时作业可采用纸质作业、电子作业或网络平台进行,由任课老师自行决定。
(3)要求作业要按时独立完成。
2.实验成绩=(所有实验成绩之和/实验次数)。
(三)平时成绩说明
期末考试
1.考试方式
本课程期末考核为闭卷理论考试,考试时间一般为120分钟。
2.命题要求说明
本课程卷面分数100分。考试题型一般不少于5种,主要有单项选择题、判断题、填空题、简答题以及综合运用题等。
教学方法
由于本门课程理论性较强,建议教学方法采用理论讲授加案例教学的方式。学生的学习过程要勤思考,多动手,勇提问,善归纳,做到理论和实践相结合。
教学条件

本课程理论教学建议在多媒体教室实施。实验课程安排在实验室进行,实验室需配备投影机一部、白板一套。

计算机硬件要求:内存8G以上。

软件:操作系统:Windows7及以上,Python3.6及以,以及Python第三方库、相关开发工具。

参考教材

(一)教学参考资料

[1] 张良均,谭立云,刘名军等. Python数据分析与挖掘实战(第2版)[M],北京:机械工业出版社,2020.1(第2版)

[2] 江雪松,邹静. Python数据分析[M],北京:清华大学出版社,2020.7

[3] 石胜飞. 大数据分析与挖掘[M],北京:人民邮电出版社,2018.8

[4]中国大学Mooc网: Python大数据分析(李树青)https://www.icourse163.org/course/NJUE-1458311167

(二)课外阅读书目与要求

1.书目

[1] 高博,刘冰,李立. Python数据分析与可视化[M],北京:北京大学出版社,2020.7

[2] 吴振宇,李春忠,李建锋. Python数据处理与挖掘[M],北京:人民邮电出版社,2020.7

[3] 曹洁,崔霄等. Python数据分析[M],北京:清华大学出版社,2020.6

[4] 刘顺祥. Python数据分析与挖掘(第2版)[M],北京:清华大学出版社,2020.6

2阅读要求与考核

课外阅读书目主要是为了拓展学生知识面,增加学生对所学知识的理解和掌握,不进行具体考核。

课程评价

教学资源
课程章节 | 文件类型   | 修改时间 | 大小 | 备注
1.1 概述
文档
.pptx
2024-08-28 6.27MB
2.1 pandas+matplotlib
文档
.pptx
2024-08-28 1.89MB
3.1 数据检验
文档
.pptx
2024-08-28 1.44MB
 
视频
.MP4
2024-11-17 111.36MB
3.2 特征分析(分布、对比、统计量分析)
文档
.pptx
2024-08-28 33.36MB
 
视频
.FLV
2024-08-28 19.23MB
3.3 特征分析(周期、贡献度、相关性)
文档
.pptx
2024-08-28 16.35MB
 
视频
.mp4
2024-08-28 14.53MB
3.4 实验一 数据特征分析
文档
.pptx
2024-08-28 1.81MB
 
文档
.docx
2024-08-28 417.45KB
 
表格
.xlsx
2024-08-28 11.11KB
4.1 数据清洗与数据集成
文档
.pptx
2024-08-28 38.79MB
 
视频
.mp4
2024-08-28 75.57MB
4.2 数据变换
文档
.pptx
2024-08-28 1.75MB
 
图片
.png
2024-09-24 --
4.3 数据规约
文档
.pptx
2024-08-28 2.13MB
 
视频
.mp4
2024-08-28 70.49MB
 
视频
.mp4
2024-11-17 90.77MB
5.1 一元线性回归
文档
.pptx
2024-08-28 2.00MB
5.2 多元线性回归
文档
.pptx
2024-08-28 1.16MB
5.3 实验2-回归分析
文档
.pptx
2024-08-28 646.64KB
 
文档
.docx
2024-08-28 549.22KB
 
附件
.txt
2024-08-28 47.93KB
6.1 逻辑回归
文档
.pptx
2024-08-28 40.97MB
 
视频
.mp4
2024-08-28 211.78MB
 
文档
.pptx
2024-11-10 41.19MB
 
视频
.mp4
2025-04-27 227.37MB
6.2 决策树
文档
.pptx
2024-08-28 1.59MB
6.3 实验3 分类模型
文档
.pptx
2024-08-28 860.05KB
 
文档
.docx
2024-08-28 260.08KB
 
视频
.mp4
2024-08-28 16.25MB
 
表格
.xlsx
2024-08-28 283.76KB
7.1 聚类分析
文档
.pptx
2024-08-28 2.19MB
 
表格
.xls
2024-08-28 72.50KB
 
视频
.mp4
2025-04-28 263.13MB
7.2 聚类-实例
文档
.pptx
2024-08-28 3.74MB
 
附件
.ipynb
2024-08-28 162.55KB
 
附件
.csv
2024-12-10 4.11MB
8.1 关联规则
文档
.pptx
2024-08-28 753.31KB
 
表格
.xls
2024-08-28 35.50KB
 
附件
.py
2024-08-28 2.37KB
 
附件
.py
2024-08-28 890.00Byte
 
附件
.py
2024-12-09 2.26KB
 
视频
.mp4
2025-04-27 374.77MB
8.2 实验4 关联规则
文档
.docx
2024-08-28 173.07KB
 
文档
.doc
2024-08-28 234.50KB
 
文档
.pptx
2024-08-28 982.01KB
 
附件
.csv
2025-08-11 567.97KB
 
附件
.csv
2025-08-11 2.52KB
8.3 复习
文档
.pptx
2024-12-17 2.85MB
提示框
提示框
确定要报名此课程吗?
确定取消

京ICP备10040544号-2

京公网安备 11010802021885号