第1章 数据分析与挖掘概述
主讲教师:李敏
第2期
| 学校: | 重庆工程学院 |
| 开课院系: | 大数据与人工智能学院 |
| 开课专业: | 数据科学与大数据技术 |
| 学分: | 3 |
| 课时: | 48 |
一、课程定位与目标
(一)定位
本课程是数据科学与大数据技术、智能科学与技术的一门专业课。通过本课程的学习,学生能够理解数据分析与数据挖掘的基本概念,基本具备能够根据不同的数据集合和分析需求,选择合适的数据挖掘与分析方法的能力,并能够通过Python语言编程实现,从而为后续课程的学习和今后从事数据分析相关工作奠定技术基础和编程能力。
(二)目标
1.知识目标
(1)了解数据分析与数据挖掘的基本概念与区别;
(2)了解Python常用的数据分析与可视化第三方库,如Numpy、pandas、matplotlib等;
(3)理解数据挖掘的基本原理和建模过程;
(4)理解数据探索的基本内容和基本方法;
(5)理解数据预处理的基本内容与基本方法;
(6)理解并掌握数据分析与挖掘中线性回归、决策树、K-means、关联规则等常用模型或算法。
2.能力目标
(1)能够利用Python语言及第三方函数库进行初步的数据分析;
(2)能够利用Python语言实现常用的数据挖掘模型或算法;
(3)初步具备依据数据分析与挖掘实际问题提出相应解决方案的能力。
3.素养目标
(1)培养对数据的敏感性,增强基于数据表达现实问题的意识,养成通过数据思考问题的习惯;
(2)积累依托数据探索事务本质、关联和规律的活动经验,养成面对数据时专注精细的工匠精神;
(3)培养学生的数据安全意识和社会责任感,增强工程伦理意识。
二、考核方式
(一)课程考核成绩构成
过程性考核:平时成绩*10%+实验20%+阶段测试20%
期末考试:50%
课程考核成绩=过程性考核*50%+期末考试*50%
(二)过程性考核说明
表5 过程性考核一览表
序号 考核内容 考核方式 过程性考核中权重 备注
1 平时成绩 作业 20%
2 实验 代码或报告 40%
3 教学内容前四个 考试 20%
知识模块测验
4 教学内容后四个 考试 20%
知识模块测验
合计 100%
1.平时成绩
(1)平时成绩主要由作业成绩构成,可采用百分制或等级制。
①采用百分制的平时成绩计算:(所有作业成绩之和/作业次数)。
②采用等级制的平时成绩计算:首先换算为百分制,A级-90分、B级-80分,C级-70分、D级-60分,E级50分。然后按公式:(所有作业成绩之和/作业次数)计算平时成绩。
(2)平时作业可采用纸质作业、电子作业或网络平台进行,由任课老师自行决定。
(3)要求作业要按时独立完成。
2.实验成绩=(所有实验成绩之和/实验次数)。
(三)平时成绩说明
期末考试
1.考试方式
本课程期末考核为闭卷理论考试,考试时间一般为120分钟。
2.命题要求说明
本课程卷面分数100分。考试题型一般不少于5种,主要有单项选择题、判断题、填空题、简答题以及综合运用题等。| 课程章节 | | 文件类型 | | 修改时间 | | 大小 | | 备注 | |
| 1.1 概述 |
文档
.pptx
|
2024-08-28 | 6.27MB | ||
| 2.1 pandas+matplotlib |
文档
.pptx
|
2024-08-28 | 1.89MB | ||
| 3.1 数据检验 |
文档
.pptx
|
2024-08-28 | 1.44MB | ||
|
视频
.MP4
|
2024-11-17 | 111.36MB | |||
| 3.2 特征分析(分布、对比、统计量分析) |
文档
.pptx
|
2024-08-28 | 33.36MB | ||
|
视频
.FLV
|
2024-08-28 | 19.23MB | |||
| 3.3 特征分析(周期、贡献度、相关性) |
文档
.pptx
|
2024-08-28 | 16.35MB | ||
|
视频
.mp4
|
2024-08-28 | 14.53MB | |||
| 3.4 实验一 数据特征分析 |
文档
.pptx
|
2024-08-28 | 1.81MB | ||
|
文档
.docx
|
2024-08-28 | 417.45KB | |||
|
表格
.xlsx
|
2024-08-28 | 11.11KB | |||
| 4.1 数据清洗与数据集成 |
文档
.pptx
|
2024-08-28 | 38.79MB | ||
|
视频
.mp4
|
2024-08-28 | 75.57MB | |||
| 4.2 数据变换 |
文档
.pptx
|
2024-08-28 | 1.75MB | ||
|
图片
.png
|
2024-09-24 | -- | |||
| 4.3 数据规约 |
文档
.pptx
|
2024-08-28 | 2.13MB | ||
|
视频
.mp4
|
2024-08-28 | 70.49MB | |||
|
视频
.mp4
|
2024-11-17 | 90.77MB | |||
| 5.1 一元线性回归 |
文档
.pptx
|
2024-08-28 | 2.00MB | ||
| 5.2 多元线性回归 |
文档
.pptx
|
2024-08-28 | 1.16MB | ||
| 5.3 实验2-回归分析 |
文档
.pptx
|
2024-08-28 | 646.64KB | ||
|
文档
.docx
|
2024-08-28 | 549.22KB | |||
|
附件
.txt
|
2024-08-28 | 47.93KB | |||
| 6.1 逻辑回归 |
文档
.pptx
|
2024-08-28 | 40.97MB | ||
|
视频
.mp4
|
2024-08-28 | 211.78MB | |||
|
文档
.pptx
|
2024-11-10 | 41.19MB | |||
|
视频
.mp4
|
2025-04-27 | 227.37MB | |||
| 6.2 决策树 |
文档
.pptx
|
2024-08-28 | 1.59MB | ||
| 6.3 实验3 分类模型 |
文档
.pptx
|
2024-08-28 | 860.05KB | ||
|
文档
.docx
|
2024-08-28 | 260.08KB | |||
|
视频
.mp4
|
2024-08-28 | 16.25MB | |||
|
表格
.xlsx
|
2024-08-28 | 283.76KB | |||
| 7.1 聚类分析 |
文档
.pptx
|
2024-08-28 | 2.19MB | ||
|
表格
.xls
|
2024-08-28 | 72.50KB | |||
|
视频
.mp4
|
2025-04-28 | 263.13MB | |||
| 7.2 聚类-实例 |
文档
.pptx
|
2024-08-28 | 3.74MB | ||
|
附件
.ipynb
|
2024-08-28 | 162.55KB | |||
|
附件
.csv
|
2024-12-10 | 4.11MB | |||
| 8.1 关联规则 |
文档
.pptx
|
2024-08-28 | 753.31KB | ||
|
表格
.xls
|
2024-08-28 | 35.50KB | |||
|
附件
.py
|
2024-08-28 | 2.37KB | |||
|
附件
.py
|
2024-08-28 | 890.00Byte | |||
|
附件
.py
|
2024-12-09 | 2.26KB | |||
|
视频
.mp4
|
2025-04-27 | 374.77MB | |||
| 8.2 实验4 关联规则 |
文档
.docx
|
2024-08-28 | 173.07KB | ||
|
文档
.doc
|
2024-08-28 | 234.50KB | |||
|
文档
.pptx
|
2024-08-28 | 982.01KB | |||
|
附件
.csv
|
2025-08-11 | 567.97KB | |||
|
附件
.csv
|
2025-08-11 | 2.52KB | |||
| 8.3 复习 |
文档
.pptx
|
2024-12-17 | 2.85MB |