个人介绍
数据挖掘综合实训

主讲教师:陈星

教师团队:共5

  • 张治斌
  • 郑淑晖
  • 陈悦
  • 赵玉新
  • 耿秀华
本课程以IBM公司SPSS Modeler软件的应用为主线,通过介绍和实践的方式,帮助学生掌握数据挖掘的基本概念、原理、算法以及分析方法、技术和应用,使学生具有对数据进行分析、挖掘的能力,理解和掌握基本算法与参数设置的能力,培养学生分析数据、挖掘获取知识的基本能力,为其今后在相关领域开展工作打下坚实的基础。

学校: 北京信息职业技术学院
开课院系: 软件与信息学院
专业大类: 电子信息大类
开课专业: 大数据技术与应用
课程英文名称: Data Mining Application
课程编号: ZJ1647608
学分: 4
课时: 64
教师团队

张治斌

职称:副教授

单位:北京信息职业技术学院

部门:软件与信息学院

职位:二级学院副院长

郑淑晖

职称:副教授

单位:北京信息职业技术学院

部门:软件与信息学院

职位:教师

陈悦

职称:讲师

单位:北京信息职业技术学院

部门:软件与信息学院

职位:教师

赵玉新

职称:讲师

单位:北京信息职业技术学院

部门:软件与信息学院

职位:教师

耿秀华

职称:教授

单位:北京信息职业技术学院

部门:软件与信息学院

职位:教师

教学方法

构建基于工程实践的数字教学资源的开发。开展深度校企合作,与企业专家共同基于专业标准、岗位能力、职业素养、立德树人的人才培养要素针对原有课程标准、教学设计方案进行优化,对企业真实工程案例进行教学化改造,对企业真实数据进行脱敏处理,开发满足“教、学、做一体化”的教学项目与数字资源;以国家级职业教育计算机应用技术专业教学资源库为引领和开发标准,构建以课件、动画、音视频、图片、文本、案例、技能题库等为主要形式,适合高职教育、学生喜闻乐见的优质数字化教育资源。


使用工具

一、安装环境:Windows10, Windows8, Windows7, WinVista, WinXP

二、使用软件:IBM SPSS_Modeler_18(bit64)

三、软件下载地址:https://www.ibm.com/products/spss-modeler

四、本课程所使用的数据及流文件见课程内“课程资料”部分

教学目标

一、职业能力目标   

职业能力目标考核标准
数据挖掘应用基础理解
  1. 掌握大数据技术的应用与常见技术特征

  2. 什么是数据挖掘;为什么要数据挖掘;

  3. 数据挖掘技术分类; 知识发现的概念与过程;

  4. 数据挖掘的过程;数据挖掘的基本算法

  5. 掌握挖掘应用学习的基本方法,掌握数据的导入、清理与挖掘的基本过程

  6. 理解什么是数据立方体,以及数据立方体的常用计算方法
数据加工、预处理能力
  1. 了解什么是数据预处理技术;为什么要数据预处理,以及数据预处理的主要任务

  2. 了解并掌握数据读取的主要工作;SPSS Modeler的数据读取与集成方法

  3. 了解数据理解的主要任务,明确SPSS Modeler的数据理解

  4. 掌握SPSS Modeler的基本分析方法

  5. 掌握SPSS Modeler的数据精简基本方法
选择数据挖掘算法能力
  1. 理解什么是决策树;决策树的核心问题与修剪方法

  2. 了解分类回归树概念;分类回归树修剪过程;分类回归树的基本应用

  3. 掌握贝叶斯公式与概率,了解TAN贝叶斯网络与马尔科夫毯网络

  4. 掌握什么是聚类分析;聚类分析的一般过程;以及聚类分析的参数设置方法

  5. 掌握K-Means聚类及应用;两步聚类及应用:明氏与欧氏距离; Kohonen网络聚类及应用;

  6. 什么是关联挖掘与举例:支持度与置信度;Apriori算法说明;序列关联与应用

  7. 了解基本概念;人工神经网络算法解析;人工神经网络的意义
数据挖掘工具使用能力
  1. 使用SPSS Modeler完成分类预测

  2. 使用SPSS Modeler完成聚类分析

  3. 使用SPSS Modeler完成关联挖掘

  4. 使用SPSS Modeler完成人工神经网络分析

一、通用能力与职业素质目标   

通用能力与职业素质

考核标准考核方式
信息处理能力

1.能够借助图书馆、互联网等传媒有效获取信息;

2.能够借助团队或他人有效获取信息;

3.能够对信息进行加工整理,并合理使用。
习题、作业
自主学习能力

1.能够合理制定学习计划;

2.能够有效执行计划,并根据情况变化进行调整;

3.能够不断改进学习方法。
习题、作业、项目制作
与人合作能力 1.尊重他人、服从权威;

2.能够与他人有效沟通;

3.作为团队成员能够主动履职、互相配合。
讨论与分析
安全意识

1.能够在工作场所按照安全规范穿戴和使用劳动防护用品;

2.具有安全操作意识,按照安全规范使用各种工具及设备;

3.具备对触电、起火、雷击等事故的应急处理能力。
项目制作
批判性思维 1.勇于质疑和表达观点;
2.在质疑的同时,能进一步提出建设性意见。
讨论



参考教材
  1. 《SPSS Modeler数据挖掘方法及应用(第3版)》 薛薇,中国工信出版集团、电子工业出版社

XY课程简介

本课程按照边讲边练,以实践为主线,针对数据挖掘整套流程,以IBM公司产品SPSS Modeler软件的应用为主线,通过边介绍,边实践的课程结构方式,帮助学生掌握数据挖掘的基本概念、基本原理、基本算法、分析方法、技术和应用,使学生具有对数据进行分析、挖掘的能力,理解和掌握基本算法与参数设置的能力,培养学生分析数据、挖掘获取知识的基本能力。

本课程适合具备基本大数据基础知识、软件编程基础的专科及以上层次学生学习,此外,鉴于本课程涵盖诸多大数据通识及统计学原理的通俗易懂介绍,也适合于通识教育中数据挖掘知识的普及,另外对于想从事与SPSS Modeler相关工作的初学者同样具备学习和参考价值。

XY学习人群

本门课程在以核心职业能力为培养目标的课程体系中,采用以IBM公司产品SPSS Modeler软件为主线,通过任务驱动的学习,实现理论与实践同步结合,帮助学生掌握数据挖掘的基本概念、原理、算法、分析方法、技术和应用能力,使学生具备基于SPSS Modeler完成结构化数据的准备、清洗、挖掘及撰写总结报告的能力,理解和掌握基本算法与参数设置。在课程的任务设计过程中,我们将这些内容融入到课程的任务活动中。

本课程将从预测任务和知识发现两个方面的内容对数据挖掘进行介绍,预测任务是根据其他属性的值,预测特定属性的值;知识发现是导出概括数据中潜在联系的模式,重点讲授数据挖掘中的分类技术、聚类分析等算法。

为此设计了3个大任务10个子任务,分别如下所述:

子任务1:数据挖掘课程导论

子任务2:SPSS Modeler软件简介与第一个挖掘应用学习

子任务3:数据仓库与数据立方体

子任务4:数据预处理技术

子任务5:Modeler分类预测

子任务6:分类预测之贝叶斯网络

子任务7:聚类分析

子任务8:关联挖掘

子任务9:人工神经网络

子任务10:时间序列

教学资源
课程章节 | 文件类型   | 修改时间 | 大小 | 备注
1.1 网络课程导学及学生学习指引
文档
.docx
2022-12-15 22.88KB
 
文档
.docx
2022-12-15 25.27KB
1.2 课标、计划及首页
文档
.docx
2022-12-15 38.24KB
 
文档
.docx
2022-12-15 48.88KB
 
文档
.docx
2022-12-15 109.76KB
2.1 大数据时代的常见技术特征(2学时)(第1周)
视频
.mp4
2022-12-15 164.57MB
 
视频
.mp4
2022-12-15 42.39MB
 
视频
.mp4
2022-12-15 128.90MB
 
视频
.mp4
2022-12-15 125.75MB
 
文档
.pptx
2022-12-15 1.71MB
 
文档
.pptx
2022-12-15 1.14MB
 
文档
.pptx
2022-12-15 2.62MB
 
文档
.pptx
2022-12-15 1013.67KB
 
文档
.pptx
2022-12-15 1.16MB
 
作业
.work
2022-12-15 --
 
附件
.${file.extension}
2022-12-15 --
2.1.1 直播课
视频
.mp4
2022-12-15 66.16MB
 
视频
.mp4
2022-12-15 46.83MB
2.2 数据挖掘初探(2学时)(第1周)
视频
.mp4
2022-12-15 33.53MB
 
视频
.mp4
2022-12-15 83.38MB
 
文档
.pptx
2022-12-15 739.62KB
 
文档
.docx
2022-12-15 165.39KB
 
文档
.pptx
2022-12-15 3.07MB
 
文档
.pptx
2022-12-15 730.94KB
 
文档
.pptx
2022-12-15 2.44MB
 
文档
.pptx
2022-12-15 1.46MB
 
文档
.pptx
2022-12-15 1.31MB
 
文档
.pptx
2022-12-15 2.25MB
 
文档
.pptx
2022-12-15 1.52MB
 
文档
.pptx
2022-12-15 1.21MB
 
作业
.work
2022-12-15 --
2.3 数据挖掘的过程与算法简介(2学时)(第2周)
视频
.mp4
2022-12-15 36.70MB
 
视频
.mp4
2022-12-15 128.22MB
 
文档
.pptx
2022-12-15 913.95KB
 
文档
.pptx
2022-12-15 851.46KB
 
文档
.pptx
2022-12-15 1.78MB
 
作业
.work
2022-12-15 --
 
附件
.${file.extension}
2022-12-15 --
2.3.1 直播课
视频
.mp4
2022-12-15 50.74MB
3.1 SPSS Modeler软件界面介绍(2课时)(第2周)
视频
.mp4
2022-12-15 19.03MB
 
文档
.docx
2022-12-15 552.78KB
 
文档
.pptx
2022-12-15 1.03MB
 
文档
.pptx
2022-12-15 944.86KB
 
文档
.pptx
2022-12-15 807.96KB
 
文档
.pptx
2022-12-15 834.71KB
 
文档
.pptx
2022-12-15 895.78KB
 
文档
.pptx
2022-12-15 866.13KB
 
作业
.work
2022-12-15 --
3.2 挖掘应用学习(2课时)(第3周)
视频
.mp4
2022-12-15 23.56MB
 
视频
.mp4
2022-12-15 34.85MB
 
文档
.pptx
2022-12-15 6.78MB
 
作业
.work
2022-12-15 --
3.2.1 直播课
视频
.mp4
2022-12-15 49.94MB
 
视频
.mp4
2022-12-15 61.66MB
4.1 数据仓库(2课时)(第3周)
视频
.mp4
2022-12-15 49.30MB
 
文档
.docx
2022-12-15 163.90KB
 
文档
.pptx
2022-12-15 753.71KB
 
文档
.pptx
2022-12-15 802.32KB
 
文档
.pptx
2022-12-15 2.43MB
 
附件
.${file.extension}
2022-12-15 --
 
附件
.${file.extension}
2022-12-15 --
4.2 数据立方体(2课时)(第5周)
视频
.mp4
2022-12-15 19.69MB
 
视频
.mp4
2022-12-15 45.34MB
 
视频
.mp4
2022-12-15 10.10MB
 
文档
.pptx
2022-12-15 20.31MB
 
文档
.docx
2022-12-15 197.37KB
 
文档
.pptx
2022-12-15 764.79KB
 
文档
.pptx
2022-12-15 779.28KB
 
文档
.pptx
2022-12-15 815.61KB
5.1 数据预处理技术概述(2课时)(第5周)
视频
.mp4
2022-12-15 136.76MB
 
视频
.mp4
2022-12-15 33.35MB
 
视频
.mp4
2022-12-15 21.13MB
 
文档
.docx
2022-12-15 162.58KB
 
文档
.pptx
2022-12-15 735.41KB
 
文档
.docx
2022-12-15 193.14KB
 
文档
.pptx
2022-12-15 731.50KB
 
文档
.pptx
2022-12-15 743.10KB
 
文档
.pptx
2022-12-15 1.55MB
5.2 预处理之数据读取(2课时)(第6周)
视频
.mp4
2022-12-15 32.61MB
 
视频
.mp4
2022-12-15 25.75MB
 
视频
.mp4
2022-12-15 10.07MB
 
视频
.mp4
2022-12-15 14.63MB
 
文档
.pptx
2022-12-15 1.01MB
 
文档
.pptx
2022-12-15 1.27MB
 
文档
.pptx
2022-12-15 867.46KB
 
文档
.pptx
2022-12-15 1.17MB
 
文档
.pptx
2022-12-15 815.21KB
5.3 预处理之数据理解(4课时)(第6周、第7周)
视频
.mp4
2022-12-15 23.01MB
 
视频
.mp4
2022-12-15 27.40MB
 
视频
.mp4
2022-12-15 54.98MB
 
视频
.mp4
2022-12-15 49.36MB
 
文档
.pptx
2022-12-15 1.23MB
 
文档
.pptx
2022-12-15 795.55KB
 
文档
.ppt
2022-12-15 2.56MB
 
文档
.pptx
2022-12-15 1.23MB
 
文档
.pptx
2022-12-15 1.21MB
 
文档
.pptx
2022-12-15 1.00MB
 
文档
.pptx
2022-12-15 806.01KB
5.4 预处理之数据准备(4课时)(第7周、第8周)
文档
.pptx
2022-12-15 6.54MB
 
文档
.docx
2022-12-15 160.73KB
 
文档
.pptx
2022-12-15 918.69KB
 
文档
.pptx
2022-12-15 977.88KB
 
文档
.pptx
2022-12-15 1.12MB
 
文档
.pptx
2022-12-15 1.28MB
 
视频
.mp4
2022-12-15 22.60MB
 
视频
.mp4
2022-12-15 23.86MB
 
视频
.mp4
2022-12-15 19.42MB
 
视频
.mp4
2022-12-15 28.32MB
5.5 预处理之基本分析(2课时)(第8周)
文档
.pptx
2022-12-15 965.13KB
 
文档
.pptx
2022-12-15 1.00MB
 
文档
.pptx
2022-12-15 1.58MB
 
文档
.pptx
2022-12-15 864.35KB
 
文档
.pptx
2022-12-15 1.03MB
 
文档
.pptx
2022-12-15 1.03MB
 
文档
.pptx
2022-12-15 869.12KB
 
文档
.pptx
2022-12-15 1.31MB
 
文档
.pptx
2022-12-15 1.04MB
 
文档
.pptx
2022-12-15 1016.87KB
5.6 预处理之数据精简(4课时)(第10周)
视频
.mp4
2022-12-15 39.05MB
 
视频
.mp4
2022-12-15 55.72MB
 
视频
.mp4
2022-12-15 219.86MB
 
文档
.pptx
2022-12-15 803.08KB
 
文档
.pptx
2022-12-15 1.05MB
 
文档
.pptx
2022-12-15 1.24MB
 
文档
.pptx
2022-12-15 1.28MB
 
文档
.pptx
2022-12-15 4.70MB
 
文档
.pptx
2022-12-15 967.64KB
 
文档
.pptx
2022-12-15 930.37KB
 
文档
.pptx
2022-12-15 1.11MB
 
文档
.doc
2022-12-15 39.00KB
6.1 决策树的算法概述(2课时)(第11周)
视频
.mp4
2022-12-15 180.68MB
 
文档
.pptx
2022-12-15 754.04KB
 
文档
.pptx
2022-12-15 747.95KB
 
文档
.pptx
2022-12-15 1.42MB
 
文档
.pptx
2022-12-15 762.57KB
 
文档
.pptx
2022-12-15 1.65MB
6.2 SPSS Modeler的C5.0算法及应用(2课时)(第11周)
视频
.mp4
2022-12-15 36.07MB
 
文档
.pptx
2022-12-15 934.07KB
 
文档
.pptx
2022-12-15 866.77KB
 
文档
.pptx
2022-12-15 1.87MB
 
文档
.pptx
2022-12-15 1.25MB
6.3 SPSS Modeler分类回归树及应用(2课时)(第12周)
视频
.mp4
2022-12-15 23.01MB
 
视频
.mp4
2022-12-15 37.87MB
 
文档
.docx
2022-12-15 162.89KB
 
文档
.docx
2022-12-15 167.05KB
 
文档
.docx
2022-12-15 166.88KB
 
文档
.pptx
2022-12-15 725.84KB
 
文档
.pptx
2022-12-15 1.26MB
7.1 贝叶斯网络方法概述(2课时)(第12周)
视频
.mp4
2022-12-15 108.34MB
 
视频
.mp4
2022-12-15 25.89MB
 
视频
.mp4
2022-12-15 35.65MB
 
文档
.pptx
2022-12-15 792.02KB
 
文档
.pptx
2022-12-15 842.05KB
 
文档
.pptx
2022-12-15 760.42KB
 
文档
.pptx
2022-12-15 757.02KB
 
文档
.pptx
2022-12-15 1.47MB
 
文档
.pptx
2022-12-15 762.29KB
 
文档
.pptx
2022-12-15 807.54KB
 
文档
.pptx
2022-12-15 807.55KB
 
文档
.pptx
2022-12-15 1.78MB
 
文档
.pptx
2022-12-15 1.53MB
 
文档
.pptx
2022-12-15 772.90KB
 
文档
.pptx
2022-12-15 1.14MB
7.2 SPSS Modeler的贝叶斯网络应用(4课时 13周)
视频
.mp4
2022-12-15 30.55MB
 
文档
.docx
2022-12-15 627.30KB
 
文档
.pptx
2022-12-15 862.14KB
 
文档
.pptx
2022-12-15 1.28MB
 
文档
.pptx
2022-12-15 737.81KB
 
文档
.pptx
2022-12-15 807.55KB
 
文档
.pptx
2022-12-15 915.24KB
8.1 聚类分析基本概念(2课时 14周)
视频
.mp4
2022-12-15 28.15MB
 
视频
.mp4
2022-12-15 105.26MB
 
文档
.pptx
2022-12-15 4.05MB
 
文档
.pptx
2022-12-15 799.09KB
 
文档
.pptx
2022-12-15 839.14KB
 
文档
.pptx
2022-12-15 1.80MB
 
文档
.pptx
2022-12-15 761.30KB
 
文档
.pptx
2022-12-15 831.41KB
 
文档
.pptx
2022-12-15 1.33MB
8.2 聚类分析的算法(2课时 14周)
视频
.mp4
2022-12-15 27.67MB
 
视频
.mp4
2022-12-15 38.04MB
 
文档
.pptx
2022-12-15 914.79KB
 
文档
.pptx
2022-12-15 908.65KB
 
文档
.pptx
2022-12-15 764.26KB
 
文档
.pptx
2022-12-15 824.88KB
 
文档
.pptx
2022-12-15 1.89MB
8.3 聚类分析之离群点检测方法(1课时)(第15周)
视频
.mp4
2022-12-15 31.91MB
 
视频
.mp4
2022-12-15 37.56MB
 
视频
.mp4
2022-12-15 186.99MB
 
文档
.pptx
2022-12-15 760.48KB
 
文档
.pptx
2022-12-15 762.07KB
 
文档
.pptx
2022-12-15 1.23MB
 
文档
.pptx
2022-12-15 835.49KB
 
文档
.pptx
2022-12-15 890.44KB
 
文档
.pptx
2022-12-15 781.10KB
 
文档
.pptx
2022-12-15 790.28KB
 
文档
.pptx
2022-12-15 761.30KB
 
文档
.pptx
2022-12-15 754.84KB
 
文档
.pptx
2022-12-15 1.29MB
 
文档
.pptx
2022-12-15 1.15MB
 
文档
.pptx
2022-12-15 1.74MB
9.1 关联挖掘基本概念(1课时)(第15周)
视频
.mp4
2022-12-15 23.54MB
 
视频
.mp4
2022-12-15 182.80MB
 
视频
.mp4
2022-12-15 22.59MB
 
文档
.pptx
2022-12-15 1.28MB
 
文档
.pptx
2022-12-15 754.54KB
 
文档
.pptx
2022-12-15 825.21KB
 
文档
.pptx
2022-12-15 787.62KB
 
文档
.pptx
2022-12-15 763.85KB
 
文档
.pptx
2022-12-15 732.55KB
 
文档
.pptx
2022-12-15 1.46MB
 
文档
.pptx
2022-12-15 1.35MB
 
文档
.pptx
2022-12-15 2.00MB
9.2 SPSS Modeler的关联分析(2课时)(第15周)
文档
.pptx
2022-12-15 1.82MB
 
文档
.pptx
2022-12-15 799.06KB
 
文档
.pptx
2022-12-15 883.12KB
 
视频
.mp4
2022-12-15 46.04MB
10.1 人工神经网络概述(2课时)(第16周)
视频
.mp4
2022-12-15 12.09MB
 
文档
.docx
2022-12-15 164.13KB
 
文档
.docx
2022-12-15 271.31KB
 
文档
.docx
2022-12-15 162.21KB
10.2 神经网络建立的一般步骤(1课时)(第16周)
文档
.pptx
2022-12-15 772.95KB
 
文档
.pptx
2022-12-15 823.45KB
 
文档
.pptx
2022-12-15 769.28KB
 
文档
.pptx
2022-12-15 856.33KB
 
文档
.pptx
2022-12-15 798.37KB
10.3 B-P神经网络(1课时)(第16周)
文档
.pptx
2022-12-15 869.33KB
 
文档
.pptx
2022-12-15 869.33KB
11.1 时间序列(2课时)(第17周)
视频
.mp4
2022-12-15 23.19MB
 
视频
.mp4
2022-12-15 19.09MB
 
视频
.mp4
2022-12-15 17.74MB
 
文档
.pptx
2022-12-15 825.43KB
 
文档
.pptx
2022-12-15 792.22KB

课程章节

提示框
取消 进入课程
提示框
确定要报名此课程吗?
确定取消

京ICP备10040544号-2

京公网安备 11010802021885号