课程门户-章节详情

数据仓库与数据挖掘A

胡彦蓉

1 第一章数据仓库概述
- 1.1 授课安排
- 1.2 数据仓库及其历史
  - 1.2.1 数据仓库的概念
    - 1.2.1.1 本节视频
  - 1.2.2 数据仓库特征
    - 1.2.2.1 本节视频
- 1.3 数据仓库系统结构
  - 1.3.1 数据仓库系统的组成
    - 1.3.1.1 本节视频
  - 1.3.2 ETL
    - 1.3.2.1 本节视频
  - 1.3.3 数据仓库和数据集市的关系
  - 1.3.4 元数据及其管理
  - 1.3.5 数据集市和元数据管理视频
- 1.4 数据仓库系统开发工具
- 1.5 数据仓库与操作型数据库的关系
  - 1.5.1 本节视频内容
2 第二章数据仓库设计
- 2.1 授课安排
- 2.2 数据仓库设计概述
- 2.3 数据仓库的规划和需求分析
- 2.4 数据仓库的建模
- 2.5 数据仓库的物理模型设计
- 2.6 数据仓库的部署和维护
3 第三章 OLAP技术
- 3.1 授课安排
- 3.2 OLAP概述
- 3.3 OLAP的多维数据模型
- 3.4 OLAP实现
4 第四章数据
- 4.1 课程资料
5 第五章数据挖掘概述
- 5.1 授课安排
- 5.2 什么是数据挖掘？
- 5.3 数据挖掘系统
- 5.4 视频
- 5.5 数据挖掘过程
6 第六章关联分析
- 6.1 授课安排
- 6.2 关联分析概念
- 6.3 Apriori算法
- 6.4 FP-growth树
- 6.5 多层关联规则
- 6.6 【扩充知识】机器学习——关联规则——支持度（support)、置信度（confidence）、提升度（Lift)
7 第七章序列模式挖掘
- 7.1 序列模式挖掘概述
- 7.2 AprioriAll算法
- 7.3 AprioriSome算法
- 7.4 FreeSpan算法
- 7.5 PrefixSpan算法
8 第八章聚类分析
- 8.1 聚类概述
9 分类算法
- 9.1 课件
10 实验1 python基础
- 10.1 讲解文本内容
- 10.2 课程PDF
- 10.3 实验代码
- 10.4 实验报告封皮
11 实验2-python
- 11.1 讲解文本内容
- 11.2 实验代码
- 11.3 实验报告封面
12 实验3--python
- 12.1 讲解文本内容
- 12.2 实验代码
- 12.3 实验报告封面
13 实验4--python
- 13.1 讲解文本内容
- 13.2 21.1实验代码
- 13.3 实验内容2
- 13.4 实验内容3
- 13.5 实验报告封面
14 实验5--python
- 14.1 文本内容-NumPy模块
- 14.2 第三方可视化数据分析图表
- 14.3 数据
- 14.4 思考题
- 14.5 实验报告封面
15 实验6--python
- 15.1 实验 NumPy矩阵的基本操作
- 15.2 实验关联规则算法
- 15.3 实验商品零售购物篮分析
- 15.4 实验报告封面
16 实验7--python
- 16.1 实验1 用关联规则分析方法推荐电影
- 16.2 实验2 FP-growth算法
- 16.3 实验3 教育平台的线上课程推荐策略
- 16.4 实验报告封面
17 实验8-python
- 17.1 实验1 购物车分析
- 17.2 实验2 基于关联规则的文本分析
18 实验9--python
- 18.1 实验1 聚类分析
- 18.2 实验2 航空公司客户价值分析
- 18.3 实验3 运输车辆安全驾驶行为分析
- 18.4 实验报告封面

FP-growth树

请各位同学学习参考教材的第6章！！！！！

各位宝贝同学可以结合课程内容在线学习！！！

一、FP-growth算法框架

FP-growth算法的基本思路如下：

①扫描一次事务数据库，找出频繁1-项集合，记为L，并把它们按支持度计数的降序进行排列。

②基于L，再扫描一次事务数据库，构造表示事务数据库中项集关联的FP树。

③在FP树上递归地找出所有频繁项集。

④最后在所有频繁项集中产生强关联规则。

二、FP树构造

FP树是事务集合中项集关联的压缩表示，其构造方法如下：

①扫描一次事务数据库，找出频繁1-项集合L，并按支持度计数降序排序L中的频繁项。

②创建FP树的根结点，用“null”标记。

③再扫描一次事务集合，对每个事务找出其中的频繁项并按L中的顺序排序，为每个事务创建一个分支，事务分支路径上的结点就是该事务中的已排序频繁项。对于各个事务分支，如果可以共享路径则必须共享，并且在各个结点上记录共享事务数目；若不能共享则需要建立相应的子结点。

为了方便遍历FP树，为FP树创建一个项头表，项头表中每一行表示一个1-频繁项，并有一个指针指向它在FP树中的结点。

FP树中所有相同频繁项的结点通过指针连成一个链表。

从FP树可以看出，包含某个1-频繁项的所有可能的频繁项集可以通过这个链表搜索到。

三、由FP树产生频繁项集

由FP树产生频繁项集的过程是：由每个长度为1的频繁模式（初始后缀模式）开始，构造它的条件模式基，条件模式基由FP树中与后缀模式一起出现的前缀路径集组成。然后构造它的（条件）FP树，并递归地在该树上进行挖掘。

从上向下的路径构成模式{i1，i2，i3}，{i3}称为它的后缀模式，对于后缀模式α，{i2}∪α称为增长后缀模式。{i1，i2}称为i3的前缀路径。

FP-growth树

图片预览