数据资产

郭美娣

目录

  • 1 绪论
    • 1.1 数据的相关概念
      • 1.1.1 数据
      • 1.1.2 信息
      • 1.1.3 知识
      • 1.1.4 智能
    • 1.2 数据资产的相关概念
      • 1.2.1 资产
      • 1.2.2 信息资产
      • 1.2.3 数据资源
      • 1.2.4 数据资源的特征
      • 1.2.5 数据资源要素化
    • 1.3 数据资产化
      • 1.3.1 数据资产
      • 1.3.2 数据资产化的内涵
        • 1.3.2.1 扩展阅读——大数据交易所
    • 1.4 数据资产管理活动
    • 1.5 数据资产管理的保障措施
  • 2 数据资源确权
    • 2.1 数据资源确权概述
    • 2.2 数据资源确权的发展历程
    • 2.3 数据资源确权的主要方式
    • 2.4 数据资源确权的难点与对策
  • 3 数据仓库设计
    • 3.1 数据仓库设计概述
    • 3.2 数据仓库规划与需求分析
    • 3.3 数据仓库建模
      • 3.3.1 数据仓库建模的主要工作
      • 3.3.2 维表设计
      • 3.3.3 事实表设计
    • 3.4 数据仓库物理模型设计
    • 3.5 数据仓库部署与维护
  • 4 SQL Server数据仓库开发实例
    • 4.1 数据仓库OnRetDW系统需求分析
    • 4.2 数据仓库OnRetDW的建模
    • 4.3 数据抽取工具设计
    • 4.4 基于SQL Server 2012数据仓库实现
      • 4.4.1 创建数据仓库分析项目到部署分析
      • 4.4.2 浏览已部署的多维数据集
    • 4.5 MDX简介
  • 5 关联分析算法
    • 5.1 关联分析概述
    • 5.2 Apriori算法
      • 5.2.1 Apriori性质
      • 5.2.2 Apriori算法求频繁项集
      • 5.2.3 由频繁项集产生的强关联规则
    • 5.3 SQL Server挖掘关联规则
    • 5.4 电子商务数据的关联规则挖掘
    • 5.5 关联分析算法习题
  • 6 决策树分类算法
    • 6.1 分类过程
    • 6.2 决策树分类
      • 6.2.1 决策树-信息增益
      • 6.2.2 建立决策树的ID3算法
    • 6.3 SQL Server 决策树分类
    • 6.4 电子商务数据的决策树分类
    • 6.5 决策树算法习题
  • 7 贝叶斯分类算法
    • 7.1 贝叶斯分类概述
    • 7.2 朴素贝叶斯分类
    • 7.3 SQL Server朴素贝叶斯分类
    • 7.4 电子商务数据的贝叶斯分类
    • 7.5 贝叶斯分类算法习题
  • 8 回归分析算法
    • 8.1 回归分析概述及线性回归分析
    • 8.2 SQL Server线性回归分析应用
    • 8.3 非线性回归及逻辑回归
    • 8.4 SQL Server非线性回归分析应用
    • 8.5 SQL Server的逻辑回归分析应用
    • 8.6 Excel回归分析及相关统计量介绍
  • 9 SQL Server 数据仓库与数据挖掘实验
    • 9.1 SQL Server 2008安装介绍
    • 9.2 SQL Server 2012的安装
    • 9.3 创建数据库
    • 9.4 创建数据表
    • 9.5 添加数据库的方法--备份文件和附加
    • 9.6 SQL Server 导入和导出数据
    • 9.7 首次使用常见问题的处理演示-以线性回归为例
    • 9.8 上机实验--利用MDX查询及Excel透视表进行多维分析
关联分析算法习题

第5章  关联分析算法习题

1.设某事务项集如表5.4所示,填空完成其中支持度和置信度的计算。

2.对于表5.5所示的事务集合,设最小支持度计数为3,采用Apriori算法求出所有的频繁项集。

以下两题作为思考,可不提交,原理相同

3.有一个事务集合如表5.6所示,设最小支持度计数为2和3,采用Apriori算法求出两种最小支持度下所有的频繁项集。

4.有一个事务集合如表5.7所示,设最小支持度计数为4,采用Apriori算法求出所有的频繁项集。

5.某个食品连锁店每周的事务记录如表5.8所示,每个事务表示在一项收款机业务中卖出的商品项集,

假定min_sup=40%,min_conf=40%,使用Apriori算法生成的强关联规则。 

6.假定有一个购物篮数据集,包含100个事务和20个项。如果项a的支持度为25%,项b的支持度为90%,且项集{a,b}的支持度为20%。

令最小支持度阈值和最小置信度阈值分别为10%和60% 。

计算关联a →b的置信度。 

7.一个事务数据库D有4笔交易,如表5.9所示。设min_sup=60%,min_conf=80%。使用Apriori算法找出频繁项集和所有三个项的强关联规则。