目录

  • 1 第0章 序
    • 1.1 0.1啤酒与尿布的故事——神奇的购物篮分析
    • 1.2 0.2数据挖掘技术大咖——美籍华人韩家炜教授
    • 1.3 0.3国内大数据第一人——阿里巴巴总裁马云
    • 1.4 0.4科学发展的全新时代——数据科学时代
  • 2 第一章 引论
    • 2.1 1.1 数据挖掘的目的
    • 2.2 1.2 数据挖掘的概念
    • 2.3 1.3 数据挖掘的对象
    • 2.4 1.4 数据挖掘的功能
    • 2.5 1.5 数据挖掘的技术
    • 2.6 1.6 数据挖掘的应用领域
    • 2.7 1.7 数据挖掘的主要问题
  • 3 第二章 认识数据
    • 3.1 2.1数据对象与属性类型
    • 3.2 2.2数据的基本统计描述
      • 3.2.1 2.2.1 中心趋势度量
      • 3.2.2 2.2.2 分散性度量
      • 3.2.3 2.2.3 基本统计描述的图形显示
    • 3.3 2.3 数据可视化
    • 3.4 2.4 度量数据的相似性和相异性
  • 4 第三章 数据预处理
    • 4.1 3.1 数据预处理:概述
    • 4.2 3.2 数据清理
    • 4.3 3.3 数据集成
    • 4.4 3.4 数据归约
      • 4.4.1 3.4.1 维归约
      • 4.4.2 3.4.2 数值归约
    • 4.5 3.5 数据变换和数据离散化
  • 5 第四章 挖掘频繁模式、关联与相关性
    • 5.1 4.1 基本概念
    • 5.2 4.2 频繁项集挖掘方法
      • 5.2.1 4.2.1 Apriori:候选生成和测试方法
      • 5.2.2 4.2.2 提高Apriori算法的效率
      • 5.2.3 4.2.3 FP-growth: 频繁模式增长方法
    • 5.3 4.3 哪些模式是有趣的?——模式评估方法
  • 6 第五章 聚类分析:基本概念与方法
    • 6.1 5.1 聚类分析:基本概念
    • 6.2 5.2 & 5.3 主要聚类方法的分类&划分方法
    • 6.3 5.4 其他聚类方法
  • 7 习题课
    • 7.1 习题课
3.2 数据清理