目录

  • 1 分布式计算与并行计算概述
    • 1.1 分布式计算原理
    • 1.2 并行计算原理
    • 1.3 网格计算原理
    • 1.4 云计算原理
    • 1.5 Hadoop、大数据思维、大数据应用实例
  • 2 大数据处理架构Hadoop
    • 2.1 Hadoop概述
    • 2.2 Hadoop生态系统
    • 2.3 Hadoop的安装
  • 3 分布式文件系统HDFS
    • 3.1 分布式文件系统概念
    • 3.2 HDFS简介
    • 3.3 HDFS体系结构
    • 3.4 HDFS存储原理
    • 3.5 HDFS的数据读写过程
  • 4 分布式数据库HBase
    • 4.1 HBase概念与传统数据库区别
    • 4.2 HBase访问接口
    • 4.3 HBase数据模型
    • 4.4 HBase实现原理
    • 4.5 HBase运行机制
  • 5 MapReduce
    • 5.1 MapReduce概述
    • 5.2 MapReduce的工作流程
  • 6 Hadoop架构再讨论
    • 6.1 Hadoop的优化与发展
    • 6.2 HDFS2.0的新特性
    • 6.3 新一代资源管理调度框架YARN
    • 6.4 具有代表性的新功能组件
  • 7 数据仓库Hive
    • 7.1 数据仓库的概念
    • 7.2 Hive的基本特征
    • 7.3 与其他组件的关系、与传统数据库的区别
    • 7.4 Hive的系统架构
  • 8 流计算
    • 8.1 流计算概述
    • 8.2 流计算处理流程
    • 8.3 流计算应用
    • 8.4 开源流计算框架Storm
  • 9 大数据在互联网领域的应用
    • 9.1 推荐系统概述
    • 9.2 协同过滤
  • 10 资料扫描上传
    • 10.1 课堂笔记01
    • 10.2 课堂笔记02
    • 10.3 课堂笔记03
    • 10.4 课堂笔记04
    • 10.5 课堂笔记05
    • 10.6 课堂笔记06
    • 10.7 课堂笔记07
    • 10.8 课堂笔记08
    • 10.9 课堂笔记09
    • 10.10 课堂笔记10
    • 10.11 课堂笔记11
    • 10.12 课堂笔记12
    • 10.13 课堂笔记13
    • 10.14 课堂笔记14
    • 10.15 课堂笔记15
    • 10.16 课堂笔记16
    • 10.17 作业
    • 10.18 实验报告一
    • 10.19 实验报告二
    • 10.20 实验报告三
    • 10.21 月考
HBase运行机制