目录

  • 导入模块 Hadoop简介
    • ● 任务1.1 Hadoop概述
  • 模块一 HDFS分布式文件系统
    • ● 模块导学
    • ● 任务1.1 HDFS的核心设计
    • ● 任务1.2 HDFS的原理解析
    • ● 任务1.3 HDFS的Java API操作
  • 模块二 MapReduce分布式计算框架
    • ● 模块导学
    • ● 任务2.1 MapReduce基础
    • ● 任务2.2 MapReduce框架原理
    • ● 任务2.3 MapReduce综合实战
  • 模块一 分布式协调服务Zookeeper
    • ● 任务1.1 Zookeeper的安装与部署
    • ● 任务1.2 Zookeeper的Java API操作
    • ● 任务1.3 Hadoop2.0新特性
    • ● 任务1.4 Hadoop高可用集群
  • 模块二 Hive数据仓库
  • 模块三 日志采集系统Flume
    • ● 模块导学
    • ● 任务3.1 Flume运行机制
    • ● 任务3.2 Flume监听文件夹和文件
    • ● 任务3.3 Flume可靠性保证
      • ● 任务3.4 Flume采集电商网站日志
  • 模块四 数据迁移Sqoop
    • ● 模块导学
    • ● 任务4.1 Sqoop的安装与配置
    • ● 任务4.2 Sqoop数据迁移实战
  • 模块五 Azkaban工作流管理器
    • ● 模块导学
    • ● 任务5.1 认识Azkaban
    • ● 任务5.2 部署Azkaban
  • 模块六 计算引擎 Flink
    • ● 模块导学
    • ● 任务6.1 Flink开发环境搭建
    • ● 任务6.2 Flink集群搭建
任务1.3 Hadoop2.0新特性
  • 1 学习目标
  • 2 新知初识
  • 3 实操探究
  • 4 拓展学习