Hadoop大数据技术

吴琴琴、陈东林、米鹏

目录

  • 1 Hadoop概述与大数据环境准备
    • 1.1 大数据
    • 1.2 Hadoop概述
    • 1.3 大数据环境准备
    • 1.4 关闭及禁用防火墙、关闭SELinux
    • 1.5 远程终端工具安装
    • 1.6 虚拟机克隆
    • 1.7 安装JDK
  • 2 Hadoop集群安装
    • 2.1 Hadoop集群安装
    • 2.2 完全分布式集群概述、环境检查、Hadoop安装、配置、验证
    • 2.3 集群时间同步
  • 3 HDFS分布式存储
    • 3.1 HDFS分布式存储
    • 3.2 HDFS概述
    • 3.3 HDFS读写流程、HDFS的shell操作
    • 3.4 Maven安装及环境配置
    • 3.5 Idea创建maven项目、配置Idea的maven环境
    • 3.6 递归遍历HDFS
    • 3.7 HDFS上传、下载文件
  • 4 MapReduce实战
    • 4.1 MapReduce实战
    • 4.2 MapReduce、Yarn理论知识
  • 5 ZooKeeper
    • 5.1 ZooKeeper
    • 5.2 Zookeeper理论介绍
    • 5.3 Zookeeper集群安装配置及验证
  • 6 Hive数据仓库实战
    • 6.1 什么是数据仓库
    • 6.2 Hive数据仓库实战
    • 6.3 数仓分层概述
    • 6.4 Hive安装及概述
    • 6.5 Hive启动方式
    • 6.6 Hive的数据类型、DDL、DML操作
    • 6.7 Hive复杂数据类型、数据存储格式、查看表、修改表、删除、清空表
    • 6.8 Hive分区表
    • 6.9 Hive分桶表、视图、关联
    • 6.10 Hive内置函数(一)
    • 6.11 Hive内置函数(二)
    • 6.12 Hive窗口函数
    • 6.13 Hive自定义函数
  • 7 Flume数据采集实战
    • 7.1 Flume数据采集实战
    • 7.2 FLume概述、安装及配置、nc-logger案例
    • 7.3 Flume事务、agent内部原理、复制结构案例
    • 7.4 exec-logger、exec-hdfs案例
    • 7.5 spooldir-hdfs、taildir-hdfs案例
  • 8 第7章 HBase数据库实战
    • 8.1 HBase讲义
    • 8.2 Hbase安装、配置、启动
    • 8.3 HBase的DDL操作
    • 8.4 HBase的DML操作
    • 8.5 Hive整合Hbase、Hbase的JavaAPI操作
  • 9 Kafka实战
    • 9.1 Kafka实战
    • 9.2 Kafka概述、安装配置;topic创建、查看;生产数据及消费数据演示
    • 9.3 Kafka整合Flume
  • 10 影评大数据分析项目实战
    • 10.1 影评大数据分析项目实战
  • 11 旅游酒店评价大数据分析项目实战
    • 11.1 旅游酒店评价大数据分析项目实战
    • 11.2 Sqoop
    • 11.3 旅游酒店评价大数据分析项目实战-视频上
    • 11.4 旅游酒店评价大数据分析项目实战-视频下
    • 11.5 启动Spring Boot
  • 12 名人名言大数据分析项目实战
    • 12.1 名人名言项目演示视频
  • 13 新浪微博数据离线分析实战
    • 13.1 微博数据分析项目演示
  • 14 扩展
    • 14.1 Azkaban
    • 14.2 Azkaban安装配置、测试案例
    • 14.3 利用Azkaban实现数仓项目一的自动调度执行
    • 14.4 数仓项目一实现过程演示
Hadoop集群安装