目录

  • 1 课程资料
    • 1.1 课程标准
    • 1.2 教学日历
    • 1.3 教案
  • 2 大数据时代
    • 2.1 大数据概述
    • 2.2 大数据的4V特征和关键技术
    • 2.3 大数据与云计算、物联网的关系
    • 2.4 直播录屏
    • 2.5 章节测试
  • 3 大数据处理架构Hadoop
    • 3.1 平台搭建(VM+UbuntuKylin16.04+Hadoop伪分布式+Hbase伪分布式)
    • 3.2 Hadoop简介
    • 3.3 Hadoop的版本
    • 3.4 Hadoop项目结构
    • 3.5 Hadoop安装与配置
    • 3.6 Hadoop伪分布式集群搭建
    • 3.7 章节测试
  • 4 分布式文件系统HDFS简介
    • 4.1 分布式文件系统HDFS简介
      • 4.1.1 HDFS的基本操作实验
    • 4.2 HDFS的基本概念
    • 4.3 HDFS的体系结构
    • 4.4 HDFS的存储策略
    • 4.5 HDFS的数据读写过程
      • 4.5.1 第一关:HDFS Java API编程 ——文件读写
    • 4.6 第2关:HDFS-JAVA接口之上传文件
    • 4.7 章节测试
  • 5 分布式数据HBASE
    • 5.1 HBASE简介
    • 5.2 HBASE数据模型
    • 5.3 HBASE的实现原理
    • 5.4 HBASE运行机制
    • 5.5 HBASE的应用方案。
    • 5.6 章节测试
    • 5.7 Hbase数据库的安装
  • 6 MapReduce概述
    • 6.1 分布式并行编程方式
    • 6.2 MapReduce模型
    • 6.3 MapReduce体系结构
    • 6.4 MapReduce的工作流程
    • 6.5 shuffle操作的过程原理
    • 6.6 章节测试
  • 7 Spark简介
    • 7.1 ​ Spark简介
    • 7.2 Spark与Hadoop的对比
    • 7.3 Spark运行架构基本概念和架构设计
    • 7.4 Spark运行基本流程
    • 7.5 RDD设计与运行原理
    • 7.6 Spark应用实例
    • 7.7 章节测试
  • 8 流计算
    • 8.1 流计算概念及框架
    • 8.2 流计算处理流程及应用
    • 8.3 章节测试
  • 9 大数据的应用
    • 9.1 大数据的应用领域
    • 9.2 大数据助力精准防疫
    • 9.3 章节测试
  • 10 拓展阅读
    • 10.1 区块链
    • 10.2 COVID-19疫情的数据科学实践之Python疫情数据爬取
    • 10.3 大数据技术工具
      • 10.3.1 交通大数据案例
  • 11 主题讨论
    • 11.1 主题讨论
大数据技术工具

广东金融学院建设了一门《大数据工具应用》在线课程,已经成功运行了五轮,累计学员超过万人。该课程以普及大数据基础知识和工具应用为使命,立足应用入门,强调工具应用,初步获得数据获取、分析与呈现能力,建立数据思维。学习先决条件仅为熟练使用Word和Excel,教学与学习中都无需编程,可视为基本无门槛。我们的课程在智慧树平台对全国各个高校全面免费开放,目前正在开课中。该课程既可以选为学分课也可选为兴趣课,同学们完成学习考核通过后,一定会大有收获。我们在课程论坛上也会及时答疑,给同学们提供帮助。如果贵校有意通过智慧树平台引进该课程或将该课程作为日常教学的补充资源(均免费),请添加微信13929569029联系!感谢您的大力支持。课程简介:https://coursehome.zhihuishu.com/courseHome/2067507


目录:

第一章 大数据基本概念与应用案例

1.1基本概念、应用案例


第二章 数据获取

2.1格式转换与数据清洗 

2.2网页获取 


第三章 数据分析入门

3.1Weka简介与数据预处理

3.1.1Weka简介 

3.1.2预处理

3.2 数据分类 

3.3数据聚类

3.4数据关联 

3.5选择属性 

3.6数据可视化 


第四章 数据分析进阶

4.1贝叶斯网络 

4.2神经网络 

4.3时间序列分析及预测 


第五章 TABLEAU数据可视化

5.1TABLEAU概述与入门 

5.2初级可视化分析(一) 

5.3初级可视化分析(二) 

5.4地图分析 

5.5高级数据操作(一) 

5.6高级数据操作(二) 

5.7 分析图表整合 

5.8案例(一) 

5.9案例(二)

5.10案例(三) 

5.11案例(四) 

5.12案例(五) 

5.13案例(六) 


第六章 数据分析拓展

6.1引言 

6.2k-最近邻算法(K-NN)一 

6.3k-最近邻算法(K-NN)二 

6.4支持向量机(SVM)一 

6.5支持向量机(SVM)二 

6.6Logistic回归(LR) 

6.7随机森林算法(RF) 

6.8模型性能评估(一)

6.9模型性能评估(二) 


第七章 数据思维

7.1数据分析基础

7.2数据分析思维、过程和方法