大数据与人工智能概论

廖宁,慕江林

目录

  • 1 第1章 绪论
    • 1.1 大数据与人工智能概述
    • 1.2 大数据与人工智能典型应用
  • 2 第2章 数据工程
    • 2.1 数据工程概述
      • 2.1.1 【工具应用】使用Tableau Prep处理数据(案例1)
      • 2.1.2 【工具应用】使用Tableau DeskTop分析数据(案例1)
      • 2.1.3 【拓展学习】Tableau 在零售分析中的高级应用
    • 2.2 数据的获取
    • 2.3 数据的存储
      • 2.3.1 单机系统存储
      • 2.3.2 服务器存储
      • 2.3.3 分布式
    • 2.4 数据预处理
    • 2.5 数据分析与可视化
    • 2.6 过程性考核(项目)
  • 3 第3章 大数据框架
    • 3.1 分布式系统与Hadoop大数据平台
    • 3.2 分布式计算引擎
  • 4 第4章 机器学习
    • 4.1 机器学习概述
    • 4.2 回归算法
    • 4.3 分类算法
    • 4.4 聚类算法
  • 5 第5章 深度学习
  • 6 第6章 大数据与人工智能伦理
数据工程概述

一、案例1描述

    您在一家大型零售连锁店的总部工作。您的老板想要分析过去四年公司的产品销售额利润,请你尝试分析。

    若将全国划分为如下四个区域:东部(East)、南部(South)、西部(West)、中部(Central)。


----------------------------------------------------------------------------------

思考1:你需要什么样的数据?  

思考2:哪里获取数据?  

思考3:若获得了如下数据,该如何处理?  


获取到的数据见:连锁店销售数据汇总

思考4:若所有数据汇总形成了一个数据集合/文件,如何分析得到产品销售额和利润?  

思考5:如何向老板汇报情况?

二、案例2描述


芝麻信用,是蚂蚁金服旗下独立的第三方征信机构,通过云计算、机器学习等技术客观呈现个人的信用状况,已经在信用卡、消费金融、融资租赁、酒店、租房、出行、婚恋、分类信息、学生服务、公共事业服务等上百个场景为用户、商户提供信用服务。芝麻信用是依据方方面面的数据而设计的信用体系

思考1:你需要什么样的数据?  

思考2:哪里获取数据?  

思考3:怎么获取数据?  

思考4:数据怎么存储?  

思考5:如何使用数据

思考6:如何展示数据分析结果?    


视频材料:蚂蚁金服上市,蕴含着不亚于次贷危机的金融风险