目录

  • 1 第一章 大数据及其应用
    • 1.1 课程介绍及考核要求
    • 1.2 课程PPT
    • 1.3 应实践拓展
    • 1.4 章节测试
    • 1.5 weka软件下载
  • 2 第二章 分类算法
    • 2.1 课程PPT
    • 2.2 应实践拓展
    • 2.3 Weka数据预测
    • 2.4 章节测试
  • 3 第三章 聚类算法
    • 3.1 课程PPT
    • 3.2 应实践拓展
    • 3.3 章节测试
  • 4 第四章 网络分析
    • 4.1 课程PPT
    • 4.2 应实践拓展
    • 4.3 章节测试
  • 5 第五章 购物篮算法
    • 5.1 课程PPT
    • 5.2 应实践拓展
    • 5.3 章节测试
  • 6 第六章 神经网络
    • 6.1 课程PPT
    • 6.2 应实践拓展
    • 6.3 章节测试
  • 7 第七章 如何领导数据分析团队
    • 7.1 课程PPT
    • 7.2 应实践拓展
    • 7.3 章节测试
  • 8 期末考核及安排
    • 8.1 期末考核安排
    • 8.2 Weka软件自带数据集
    • 8.3 UCL数据集
    • 8.4 其它数据集
UCL数据集

UCI Machine Learning Repository是一个很经典的ML数据集网站,在ML的paper当中经常会遇到基于这些数据集做的实验。UCI机器学习数据集目前共收纳了将近500个数据集,并将这些数据集按数据类型(univariate、multivariate、time-series等)和机器学习任务(classification、regression、recommendation systems等)分类。

地址:https://archive.ics.uci.edu/ml/datasets.php

注意:UCL下载的数据为.data格式,只需要修改文件后缀名为.csv既可在weka软件中打开使用。

在这里插入图片描述