目录

  • 1 第一章 大数据分析与Python
    • 1.1 课程介绍及考核要求
    • 1.2 课程PPT
    • 1.3 课程相关软件下载
    • 1.4 jupyter使用及python模块安装
    • 1.5 阿里在线jupyter指南
    • 1.6 数据分析基本操作
  • 2 第二章 Python基础操作
    • 2.1 学习目标
    • 2.2 课程PPT
    • 2.3 演示代码与数据
  • 3 第三章 Python常用库与可视化
    • 3.1 学习目标
    • 3.2 课程PPT
    • 3.3 演示代码与数据
  • 4 第四章 关联规则分析-Apriori模型
    • 4.1 学习目标
    • 4.2 课程PPT
    • 4.3 演示代码与数据
  • 5 第五章 决策树模型
    • 5.1 学习目标
    • 5.2 课程PPT
    • 5.3 演示代码与数据
  • 6 第六章 聚类算法
    • 6.1 学习目标
    • 6.2 课程PPT
    • 6.3 补充知识
    • 6.4 演示代码与数据
  • 7 第七章 神经网络
    • 7.1 学习目标
    • 7.2 课程PPT
    • 7.3 补充知识
    • 7.4 演示代码与数据
  • 8 第八章 表征学习
    • 8.1 学习目标
    • 8.2 课程PPT
    • 8.3 演示代码与数据
  • 9 第九章 案例实践(课程数据案例库)
    • 9.1 网络数据抓取
    • 9.2 百货商场用户画像
    • 9.3 上海餐饮数据分析
    • 9.4 电影推荐系统
    • 9.5 小红书服饰分析
    • 9.6 顾客市场细分
    • 9.7 支付宝交易数据分析
    • 9.8 房地产需求分析
    • 9.9 淘宝用户购物行为分析
    • 9.10 居民幸福感分析
  • 10 期末考核安排
    • 10.1 期末考核安排及课程论文模板
    • 10.2 UCI数据集
    • 10.3 阿里天池数据集
    • 10.4 科学数据银行
    • 10.5 更多数据源
  • 11 参考数据集
  • 12 拓展学习
    • 12.1 贝叶斯模型
      • 12.1.1 课程PPT
      • 12.1.2 演示代码与数据
    • 12.2 社会网络分析
      • 12.2.1 课程PPT
      • 12.2.2 演示代码与数据
    • 12.3 无标题
阿里天池数据集


阿里天池(Ali Tianchi)是中国阿里巴巴集团旗下的一个数据科学和人工智能竞赛平台。该平台提供了大量的数据集,供数据科学家、研究人员和开发者使用,以便他们在各种实际问题上测试和提升自己的数据分析和机器学习模型。

阿里天池数据集的特点和用途如下:

  1. 多样性:天池平台提供的数据集覆盖了多个行业和领域,包括但不限于金融、医疗、交通、电商、物联网等。这些数据集可以用于各种分析任务,如用户行为分析、图像识别、推荐系统、自然语言处理等。

  2. 实际应用:许多数据集来自于实际的业务场景,如阿里巴巴旗下的电商平台数据、物流信息、信用评分等。这些数据集的真实性使得研究和模型开发更接近实际应用,有助于提高解决方案的实用性和有效性。

  3. 竞赛驱动:天池平台定期举办各种数据科学竞赛,鼓励参与者使用平台提供的数据集来解决具体的业务问题。通过竞赛,参与者可以学习到最新的数据处理和分析技术,同时也有可能获得奖金和职业发展机会。

  4. 数据质量:阿里天池对提供的数据集有一定的质量控制,确保数据的完整性和可用性。同时,平台也会提供数据描述和处理指南,帮助用户更好地理解和使用数据。

  5. 开放性:虽然某些数据集可能仅限于竞赛参与者使用,但天池平台也提供了一些公开的数据集,任何人都可以下载和使用这些数据进行研究和学习。

  6. 社区支持:天池平台拥有一个活跃的社区,用户可以在社区中分享自己的经验、讨论问题和寻找合作伙伴。这对于新手和经验丰富的数据科学家来说都是一个很好的学习和交流环境。

地址:https://tianchi.aliyun.com/dataset/