目录

  • 1 课程脉络
    • 1.1 课程章节思维导图
    • 1.2 课程概述
    • 1.3 课程目标
    • 1.4 课程特色
    • 1.5 教学组织过程
    • 1.6 多元化评价标准
    • 1.7 课程开发团队
    • 1.8 教材与参考资料
    • 1.9 课程标准(教学大纲)
  • 2 项目一  智能数据分析认知
    • 2.1 任务1-1 智能数据分析初体验
      • 2.1.1 知识准备
      • 2.1.2 小组讨论
      • 2.1.3 实践出新知
      • 2.1.4 拓展延伸
    • 2.2 知识巩固站(随堂小练)
  • 3 项目二  网络数据采集技术
    • 3.1 任务2-1 使用Beautiful Soup库与XPath语法解析网页
      • 3.1.1 知识准备
      • 3.1.2 实践出新知
      • 3.1.3 小组讨论
    • 3.2 任务2-2 Requests库的应用
      • 3.2.1 知识准备
      • 3.2.2 实践出新知
    • 3.3 拓展延伸
    • 3.4 知识巩固站(随堂小练)
    • 3.5 课后作业
  • 4 项目三  数据预处理技术
    • 4.1 任务3-1 数据的清洗
      • 4.1.1 知识准备
      • 4.1.2 实践出新知
    • 4.2 任务3-2 数据的转换与集成
      • 4.2.1 知识准备
      • 4.2.2 实践出新知
    • 4.3 拓展延伸
    • 4.4 知识巩固站(随堂小练)
    • 4.5 小组讨论
  • 5 项目四  数据统计及分析
    • 5.1 任务4-1 NumPy数值数据分析
      • 5.1.1 知识准备
      • 5.1.2 实践出新知
      • 5.1.3 知识巩固站(随堂小练)
      • 5.1.4 课后作业
    • 5.2 任务4-2 基于Pandas的招聘数据分析与业务洞察
      • 5.2.1 知识准备
      • 5.2.2 实践出新知
      • 5.2.3 知识巩固站(随堂小练)
      • 5.2.4 课后作业
    • 5.3 拓展延伸
  • 6 项目五  数据可视化展示
    • 6.1 任务5-1 Matplotlib基本应用
      • 6.1.1 知识准备
      • 6.1.2 实践出新知
    • 6.2 任务5-2 Matplotlib可视化展示
      • 6.2.1 知识准备
    • 6.3 小组讨论
    • 6.4 拓展延伸
    • 6.5 知识巩固站(随堂小练)
    • 6.6 课后作业
  • 7 项目六  数据处理综合实例
    • 7.1 任务6-1 招聘信息可视化分析
    • 7.2 小组讨论
    • 7.3 任务6-2 “天津之眼”摩天轮景点数据分析
    • 7.4 课后作业
  • 8 项目七  机器学习
    • 8.1 任务7-1 神经网络知识基础
      • 8.1.1 知识准备
      • 8.1.2 实践出新知
    • 8.2 任务7-2 搭建神经网络
      • 8.2.1 知识准备
      • 8.2.2 实践出新知
    • 8.3 拓展延伸
    • 8.4 知识巩固站(随堂小练)
  • 9 课程结课考核
    • 9.1 结课考核
  • 10 软件下载合集
    • 10.1 软件下载
任务4-1 NumPy数值数据分析
  • 1 4-1-1 NumPy&...
  • 2 4-1-2 NumPy&...

学习指南


【任务描述】

某头部招聘平台近期发现,平台上的海量招聘数据因格式混乱、结构松散,导致人才需求分析效率低下。具体问题包括:非结构化数据阻碍分析,岗位“薪资”字段含“15-20K”“月薪面议”等文本描述,无法直接计算平均薪资或生成趋势图表。多源数据冗余,同一岗位在多个渠道重复发布,数据重复率高达30%。字段缺失严重,关键字段“技能要求”在中小型企业岗位中空值率超过40%,影响技能图谱构建。公司要求数据团队利用NumPy数组技术,将非结构化招聘数据转换为标准化数值矩阵,构建可支持机器学习模型训练的结构化数据集,并输出《招聘数据结构化可行性报告》。


【核心任务与技能】

1. 核心问题

如何将非结构化招聘数据(如文本、数值混合字段)转换为数值型数组?

如何构建多维数组以适配不同分析场景?

如何通过数组属性快速验证数据结构完整性?

2. 任务目标

理论认知能力

理解NumPy数组的核心优势(高效存储、向量化计算)。

掌握array()、zeros()、arange()等数组创建方法与维度、形状、数据类型等属性

工具操作能力

使用NumPy完成以下操作:

将岗位“薪资”字段(如“15-20K”)转换为数值范围数组([15000, 20000])。

创建三维数组存储多城市招聘数据(维度:城市×岗位×技能关键词频率)。

通过dtype统一数据格式

问题解决能力

设计数组结构适配多源数据整合需求。

验证数组逻辑一致性。


【职业能力要求】

知识要求:掌握NumPy数组操作的核心API,理解数据结构与业务场景的映射关系。

技能要求:能独立完成数组创建、转换、验证及自动化流程设计,输出结构化数据资产。

态度要求:注重数据重构的逻辑严谨性(如维度对齐),遵守数据安全规范(如脱敏处理)。


【学习活动】

       根据“知识点PPT”和“知识点视频讲解”,完成:(1)任务实践操作(2)线上随学小练(3)线下课后作业