课程门户-章节详情

网络爬虫与数据采集-2024秋重修

李凡

目录

1 第一次课
- 1.1 课程导学
- 1.2 第一章大数据采集概述
2 第二次课
- 2.1 第二章 Web页面及相关技术
3 第三次课
- 3.1 第三章 Web应用架构与协议
4 第四次课
- 4.1 第四章普通爬虫页面采集技术与Python实现
5 第五次课
- 5.1 第五章动态页面采集技术与Python实现
6 第六次课
- 6.1 第六章 Web信息提取与Python实现
7 第七次课
- 7.1 第七章主题爬虫页面采集技术与Python实现
8 第八次课
- 8.1 第十章反爬虫技术与反反爬虫技术
9 课堂笔记上传
- 9.1 第一次课堂笔记
- 9.2 第二次课堂笔记
- 9.3 第三次课堂笔记
- 9.4 第四次课堂笔记
- 9.5 第五次课堂笔记
- 9.6 第六次课堂笔记
- 9.7 第七次课堂笔记
- 9.8 第八次课堂笔记
10 作业上传
- 10.1 作业上传
11 实验报告
- 11.1 第一次实验报告上传
- 11.2 第二次实验报告上传

第一章大数据采集概述

上一节

下一节

课程内容：

互联网大数据与采集
Python爬虫大数据采集的重要性
爬虫技术研究及应用现状
爬虫技术的应用场景
爬虫大数据采集的技术体系
爬虫大数据采集与挖掘的合规性
爬虫大数据采集的展望

课程目标：

掌握网络爬虫的基本开发环境和基本语法
掌握网络爬虫的基本方法

授课内容：

一、授课视频

1.Python简介

2.Python的安装与开发环境配置

3.Python基本语法

4.互联网与HTTP、HTML

5.Hello，Spider！

6.调研网站

二、授课文档

三、随堂测验