目录

  • 1 初识爬虫
    • 1.1 爬虫产生背景
    • 1.2 爬虫技术
    • 1.3 爬虫的用途
  • 2 爬虫的实现原理
    • 2.1 爬虫抓取网页的详细流程
    • 2.2 防爬虫应对策略
    • 2.3 爬虫伦理
  • 3 爬取网页数据
    • 3.1 爬虫工具的使用
    • 3.2 模板采集
    • 3.3 自动识别采集
    • 3.4 数据导出
    • 3.5 【京东】商品详情页采集
  • 4 xpath精准采集
    • 4.1 数据清洗
    • 4.2 精准采集
    • 4.3 数据安全
    • 4.4 【微博】评论采集
  • 5 实践项目
    • 5.1 【豆瓣】热门电影采集
    • 5.2 【58同城】职位信息采集
精准采集