精通Python爬虫框架Scrapy
书籍简介
《精通Python爬虫框架Scrapy》以Scrapy 1.0版本为基础,系统地讲解了Scrapy框架的基础知识和高级应用。内容涵盖了Scrapy基础、HTML和XPath、数据管道、部署到Scrapinghub、配置管理、分布式爬取等核心技术。
核心概念
根据您的学习笔记,本书的核心内容包括:
- HTML/XPath
- 爬虫基础
- 从Scrapy到移动应用
- 迅速的爬虫技巧
- 部署到Scrapinghud
- 配置与管理
- Scrapy编程
- 管道秘诀
- 理解Scrapy的性能
- 使用Scrapyd与实时分析进行分布式爬取
核心收获
您在7月底学习了本书,并记录了详细的章节笔记。这与您学习数据科学的目标一脉相承,数据采集是数据科学的第一步。通过本书,您可以掌握使用Scrapy框架高效、规模化地从网络上获取数据的能力。