第3章 我的第一个爬虫程序 了解了爬虫原理和网页构造后,我们知道了爬虫的任务就是两件事情:请求网页和解析提取信息。本章就从这两个方面入手,首先安装请求和解析网页的Python第三方库,之后将手把手教读者编写一个简单的爬虫程序。 本章涉及的主要知识点如下。
0、前言#在做一些预测的时候常常会用到国家统计局的数据,之前写的一些爬虫也没能够复用,今天又遇到了这个问题,反复检查之后发现国家统计局的各种数据其实都遵循同一套逻辑,而只需掌握这一个逻辑,我们便可以想要啥就要啥。