使用Python做爬虫其实很简单,这里使用一个小案例来详细介绍Python爬虫的用法,借助Python工具爬取王者荣耀英雄人物头像图片,Python爬虫爬取网页图片可以分为四步:明确目的、发送请求、数据解析、保存数据,具体步骤如下,下面一起学习。
我们爬取数据的目的肯定不是单纯地为爬而爬,终极目标还是需要把这些数据用起来。不过鄙人在安装时,遇到报错信息:plugin caching_sha2_password could not be loaded,这个问题的处理可参阅:见原文链接 。
第3章 我的第一个爬虫程序 了解了爬虫原理和网页构造后,我们知道了爬虫的任务就是两件事情:请求网页和解析提取信息。本章就从这两个方面入手,首先安装请求和解析网页的Python第三方库,之后将手把手教读者编写一个简单的爬虫程序。 本章涉及的主要知识点如下。