爬取QQ头像详解

首页 » 爬虫 » 爬取QQ头像详解

首先 , 我准备爬取的头像网站是 https://www.woyaogexing.com/touxiang/

接着咱们需要分析一下网站的格式 

网站首页

爬取QQ头像详解

然后我们记住一个缩略图的名字, 比如“梦晚“, 然后右击鼠标查看源代码, 再ctrl+f 搜索你刚才记住的名字,

爬取QQ头像详解

你会发现他们都在<a href=”*****.html”的标签里, 这个时候你只需要先解决把这一页缩略图的网址爬取到,

爬取QQ头像详解

上面的图是第一页的所有缩略图的地址, 接下来,我们需要进每一个网址, 然后再看看

爬取QQ头像详解

然后, 我们看一下源代码

爬取QQ头像详解

发现了许多以.jpeg为后缀名