有人看过这部漫画吗?我推荐1次航班。
在之前的文章中(Python爬取动态网页之selenium扫盲篇)用一个简单的介绍了一下Selenium,这次我们用Selenium爬取,网址:
主要分为几个步骤:
从网页输入框中输入漫画名,检测是否含有该漫画
获取到漫画的链接,遍历出所有章节的链接
找到下一页按钮,下载每一页的图片
从网页输入框中输入漫画名,检测是否含有该漫画
这个和上篇文章中往百度输入框中的操作一样
这里我们需要判断一下有没有找到该漫画
获取到漫画的链接,遍历出所有章节的链接
在上面的步骤中我们获取到了漫画的链接,用浏览器打开
这里怎么样获取每一章节的链接就不讲了,代码更清楚
我们将所有章节的链接赋给了chapters,接下来遍历所有章节去下载图片
找到下一页按钮,下载每一页的图片
我们当中用到了两个函数,mkdir函数是用来建立漫画目录的,save_pic函数用来将图片存储到文件夹中
查看我们下载的图片
到这里爬取漫画就完成了,但是利用Selenium效率非常低,我下载这个漫画大概一共55话,每话平均22张图片,全部下载完用了18分钟
本文章是由热衷python和前端原创发布,如需转载请注明出处
欢迎大家关注头条号:热衷python和前端
如果有需要源码的同学就留言或者私聊我吧