「Python」爬虫实战，零基础初试爬虫下载图片

爬虫，全称网络爬虫，就是通过技术手段从网络获取数据的程序或者脚本

人生苦短，我选python。本次就用python来进行实现对一个壁纸网站的图片下载

本篇文章就是直接爬虫实战。通过本文，带你了解requests库的基本使用，并且完成壁纸网站的图片爬取

Requests库是python一个很好用的http请求库。封装得很好~在我们爬虫的时候常常也会用到。

Requests的官方介绍说到，让HTTP服务人类。有一说一，这是个非常容易使用的库。本次咱们的爬虫也会用到这个库。

关于requests库的介绍，可以看一下官方文档

Requests: 让 HTTP 服务人类 - Requests 2.18.1 文档

使用前记得安装requests库

pip install requests

进入目标网站

随便点开一张图，查看它的url，

先留意一下这个网址，后面会用到

回到浏览器，打开F12，通过目标元素检查工具，点击刚刚我们点过的图片。通过它的元素我们可以知道a标签里的属性值href的链接就是上面我们访问图片的链接地址

我们在大图的页面，同样用f12点击一下，找到图片的链接地址

访问图片链接发现是咱们要的大图。至此，对于网站的分析完毕。

综上所述，咱们目标网站是一个壁纸图片网站，编程做到的步骤如下：

访问首页
定位到每个图片的详情链接
访问详情链接
定位到图片对应的大图链接。下载，保存图片

看起来是不是很容易，开干

4.1 访问首页

url = ';with open('index.html', 'wb') as f:

通过requests库发起get请求，请求壁纸网站的首页。并把结果保存在index.html文件里面

打开保存的文件一看，我们把首页给下载下来了。

4.2 定位元素

这里我们通过xpath方式。这里用到的是lxml库。不懂lxml库的话，参考下文

【Python】爬虫解析利器Xpath，由浅入深快速掌握(附源码例子)

PS：谷歌渲染的页面的xpath和requests请求回来的xpath会有不一样。有时需要保存下来进行xpath分析

对于元素进行定位。把a标签的href值全部拿出来，而且也把对应的名称取出来

tree = e)node_list = ('/html/body/div[2]/div[2]/div[3]/ul/li')if len('./a/@href')) > 0: sub_url = node.xpath('./a/@href')[0]if len('./a/@href')) > 0: title = node.xpath('./a/b/text()')[0] ((sub_url, title))

4.3 访问详情页

base_url = ';for sub_url, title in sub_url_list: s_page = base_url + sub_url s_resp = reque(s_page)with open('s.html', 'wb') as f:

xxxxxxxxxxbr base_url = ';for sub_url, title in sub_url_list: s_page = base_url + sub_url s_resp = reque(s_page)with open('s.html', 'wb') as f:

4.4 定位图片链接并下载

img = s_('/html/body/div[2]/div[2]/div[3]/div/p/a/img/@src')[0]suffix = img.split('.')[-1]img_content = reque(img).contentwith open(f'./image/{title}.{suffix}', 'wb') as f:

xxxxxxxxxxbr img = s_('/html/body/div[2]/div[2]/div[3]/div/p/a/img/@src')[0]suffix = img.split('.')[-1]img_content = reque(img).contentwith open(f'./image/{title}.{suffix}', 'wb') as f:

下载完效果图

4.5 完整源码

if __name__ == '__main__': url = ';with open('index.html', 'wb') as f: tree = e) node_list = ('/html/body/div[2]/div[2]/div[3]/ul/li')if len('./a/@href')) > 0: sub_url = node.xpath('./a/@href')[0]if len('./a/@href')) > 0: title = node.xpath('./a/b/text()')[0] ((sub_url, title)) base_url = ';for sub_url, title in sub_url_list: s_page = base_url + sub_url s_resp = reque(s_page) s_tree = e) img = s_('/html/body/div[2]/div[2]/div[3]/div/p/a/img/@src')[0] suffix = img.split('.')[-1] img_content = reque(img).contentwith open(f'./image/{title}.{suffix}', 'wb') as f:

xxxxxxxxxxbr if __name__ == '__main__': url = ';with open('index.html', 'wb') as f: tree = e) node_list = ('/html/body/div[2]/div[2]/div[3]/ul/li')if len('./a/@href')) > 0: sub_url = node.xpath('./a/@href')[0]if len('./a/@href')) > 0: title = node.xpath('./a/b/text()')[0] ((sub_url, title)) base_url = ';for sub_url, title in sub_url_list: s_page = base_url + sub_url s_resp = reque(s_page) s_tree = e) img = s_('/html/body/div[2]/div[2]/div[3]/div/p/a/img/@src')[0] suffix = img.split('.')[-1] img_content = reque(img).contentwith open(f'./image/{title}.{suffix}', 'wb') as f:

妈妈再也不用担心我的学习了。

“如何获取图片url,如何获取图片url链接,图片url链接生成器,如何获取图片中颜色值”边界阅读

Word中的目录是如何自动生成的？

2007word中如何自动生成目录相关介绍,前段时间有小伙伴问到Word自动生成目录的问题。在此，再详述一下，让大家对目录有个更好的理解和运用。 01.目录源问题比如，我们有下列一篇文章：文字有加粗有编号，貌似已经设置好一级标题和二级标题。

jquery加载外部文件（.txt .html)显示在网页上

jquery如何判断页面加载完成相关介绍,在web开发中常常需要用到jquery去动态的加载文件显示在网页上面，下面是实现的小方法，希望给大家一点提示，达到抛砖引玉的作用哦！！！效果图：要加载显示的文件：网页加载效果： html代码截图

Win7共享文件夹权限设置和密码保护的方法

win7如何自动生成目录相关介绍,在局域网中，我们经常共享一些文件供局域网用户访问，但是由于windows共享设置比较复杂，不同版本的操作系统设置也不尽相同；同时，设置完毕共享文件夹后我们通常还需要设置共享文件夹访问权限，并且常常是为

微信自动扣费的功能，怎样关闭呢？操作简单，避免每月零钱会变少

微信会员卡如何开通相关介绍,使用微信的人越来越多了，成为人们常用的社交工具，不仅如此，而且每天收款、付款还都使用到它呢，相信使用微信的伙伴在微信上都有自己的零钱，那微信上有一个自动扣费的功能，你知道吗？这个开关如果没有关闭，有可

怎么查看电脑的ip地址

如何查看本地ip地址相关介绍,ip地址分为内网和外网两种。 01 找到在电脑的右下角关于网络连接状况的图标。 02 单击右键就能看见“打开网络和共享中心”，点击它。 03 进去后就可以看见如下图，找到“本地连接”。 04 点进“本

网络之间的对话安全-GET和POST请求

如何获取post内容相关介绍,HTTP请求是指从客户端到服务器端的请求消息，说白了就是我们用浏览器访问站点服务器时所发出的请求，是客户端与服务器端之间用来交互用的，判断一个网站有没有安全问题，就看在交互过程中存在不存在漏洞，当然一

word横竖混排技巧，页码设置妙招，大家赶紧get起来

word如何设置连续页码相关介绍,今天跟小伙伴讲讲word横纵混排，怎么插入页码，其实大家别小看页码的插入，简单的一看就会，复杂的页码设置其实挺麻烦的。今天跟大家讲讲简单的，咱们由浅入深慢慢来^^。首先是如何横纵混排，我们先点击想要横

怎么查看自己电脑的ip地址介绍几种查看自己电脑IP的机种方法

如何获取本机ip地址相关介绍,怎么查看自己电脑的ip地址介绍几种查看自己电脑IP的机种方法，掌握了这些方法查看自己的电脑IP就不是什么难事了。方法一：使用百度搜索。首先输入百度网址：www.baidu.com ;然后在百度框内输

责任编辑: 鲁达

“如何获取图片url,如何获取图片url链接,图片url链接生成器,如何获取图片中颜色值”边界阅读