您的位置首页 > 数码极客

小说如何下载到电脑,如何下载小说文件…

鲁达发布于 2023-07-05

这节课我们用python爬取电子书三国演义并下载保存，下载网址为（），主要需要的模块有requests模块、beautifulsoup解析、lxml模块,通过发起请求--页面解析--保存数据三个步骤获取我们的资源。

1.解题思路

首先我们需要先将（）该列表页中的详情页链接以及列表页中的目录拿到，分别作为获取章节内容的入口以及我们保存这些章节的名字。

2.对目录列表发起请求

这一步用requests发起请求，之前做过许多案例也专门讲解过requests怎么发起请求，因此不作详解，看下图：

我们从上一步获取到了完整的页面内容，但是我们只需要获取该页面中详情页的链接以及目录链接（如下图），因此我们利用beautifulsoup模块、lxml模块进行解析数据

从下图我们可以看到，链接、目录名在<li>标签下，而<li>标签在div下的class="book-mulu"下面的<ul>标签下，因为代码可以这样写：

通过上一步骤我们获取的是一个列表，因此通过for循环，获取单个<li>标签，并继续解析：

4.对详情页发起请求

我们有了详情页的链接，就可以对详情页发起请求了：

仍旧利用beautifulsoup模块、lxml模块进行解析数据，只不过这个用find来查找我们所对应的数据，代表着div下的class="chapter_content"标签。“.text”代表读取文本内容。如果层级多，我们仍旧可以用上述的select方法

按照正常的保存数据即可，之前讲过就不过多介绍了！

好了，这就是今天的内容，如果大家想要更多关于Python的信息，可关注公众号：Python教程初学讲解，获取学习资料！

1.内容基于多重复合算法人工智能语言模型创作，旨在以深度学习研究为目的传播信息知识，内容观点与本网站无关，反馈举报请点击此处；
2.仅供读者参考，本网站未对该内容进行证实，对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告，请读者放心使用！