2024年Python最全过去，我买漫画看；现在，我用Python爬虫来看

admin管理员组
文章数量:1542424

之后，就是对这个网址下面的内容进行爬取了，这个过程很容易，我就不讲了。
我们点击一下其中的一本漫画，来到这个界面

这个网址，需要我们从上一个网址中得到并进行拼接，我们需要得到这个网址下面的漫画所有章节的链接和名称。
我们按F12来到开发者工具：
可以发现这些章节的内容在这个标签下面：

html1=requests.get(url=url1)
content1=html1.text
soup1=BeautifulSoup(content1,'lxml')
str2=soup1.select('ul.chapter__list-box.clearfix.hide')[0]
list2=str2.select('li>a')
name1=[]
href1=[]
for str3 in list2:
    href1.append(str3['data-hreflink'])   # 漫画一章的链接
    name1.append(str3.get_text().strip()) # 漫画一章的题目,去空格

这样我们就可以得到我们想要的内容了，我们点击其中的一章进入，发现里面只不过是一些图片罢了，我们只需把这些图片下载下来就行了。

代码运行结果：

下载完成之后，会在同一个文件夹下面多出一个文件夹，文件夹的名称为你输入漫画名称，这个文件夹下面会有很多文件夹，这些文件夹的名称是漫画章节的名称。

2.完整代码

import requests
from urllib import parse
from bs4 import BeautifulSoup
import threading
import os
import sys

_name=input('请输入你想看的漫画:')

try:
    os.mkdir('./{}'.format(_name))
except:
    print('已经存在相同的文件夹了,程序无法在继续进行！')
    sys.exit()

name_=parse.urlencode({'keyword':_name})
url='https://www.mkzhan/search/?{}'.format(name_)
html=requests.get(url=url)
content=html.text
soup=BeautifulSoup(content,'lxml')
list1=soup.select('divmon-comic-item')
names=[]
hrefs=[]
keywords=[]
for str1 in list1:
    names.append(str1.select('pic__title>a')[0].get_text())   # 匹配到的漫画名称
    hrefs.append(str1.select('pic__title>a')[0]['href'])      # 漫画的网址
    keywords.append(str1.select('pic-feature')[0].get_text())          # 漫画的主题
print('匹配到的结果如下：')
for i in range(len(names)):
    print('【{}】-{}     {}'.format(i+1,names[i],keywords[i]))

i=int(input('请输入你想看的漫画序号:'))
print('你选择的是{}'.format(names[i-1]))


url1='https://www.mkzhan'+hrefs[i-1]      # 漫画的链接
html1=requests.get(url=url1)
content1=html1.text
soup1=BeautifulSoup(content1,'lxml')
str2=soup1.select('ul.chapter__list-box.clearfix.hide')[0]
list2=str2.select('li>a')
name1=[]
href1=[]
for str3 in list2:
    href1.append(str3['data-hreflink'])   # 漫画一章的链接
    name1.append(str3.get_text().strip()) # 漫画一章的题目,去空格

def Downlad(href1,path):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3756.400 QQBrowser/10.5.4039.400'}
    url2='https://www.mkzhan'+href1
    html2=requests.get(url=url2,headers=headers)
    content2=html2.text
    soup2=BeautifulSoup(content2,'lxml')
    list_1=soup2.select('div.rd-article__pic.hide>img.lazy-read')  # 漫画一章中的所有内容列表
    urls=[]
    for str_1 in list_1:
        urls.append(str_1['data-src'])

    for i in range(len(urls)):
        url=urls[i]
        content3=requests.get(url=url,headers=headers)
        with open(file=path+'/{}.jpg'.format(i+1),mode='wb') as f:
            f.write(content3.content)
    return True


def Main_Downlad(href1:list,name1:list):
    while True:
        if len(href1)==0:
            break
        href=href1.pop()
        name=name1.pop()
        try:
            path='./{}/{}'.format(_name,name)
            os.mkdir(path=path)
            if Downlad(href, path):
                print('线程{}正在下载章节{}'.format(threading.current_thread().getName(),name))
        except:
            pass

threading_1=[]
for i in range(30):
    threading1=threading.Thread(target=Main_Downlad,args=(href1,name1,))
    threading1.start()
    threading_1.append(threading1)
for i in threading_1:
    i.join()
print('当前线程为{}'.format(threading.current_thread().getName()))

3.总结

我觉得这个程序还有很大的改进空间，如做一个ip代理池，这样再也不用担心ip被封了，另外，还可以做一个自动播放漫画图片的程序，这样就可以减少一些麻烦了。
注意:本程序代码仅供娱乐和学习，且莫用于商业活动，一经发现，概不负责。
如果大家觉得这个还可以的话，记得给我点一个小小的赞。

关于Python技术储备

学好 Python 不论是就业还是做副业赚钱都不错，但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！

包括：Python激活码+安装包、Python web开发，Python爬虫，Python数据分析，Python自动化测试学习等教程。带你从零基础系统性的学好Python！

一、Python学习大纲

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

最后

不知道你们用的什么环境，我一般都是用的Python3.6环境和pycharm解释器，没有软件，或者没有资料，没人解答问题，都可以免费领取（包括今天的代码），过几天我还会做个视频教程出来，有需要也可以领取~

给大家准备的学习资料包括但不限于：

Python 环境、pycharm编辑器/永久激活/翻译插件

python 零基础视频教程

Python 界面开发实战教程

Python 爬虫实战教程

Python 数据分析实战教程

python 游戏开发实战教程

Python 电子书100本

Python 学习路线规划

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里无偿获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

本文标签：爬虫漫画我用我买最全

版权声明：本文标题：2024年Python最全过去，我买漫画看；现在，我用Python爬虫来看_漫画栈漫画爬虫(1) 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1727070324a1096090.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

2024年Python最全过去，我买漫画看；现在，我用Python爬虫来看_漫画栈漫画爬虫(1)

2.完整代码

3.总结

关于Python技术储备

一、Python学习大纲

最后

更多相关文章

AI编程案例003 ChatGPT写爬虫程序-通过搜狗搜索抓取微信公众号文章

【我用ChatGPT学编程】Vue-Router中history模式Nginx部署后刷新404的问题

百度智能云“千帆大模型平台”升级，大模型最多，Prompt模板最全

python爬虫入门——13行代码制作英语翻译器教程，小白入门一点通

计算机全屏显示快捷键,最全电脑快捷键，电脑全屏按哪个键 原来是这样的

QQ登录界面测试用例--最全的书写以及测试用例设计，你须知道的7个小技巧

爬虫实战系列(十一)：Win10下手机爬虫工具appium的安装与测试

爬虫 + 自动化利器 selenium 之自学成才篇（一）_selenium detach

史上最全的Chrome使用技巧集锦

分享一些关于Python爬虫的源码，需要的朋友可以自行领取_爬虫代码下载 百度云

Python爬虫实战（七）——批量下载4K高清小姐姐图片（附上完整源码）

常用的网络爬虫工具推荐

Python爬虫淘宝母婴销售数据可视化和商品推荐系统 开题报告

学了那么久的Python,为啥还是不会爬虫 一点经验分享_为啥我按照《python从入门到精通》中教的方法爬虫不能成功

这篇全网最全的python小白入门篇

2024年Python最新python多线程爬虫框架，分享面试流程

2024年Python最全Python入门基础，大佬就是这样炼成的(1)

最新Python爬虫基础 爬取网页 访问网页_python 爬虫网站

2024年最全python爬虫从0到1 - urllib中的异常

【Python爬虫】招聘网站实战合集第一弹：爬取前程无忧

发表评论

推荐文章

Dell_Inspiron_15-3567, 加装内存条, 更换固态硬盘

中国黑客群体的真实收入，实在太震惊！

推荐一款让GIMP变身Photoshop的神器：GimpPs

office提示盗版解决方案

闲聊ROOT权限——ROOT权限的前世今生

热门文章

软件：10款免费无广告的看图软件，总有一款适合你

手机谷歌浏览器怎么用

《MSDN Library 2001 October 英文版》光盘ISO下载

小米路由青春版-2.1.26开发版固件

CrossOver打不开游戏 CrossOver软件怎么样 crossover运行游戏没反应 crossover游戏不显示中文

python制作搜索工具

java+springboot+mysql蛋糕店网站37894-计算机毕业设计项目选题推荐（赠源码）

这篇全网最全的python小白入门篇

不用安装的编辑器？Typora绿化版体验指南

mac office2019原版安装包教程许可证解锁

最新文章

Linux学习之如何让普通用户获得ROOT权限

虚拟机：虚拟机如何进入root权限，直接su进不去？

让Android应用程序申请获取ROOT权限

Openshift平台容器内root权限获取方案

Centos8 普通用户赋予管理员root权限

ubuntu开启SSH服务，并允许ROOT权限远程登录

ansible 普通用户执行root权限操作

rootsudo权限 启动调试 vscode

怎么在获取root的权限的情况下开启AccessibilityService?

ubuntu 20.04.1 普通用户执行root权限程序,通过代码配置静态IP

root怎么打开，gg修改器root怎么打开

linux创建新用户hadoop并获取root权限

宝塔mysql增加root远程登录权限

android系统root与应用程序获取root权限原理总结

vscode ssh 免密（密钥）远程连接腾讯云服务器，并获得root权限（最简单）

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

计算机全屏显示快捷键,最全电脑快捷键，电脑全屏按哪个键原来是这样的

分享一些关于Python爬虫的源码，需要的朋友可以自行领取_爬虫代码下载百度云

Python爬虫淘宝母婴销售数据可视化和商品推荐系统开题报告

学了那么久的Python,为啥还是不会爬虫一点经验分享_为啥我按照《python从入门到精通》中教的方法爬虫不能成功

最新Python爬虫基础爬取网页访问网页_python 爬虫网站

rootsudo权限启动调试 vscode

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载