爬虫分享(三)：多线程爬取英雄联盟皮肤图片|电子爱好者

admin管理员组
文章数量:1619280

爬虫分享(三)：多线程爬取皮肤

1.获取英雄数据

首先进入LOL官网打开游戏资料

我们先尝试用该url构建一个请求

import requests

url = 'https://lol.qq/data/info-heros.shtml#Navi'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}
r = requests.get(url,headers=headers)
r.encoding = r.apparent_encoding
with open ('./html.txt','w',encoding='utf-8') as f:
    f.write(r.text)

打开txt文件搜索“安妮”却找不到信息，这是因为这些英雄的名称和图片都是通过JS渲染出来的，按F12打开开发工具，在Network栏中点击XHR,可以发现有一个hero-list.js

点击发现里面就是英雄的数据了，包括英雄的ID和名字等。

接下来，我们只需要对hero_list.js对应的url请求，直接上代码

import requests

url = 'https://game.gtimg/images/lol/act/img/js/heroList/hero_list.js'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}
r = requests.get(url,headers=headers)
r.encoding = r.apparent_encoding
print(r.text)

由此，我们便成功获取了英雄数据

2.获取皮肤信息

我们在对网页进行分析，打开安妮的页面，可以在开发者工具中发现一个1.js，依据上部分的经验，我们可以猜测1.js中包含了安妮的皮肤信息，果不其然，打开它之后就可以看到皮肤有关信息

到此，我们便可以通过对信息的分析获取皮肤的名称和地址，再加入多线程，我们便可以很轻松地将这些皮肤图片保存到本地，完整代码如下:

# -*- ecoding: utf-8 -*-
# @ModuleName: lol
# @Function:
# @Author: shenfugui
# @Email: shenge_ziyi@163
# @Time: 3/13/2020 9:34 PM

import requests
import json
import time
import os
import threading
from queue import Queue


def get_heros(headers, q, threads):
    url = 'https://game.gtimg/images/lol/act/img/js/heroList/hero_list.js'
    r = requests.get(url, headers=headers)
    r.encoding = r.apparent_encoding
    data = json.loads(r.text)
    for hero in data['hero']:
        id = hero['heroId']
        q.put(id)
    for i in range(10):
        t = threading.Thread(target=get_imgs, args=(headers, q))
        t.start()
        threads.append(t)
    q.join()
    for i in range(10):
        q.put(None)
    for thread in threads:
        thread.join()
    print('finished')


def get_imgs(headers, q):
    while True:
        id = q.get()
        if id is None:
            break
        try:
            url = 'https://game.gtimg/images/lol/act/img/js/hero/{}.js'.format(id)
            r = requests.get(url, headers=headers,timeout=10)
            r.encoding = r.apparent_encoding
            data = json.loads(r.text)
            for skin in data['skins']:
                hero_name = './' + skin['heroName']
                skin_url = skin['mainImg']
                skin_name = skin['name'].replace('/', '')
                if not os.path.exists(hero_name):
                    os.mkdir(hero_name)
                pic = requests.get(skin_url, headers=headers)
                with open(hero_name + '/' + skin_name + '.jpg', 'wb') as f:
                    f.write(pic.content)
                    print('%s 下载成功' % (skin_name))
        except requests.exceptions.ConnectionError:
            time.sleep(5)
        except requests.exceptions.MissingSchema:
            pass
        except requests.exceptions.InvalidSchema:
            pass
        q.task_done()


def main():
    start = time.time()
    q = Queue()
    threads = []
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36',
               'Connection': 'close'}
    get_heros(headers, q, threads)
    end = time.time()
    print('共用时%s s' % (end - start))


if __name__ == '__main__':
    main()

运行之后的效果图：

共用时24秒，效果还不错。

本文标签：爬虫多线程皮肤英雄联盟

版权声明：本文标题：爬虫分享(三)：多线程爬取英雄联盟皮肤图片内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1728794757a1174061.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

python 游戏辅助lol_用Python爬取英雄联盟（lol）全部皮肤

3小时前

小三：“怎么了小二？一副无精打采的样子！” 小二：“唉！别提了，还不是最近又接触了一个叫英雄联盟的游戏&am

现在如何注册台服服务器,《英雄联盟手游》台服账号注册教程台服拳头账号注册步骤图解...

3小时前

lol手游台服账号怎么注册？台服现在已经公测了，国服的玩家在也不用去其他地区服务器进行体验了，在中文大区内进行对局，体验起来的感觉绝对会比其他地方要好很

python爬取英雄联盟所有皮肤价格表_利用Python协程来爬取LOL所有英雄的皮肤高清图片...

3小时前

最近有一朋友要LOL的数据进行数据分析，叫我帮他抓一下数据。突发奇想，顺便把英雄的所有皮肤下载到本地好了。 PS： 安装了LOL的伙伴图片直接在LOL文件夹里面&#x

python使用selenium爬英雄联盟王者荣耀壁纸附源码

3小时前

文章目录 LOL壁纸分析写代码王者荣耀壁纸分析写代码源码lol王者荣耀之前看到好多爬王者荣耀和英雄联盟壁纸的，现在有时间，自己也搞个玩玩记录一下，也帮助一下想要学习的

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）_游戏数据抓取

3小时前

（1）Python所有方向的学习路线（新版） 这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点

【Python探讨】PyQt5、request模块联合编写的英雄联盟全皮肤下载器| 附源代码

3小时前

相关文件想学Python的小伙伴可以关注小编的公众号【Python日志】有很多的资源可以白嫖的哈，不定时会更新一下Python的小知识的哈！！需要源码的小伙伴可以在公众号回复英雄联盟皮肤下载器 Python源码、问题解答学习交流群：

LOL弗雷尔卓德服务器维护,英雄联盟4月28日维护到几点部分大区模式维护公告...

3小时前

英雄联盟4月28日维护到几点?英雄联盟维护内容是什么?英雄联盟今天维护到什么时候?想必有不少的小伙伴们都想知道吧，下面是英雄联盟部分大区模式维护公告，感兴趣的小伙伴们一起来看看吧。英雄联盟4月2

如何看自己在英雄联盟中的定位？也就是自己的本命英雄？

3小时前

对于这个问题，大多数的玩家都会去官网查看，因为那里已经给大多数玩家生成好了。但是你们发现没有，一般自己心目中所想或者比较喜欢的都不是自己的本命英雄，难道

风靡全球的英雄联盟手游，竟然没有国服，只能教你玩国际服了...

3小时前

嗨喽！各位小伙伴们，由于公众号做了乱序推送改版，为了保证公众号的推送，能够第一时间及时送达到大家手上，大家记得将我的公众号加星标

拳头服务器什么时候修复,拳头：今年将修复《英雄联盟》客户端启动时间降到19秒...

3小时前

原标题：拳头：今年将修复《英雄联盟》客户端启动时间降到19秒《英雄联盟》新版客户端自上线以来虽然官方进行过几次修复，但仍然存在不少的BUG，客户端的

[附源码]计算机毕业设计Python+uniapp英雄联盟网站APPr40r9(程序+lw+APP+远程部署)

3小时前

[附源码]计算机毕业设计Pythonuniapp英雄联盟网站APPr40r9(程序lwAPP远程部署) 该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置： Python3.7.7Djan

爬取实例三：爬取lol英雄联盟全阵容皮肤和爬王者荣耀全阵容皮肤

3小时前

1、结果展示将每一个英雄保存一个文件夹下，把他所有的皮肤保存在他对应的文件夹下(自动生成的你运行爬虫就好了) 2、代码解释 2.1用到第三方的模块有些自带，有些需要你自己安装&#

现在如何注册台服服务器,《英雄联盟手游》台服怎么注册账号台服注册账号方法...

3小时前

12月10日，也就是今天，英雄联盟手游不仅更新了新内容，还开放了包括台服在内的一大批服务器，虽然这次依旧没有国服，但是大家可以进入

【91xcz英雄联盟虚空行者卡萨丁xp主题91xcz】

3小时前

英雄联盟虚空行者卡萨丁xp主题ghost xp系统下载之家主题大小：8.07 MB 主题分类： XP主题主题简介：英雄联盟虚空行者卡萨丁xp桌面是由主题之家&

打造最全皮肤，Python采集英雄联盟（LOL）官...

3小时前

环境： Python3.6.5Windowspycharm 模块： import requestsimport jsonpath from urllib.requestimport urlretr

WeGame打不开《英雄联盟》的科普解答

3小时前

《英雄联盟》（League of Legends，简称LOL）作为全球最受欢迎的MOBA竞技网游之一，凭借其丰富的英雄角色、多样的游戏模式和竞技性强的排

(高仿英雄联盟游戏网页制作作业) 英雄联盟LOL游戏HTML网页设计模板简单学生网页设计静态HTML CSS网站制作成品

3小时前

📂文章目录一、👨‍🎓网站题目二、✍️网站描述三、📚网站介绍四、🌐网站效果五、🔧 网站代码&am

无法往开启kerberos的zookeeper上注册服务_英雄联盟手游拳头账号有几个区？lol手游韩国账号怎么注册？...

3小时前

英雄联盟手游从10月28日正式开启全球范围多服务器的同时公测，本次公测开放了日服、韩服、东南亚服、美服、欧服等地区的服务器，并且账号信息互通，也就是都处于统一的一个拳头账号名

Python爬虫实战 | 利用多线程爬取 LOL 高清壁纸

3小时前

来源：公众号【杰哥的IT之旅】作者：阿拉斯加 ID：Jake_Internet 如需获取本文完整代码及 LOL 壁纸，请为本文右下角点赞并添加杰哥微信

《复仇者联盟2：奥创纪元》720高清迅雷下载

9分钟前

身经百战的超级英雄们产生了职业倦怠，已经卸下钢铁战甲的托尼·斯塔克因此发明了“奥创”——有自我意识、有学习能力的人工智能机器人，并将指挥机器人军团的重任交给奥创。令超级英雄们始料不及的是&

电子爱好者 - 最新技术资讯及电子产品介绍！

爬虫分享(三)：多线程爬取英雄联盟皮肤图片

爬虫分享(三)：多线程爬取皮肤

1.获取英雄数据

2.获取皮肤信息

更多相关文章

python 游戏辅助lol_用Python爬取英雄联盟（lol）全部皮肤

现在如何注册台服服务器,《英雄联盟手游》台服账号注册教程 台服拳头账号注册步骤图解...

python爬取英雄联盟所有皮肤价格表_利用Python协程来爬取LOL所有英雄的皮肤高清图片...

python使用selenium爬英雄联盟王者荣耀壁纸 附源码

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）_游戏数据抓取

【Python探讨】PyQt5、request模块联合编写的英雄联盟全皮肤下载器| 附源代码

LOL弗雷尔卓德服务器维护,英雄联盟4月28日维护到几点 部分大区模式维护公告...

如何看自己在英雄联盟中的定位？也就是自己的本命英雄？

风靡全球的英雄联盟手游，竟然没有国服，只能教你玩国际服了...

拳头服务器什么时候修复,拳头：今年将修复《英雄联盟》客户端 启动时间降到19秒...

[附源码]计算机毕业设计Python+uniapp英雄联盟网站APPr40r9(程序+lw+APP+远程部署)

爬取实例三：爬取lol英雄联盟全阵容皮肤和爬王者荣耀全阵容皮肤

现在如何注册台服服务器,《英雄联盟手游》台服怎么注册账号 台服注册账号方法...

【91xcz*英雄联盟虚空行者卡萨丁xp主题*91xcz】

打造最全皮肤，Python采集英雄联盟（LOL）官...

WeGame打不开《英雄联盟》的科普解答

(高仿英雄联盟游戏网页制作作业) 英雄联盟LOL游戏HTML网页设计模板 简单学生网页设计 静态HTML CSS网站制作成品

无法往开启kerberos的zookeeper上注册服务_英雄联盟手游拳头账号有几个区？lol手游韩国账号怎么注册？...

Python爬虫实战 | 利用多线程爬取 LOL 高清壁纸

《复仇者联盟2：奥创纪元》720高清迅雷下载

发表评论

推荐文章

win10电脑不满足TPM2.0,也能一键升级win11

服务器日志修改密码怎么查看,服务器修改密码日志

打印表格打印机没有反应_打印机没反应怎么回事

（三）计算机取证-制作启动盘WINFE的环境准备

鼠标

热门文章

signature=2b10328bd9c0ee31beb3497380ba8a8e,Broad Band Spectra and Variability of the Remarkable Seyf...

基于react的三款稳定好用Markdown格式渲染成HTML插件

Android之常见安全问题

电脑系统更新后提示PIN码不可用，而且面部识别其他也进不去的情况

WIN10网络打印机-打印失败解决方案

Linux多启动U盘,syslinux 制作多系统启动U盘

MySql通信链路故障（Communications link failure）

【已解决】Fatal: Memory allocation failure

Titan_HIT_innovation 项目使用教程

创新指南 |风险管理：企业如何应对颠覆性创新带来的挑战

最新文章

DedeCMS添加半迅雷化[迅雷下载专用链接]

OpenWRT路由wifi迅雷下载 断线无法连接问题解决

电影《志 愿 军2存亡之战》百度下载云资源[MKV5.68GB]迅雷磁力完整版

NAS安装迅雷远程下载

变形金刚3：月黑之时1280超清迅雷下载

C#调用迅雷ThunderAgentLib.dll批量添加下载任务

【最新】白piao迅雷的下载速度(迅雷11亲测好用）

迅雷下载每天会有限制

删除设备和驱动器中的迅雷下载、百度网盘的图标(win10、win11可用)

乡村爱情圆舞曲全集高清迅雷下载

如何使用迅雷下载不支持断点续借的资源

利用python+迅雷批量下载视频

VC++调用迅雷下载文件

迅雷下载androidsdk的各种版本

转：用迅雷下载Android SDK全系列

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

现在如何注册台服服务器,《英雄联盟手游》台服账号注册教程台服拳头账号注册步骤图解...

python使用selenium爬英雄联盟王者荣耀壁纸附源码

LOL弗雷尔卓德服务器维护,英雄联盟4月28日维护到几点部分大区模式维护公告...

拳头服务器什么时候修复,拳头：今年将修复《英雄联盟》客户端启动时间降到19秒...

现在如何注册台服服务器,《英雄联盟手游》台服怎么注册账号台服注册账号方法...

【91xcz英雄联盟虚空行者卡萨丁xp主题91xcz】

(高仿英雄联盟游戏网页制作作业) 英雄联盟LOL游戏HTML网页设计模板简单学生网页设计静态HTML CSS网站制作成品

OpenWRT路由wifi迅雷下载断线无法连接问题解决

电影《志愿军2存亡之战》百度下载云资源[MKV5.68GB]迅雷磁力完整版

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载