Python爬虫采集英雄联盟皮肤图片|电子爱好者

admin管理员组
文章数量:1619291

LOL大家都爱玩吧，今天我们来爬一波图。用requests爬取英雄联盟官网所有英雄的皮肤图片，并以英雄分类保存。

一，网页分析

首先打开英雄联盟官网，并找到英雄页面，然后分析页面，先查看网页源码，这里我们就以第一个英雄 “ 黑暗之女 ” 为例，点击可以看到他的名字和头像的图片链接都在id = " jSearchHeroDiv " 的ul节点下面的li节点中，由此看出一个英雄就是一个li节点。

可以看到，网页源代码中没有资源，通过请求皮肤站页面发现并没有出来结果。由此推断出，该页面内容是通过js加载出来的，这是打开Network选项卡，筛选JS请求，然后发现有一个hero_list.js，点到Preview选项卡，可以看到这里面存放着英雄信息，然后点进headers选项卡得知他的url为https://game.gtimg/images/lol/act/img/js/heroList/hero_list.js

接着，我们点击第一个英雄，可以发现，当网页加载完成时，在开发者工具的Network选项中出现了一个1.js的文件，之后点击他的header，发现他的url为https://game.gtimg/images/lol/act/img/js/hero/1.js。

我们点击它，再点击Preview选项，点击查看，发现里面是这个英雄以及皮肤的详细信息，这些信息就是我们所需要的了。

最后通过分析可以得知name就是皮肤的名称，mainImg就是我们想要的皮肤图片，只要得到这些关键信息就可以制作爬虫了

那我们就按照这个思路开始我们的爬虫吧！

一，获取英雄数量

首先我们进入英雄列表页，打开Network选项卡，筛选JS请求，然后发现有一个hero_list.js，这里存放在所有英雄，点到后查看headers选项卡得知他的url为https://game.gtimg/images/lol/act/img/js/heroList/hero_list.js，这样就可以得到英雄数量了。

r = requests.get(hero_url)
hero_json = r.json()
hero_json = hero_json['hero']
print(len(hero_json))

二，获取英雄名（创建目录）

点击英雄详情页面，查找JS文件（方法同上），可以得到他的url，但是我们要做的是爬取所有英雄的皮肤图片，所有我们看一下能不能找到什么规律，我们再点击第二个英雄查看一下

https://game.gtimg/images/lol/act/img/js/hero/1.js
https://game.gtimg/images/lol/act/img/js/hero/2.js

通过观察可以看到网页链接基本相同，只有 .js 前面的数字不一样，这里的数字就是英雄的编号，所以只要使这里的数字发生变化就能得到对应英雄的信息。从json里我们可以得到英雄名称，皮肤名称，图片地址等信息，这时我们就可以创建对应英雄的文件夹了。我们来看代码实现

def get_info(base_url):
    url = base_url + str(i) + '.js'
    r = requests.get(url)
    info = r.json()
    hero = info.get('hero').get('name') #英雄名称
    skins = info.get('skins')
    path = file_path + '/' + hero
    if not os.path.exists(path):
        os.mkdir(path)

三，获取皮肤名称与地址

获取皮肤名称与地址的方法与上面相同，所以不做太多介绍，这里需要注意的是有的皮肤url为空，这就需要在遍历的时候注意，遇到空url就跳过，然后访问图片url，并以二进制写入。

def get_skin(path, skins):
    for skin in skins:
        skin_name = skin.get('name')
        skin_url = skin.get('mainImg')
        if skin_url == '':
            continue
        img = requests.get(skin_url, headers=headers)
        if not os.path.exists(path + '/' + skin_name + '.jpg'):
            with open(path + '/' + skin_name + '.jpg', 'wb')as f:
                f.write(img.content)

四，执行主程序

这里加入了计时，方便查看程序所用时长

if __name__ == '__main__':
    r = requests.get(hero_url)
    hero_json = r.json()
    hero_json = hero_json['hero'] # 获取英雄数量
    print(len(hero_json))
    for i in range(1, len(hero_json)):
        get_info(base_url)
    print('用时{:.3f}s'.format(start - perf_counter()))

好了，以上就是对英雄联盟全站所有皮肤图片的抓取过程

下面是爬取结果（这里只采集前20个英雄）：

完整代码：

import json
import requests
import os
from time import perf_counter

# 开始计时
start = perf_counter()
headers = {
    'user - agent':
        'Mozilla / 5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 84.0.4147.89Safari / 537.36'
}
hero_url = 'https://game.gtimg/images/lol/act/img/js/heroList/hero_list.js'
base_url = 'https://game.gtimg/images/lol/act/img/js/hero/'
file_path = 'E:\python\project\LOL英雄皮肤\image'


# 获取英雄名并创建文件夹
def get_info(base_url):
    url = base_url + str(i) + '.js'
    r = requests.get(url)
    info = r.json()
    hero = info.get('hero').get('name')
    skins = info.get('skins')
    path = file_path + '/' + hero
    if not os.path.exists(path):
        os.mkdir(path)
    get_skin(path, skins)
    print(hero + ' —— ok')


# 获取皮肤并保存
def get_skin(path, skins):
    for skin in skins:
        skin_name = skin.get('name')
        skin_url = skin.get('mainImg')
        if skin_url == '':
            continue
        img = requests.get(skin_url, headers=headers)
        if not os.path.exists(path + '/' + skin_name + '.jpg'):
            with open(path + '/' + skin_name + '.jpg', 'wb')as f:
                f.write(img.content)


if __name__ == '__main__':
    r = requests.get(hero_url)
    hero_json = r.json()
    hero_json = hero_json['hero'] # 获取英雄数量
    for i in range(1, len(hero_json)):
        get_info(base_url)
    print('用时{:.3f}s'.format(start - perf_counter()))

如有错误，欢迎私信纠正，谢谢支持！

本文标签：爬虫皮肤英雄联盟图片

版权声明：本文标题：Python爬虫采集英雄联盟皮肤图片内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1728793785a1173973.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Python爬虫采集英雄联盟皮肤图片

一，网页分析

一，获取英雄数量

二，获取英雄名（创建目录）

三，获取皮肤名称与地址

四，执行主程序

更多相关文章

nodejs+puppeteer+chromium爬取异步数据页面（英雄联盟英雄资料列表页+详情页）

ID CS6怎么加框_英雄联盟手游怎么修改游戏id-lol手游改中文名方法分享

爬取lol官网所有英雄照片，并存储到pysql

python爬取英雄联盟所有皮肤价格表_利用Python协程来爬取LOL所有英雄的皮肤高清图片...

python -又一次爬虫练习（爬取LOL所有的英雄头像）

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）_游戏数据抓取

Python 多进程、协程异步抓取英雄联盟皮肤并保存在本地

牛散村:python怎么爬取英雄联盟皮肤图片？爬虫实战！

kf.qq.lol.html,英雄联盟手游预约FAQ

LOL弗雷尔卓德服务器维护,英雄联盟4月28日维护到几点 部分大区模式维护公告...

python爬虫--实战英雄联盟LOL壁纸下载

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）

英雄联盟是什么？

风靡全球的英雄联盟手游，竟然没有国服，只能教你玩国际服了...

[附源码]计算机毕业设计Python+uniapp英雄联盟网站APPr40r9(程序+lw+APP+远程部署)

WeGame打不开《英雄联盟》的科普解答

Requests库应用实例4：网络图片的爬取与存储(以爬取英雄联盟皮肤图片为例)

【BZOJ5018】[Snoi2017]英雄联盟 背包

【C语言】LOL英雄查询系统

《复仇者联盟2：奥创纪元》720高清迅雷下载

发表评论

推荐文章

Ubuntu 22.04下安装Remarkable

LD6045 Business Enterprise and Innovation

计算机无法用630打印机,爱普生LQ-630型针式打印机突然打印几行乱码，就不工作了...

ABAQUS中出现XML parsing failure for job错误怎么解决？

破解日记 WiFi密码跑字典暴力破解 尽可能通俗易懂的版本

热门文章

paper2remarkable 项目教程

词汇理解2-6篇

黑马点评项目全部功能实现及详细笔记--Redis练手项目

airdroid黑屏_如何使用AirDroid从PC控制Android设备

surface屏幕自动调节亮度无法关闭

联想ThinkPad E560 按F5 F6调节屏幕亮度，将调节屏幕亮度的按钮改为fn+F5 F6控制

js基础 ——HBuilderX配置浏览器及在浏览器上的显示问题

高通信息科技服务器,Wireless Technology &amp; Innovation | Mobile Technology | Qualcomm

英雄联盟国际服怎么下载 教你轻松学会一键下载lol国际服

【python教程入门学习】Python黑科技：WiFi破解

最新文章

可用迅雷或idm下载百度云文件的新方法

ARCGIS10 官方中文版迅雷下载

自动化迅雷下载文件(vbs脚本)调用迅雷api

迅雷 API 接口说明文档 -调用迅雷自动下载

DedeCMS添加半迅雷化[迅雷下载专用链接]

2011最新《美味一吻巴黎》1024x560.BD中字迅雷下载

genymotion 下载模拟器下n久特别慢无法下载进度为0教你用迅雷下载这些虚拟机多爽啊想暂停就暂停

C# 调用迅雷下载引擎模块

C#调用迅雷ThunderAgentLib.dll批量添加下载任务

【最新】白piao迅雷的下载速度(迅雷11亲测好用）

迅雷下载 HP QTP LR QC AML MyEclipse8.5 Tomcat7地址

struts2中文件支持迅雷下载

使用迅雷下载远程FTP文件

提高迅雷下载速度的方法

如何使用迅雷下载不支持断点续借的资源

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

LOL弗雷尔卓德服务器维护,英雄联盟4月28日维护到几点部分大区模式维护公告...

【BZOJ5018】[Snoi2017]英雄联盟背包

破解日记 WiFi密码跑字典暴力破解尽可能通俗易懂的版本

高通信息科技服务器,Wireless Technology & Innovation | Mobile Technology | Qualcomm

英雄联盟国际服怎么下载教你轻松学会一键下载lol国际服

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载