用Scrapy抓取英雄联盟所有皮肤|电子爱好者

admin管理员组
文章数量:1619284

部署scrapy

在命令行中输入：

scrapy startproject lolskinSpider
cd lolskinSpider
scrapy gensipder lolskin lol.qq

然后进入文件夹开始构造任务

设置scrapy

首先要分析爬取的网站，观察英雄联盟官网英雄联盟游戏资料，利用scrapy shell

scrapy shell "https://lol.qq/data/info-heros.shtml"

hero=response.xpath('//*[@]/li[1]/a/@title')
hero

发现结果为空值，因此该网站可能采用xhr异步渲染，再次刷新网站，我们发现：

在preview中，我们得知将需要hero下的heroId来跳转到对应的英雄界面，在英雄界面中，我们需要skins下的皮肤名称name和皮肤下载链接mainImg

设置items.py

打开items.py，我们需要爬取两类数据，一是皮肤名称，二是皮肤下载链接，所以：

import scrapy

class LolskinspiderItem(scrapy.Item):
    #图片名称
    name=scrapy.Field()
    #图片下载地址
    img_url=scrapy.Field()

设置lolskin.py

这是我们的主要文件，从js文件的request.url中得知我们将要爬取的网址，因此在这里allowed_domain将不再需要。分析可得，每一个英雄的网址的区别就是最后的数字，数字对应每一个英雄的ID。

import scrapy
from json import loads
from ..items import LolskinspiderItem

class LolskinSpider(scrapy

本文标签：皮肤英雄联盟 scrapy

版权声明：本文标题：用Scrapy抓取英雄联盟所有皮肤内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1728793874a1173980.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

用Scrapy抓取英雄联盟所有皮肤

部署scrapy

设置scrapy

设置items.py

设置lolskin.py

更多相关文章

:satellite: Mimic：将英雄联盟客户端搬到手机上的创新之举

用户首次登录之前必须更改密码_英雄联盟手游新手须知游玩英雄联盟手游前你必须知道的...

nodejs+puppeteer+chromium爬取异步数据页面（英雄联盟英雄资料列表页+详情页）

python爬取英雄联盟所有皮肤价格表_利用Python协程来爬取LOL所有英雄的皮肤高清图片...

英雄联盟手游注册及下载教程（ios及安卓android最新最全版）

Python爬取英雄联盟皮肤，并保存到本地

python使用selenium爬英雄联盟王者荣耀壁纸 附源码

LPL比赛数据可视化，完成这个项目，用尽了我的所有Python知识_lol英雄信息爬虫数据可视化

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）_游戏数据抓取

04-爬取单个英雄联盟英雄的符文图片

【Python探讨】PyQt5、request模块联合编写的英雄联盟全皮肤下载器| 附源代码

英雄联盟手游主页---rem布局

LOL弗雷尔卓德服务器维护,英雄联盟4月28日维护到几点 部分大区模式维护公告...

python爬虫--实战英雄联盟LOL壁纸下载

风靡全球的英雄联盟手游，竟然没有国服，只能教你玩国际服了...

git.exe 启动 慢_拳头：今年将修复英雄联盟客户端 启动时间降到19秒

拳头服务器什么时候修复,拳头：今年将修复《英雄联盟》客户端 启动时间降到19秒...

WeGame打不开《英雄联盟》的科普解答

【C语言】LOL英雄查询系统

3dmip12小时内无法注册_iPhone12如何玩英雄联盟手游？一分钟教你快速注册下载台服lol手游_3DM手游...

发表评论

推荐文章

Android应用程序中嵌入浏览器，用WebView控件来显示百度首页面,在当前页浏览网页。

竞品分析----夸克：我离百度还有多少步？

ps c6更新服务器未响应,Photoshop CS6 GPU 常见问题官方解决方案

用bat清理垃圾并恶搞

Key Points on Innovation from Peter Drucker

热门文章

老司机都爱的资源神器绿色xunlei，切勿大肆传播！！

1恢复 群晖raid_关于RAID1阵列数据丢失的恢复

magic4升级鸿蒙系统日期,magic4.0什么时候更新

登录界面漏洞

[笔记]Windows10 + Ubuntu双系统，仅重装Win10如何找回Linux引导

win10或win11打印机无法打印

打印机 正在删除正在打印怎么也删除不了

mysql-CommunicationsException: Communications link failure

微信打不开链接怎么办，微信跳转外部浏览器打开

树莓派开机自动连接WiFi 及树莓派设置固定IP地址

最新文章

迅雷 API 接口说明文档 -调用迅雷自动下载

DedeCMS添加半迅雷化[迅雷下载专用链接]

OpenWRT路由wifi迅雷下载 断线无法连接问题解决

电影《志 愿 军2存亡之战》百度下载云资源[MKV5.68GB]迅雷磁力完整版

NAS安装迅雷远程下载

C# 调用迅雷下载引擎模块

C#调用迅雷ThunderAgentLib.dll批量添加下载任务

【最新】白piao迅雷的下载速度(迅雷11亲测好用）

迅雷下载每天会有限制

删除设备和驱动器中的迅雷下载、百度网盘的图标(win10、win11可用)

使用迅雷下载远程FTP文件

提高迅雷下载速度的方法

如何使用迅雷下载不支持断点续借的资源

利用python+迅雷批量下载视频

VC++调用迅雷下载文件

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

python使用selenium爬英雄联盟王者荣耀壁纸附源码

LOL弗雷尔卓德服务器维护,英雄联盟4月28日维护到几点部分大区模式维护公告...

git.exe 启动慢_拳头：今年将修复英雄联盟客户端启动时间降到19秒

拳头服务器什么时候修复,拳头：今年将修复《英雄联盟》客户端启动时间降到19秒...

1恢复群晖raid_关于RAID1阵列数据丢失的恢复

打印机正在删除正在打印怎么也删除不了

OpenWRT路由wifi迅雷下载断线无法连接问题解决

电影《志愿军2存亡之战》百度下载云资源[MKV5.68GB]迅雷磁力完整版

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载