Python爬虫入门-爬取LOL英雄信息写入txt文件|电子爱好者

admin管理员组
文章数量:1619183

最新在学es，搭建完后要搞点数据进去测测。

正好爱玩LOL，用python爬取LOL官网中英雄信息，先写入txt文件，后面要写库或者啥的用熟悉的java处理。

因为不是专业搞python的，具体python语法就不详细讲了，安装完环境，用代码直接跑就行了，报什么错下什么包就行了。

后面要爬其他的，根据这个改改代码基本就行了。

首先到LOL官网，英雄资料库地址；分析，具体的英雄id都在hero_list.js中。

可以看到，这个js里面基本上包含了所有的英雄id的信息

第一步，正则匹配获取所有英雄id；

第二步，查看英雄的详情页，点击英雄头像进去，会发现请求英雄id.js这个资源。

这个里面基本上包含了所有的英雄详情信息，也就是我们的最终目标；遍历上面的id请求，然后匹配出自己需要的信息。

完整代码：

from bs4 import BeautifulSoup
from selenium import webdriver
import requests
import time
import re
import json


def get_html():
    url = 'https://game.gtimg/images/lol/act/img/js/heroList/hero_list.js'
    strhtml = requests.get(url)
    file_handle = open('2.txt', mode='w')
    a_labels = re.findall('{"heroId":"(.*?)","n', strhtml.text)
    for a in a_labels:
        print("https://game.gtimg/images/lol/act/img/js/hero/"+a+".js")
        get_sub("https://game.gtimg/images/lol/act/img/js/hero/" +
                a+".js", file_handle)
    file_handle.close()


def get_sub(subhtml, filehandle):
    strhtml = requests.get(subhtml)
    strhtml.encoding = 'utf-8'
    bf = BeautifulSoup(strhtml.text)
    pagehtml = bf.encode('utf-8').decode('unicode_escape')
    name = re.findall('"name":"(.*?)","alias', pagehtml)
    alias = re.findall('"alias":"(.*?)","title', pagehtml)
    roles = re.findall('"title":"(.*?)","roles', pagehtml)
    attack = re.findall('"attack":"(.*?)","defense', pagehtml)
    magic = re.findall('"magic":"(.*?)","difficulty', pagehtml)
    iconImg = re.findall('"iconImg":"(.*?)","loadingImg', pagehtml)
    mainImg = re.findall('"mainImg":"(.*?)","iconImg', pagehtml)
    result = (name[0]+'\t'+alias[0]+'\t'+roles[0]+'\t'+attack[0]+'\t'+magic[0]+'\t'+iconImg[0] +
              '\t'+mainImg[0]+'\n')
    print(name[0]+'\t'+alias[0]+'\t'+roles[0]+'\t'+attack[0]+'\t'+magic[0]+'\t'+iconImg[0] +
          '\t'+mainImg[0])

    filehandle.writelines(result)


if __name__ == '__main__':

    html = get_html()

最终效果如下：

我只是取了名字，物理伤害，魔法伤害，大图地址，头像地址等。其他的信息按照正则匹配逐个获取即可。

本文标签：爬虫入门英雄文件信息

版权声明：本文标题：Python爬虫入门-爬取LOL英雄信息写入txt文件内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1728793273a1173923.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

lol服务器维护是拳头,拳头：今年将修复《英雄联盟》客户端启动时间降到19秒...

1小时前

《英雄联盟》新版客户端自上线以来虽然官方进行过几次修复，但仍然存在不少的BUG，客户端的启动速度和加载速度非常慢。拳头官方今天在官网发布了一篇公告，称未来六个月将会对lol客

lol服务器位置峡谷之巅,lol英雄联盟峡谷之巅怎么进_峡谷之巅是什么_峡谷之巅报名需要什么段位...

1小时前

lol峡谷之巅怎么进？峡谷之巅是什么？峡谷之巅是lol中的超级专区，游戏内有着超多免费点券与金币领取和参加丰富的活动和英雄皮肤等功能，如何进入峡谷之巅服

pbe下载教程超简单的一键下载英雄联盟pbe教程

1小时前

pbe下载教程超简单的一键下载英雄联盟pbe教程英雄联盟PBE美测服是拳头公司专为测试游戏内容和收集Bug而设立的服务器。由于它通常比正式服更新更快因此吸引了大量玩家前来体验。然而美测服的下载过程可能会有些复杂，

用Python爬取英雄联盟所有皮肤~隔壁小孩羡慕的哭了

1小时前

导语昨天下边回家在电梯口遇到一小屁孩哭着吵着要他麻麻给买一LOL皮肤看到他妈妈青一块白一块的脸色我已经心里在给这小孩默哀了结果就是撒泼打滚皮肤也没搞到手但是领到了麻麻赏赐的大嘴巴子于是小编就有想法出这期了~感兴趣的铁汁萌往下滑&am

Python3爬虫---抓取英雄联盟的所有英雄皮肤

1小时前

#!usrbinenv python # -*- coding:utf-8 -*- #@author:Chris iven #Python version 3.6 #1.分析LOL官网行为! #发现这个网页的所有数据都是经过js生成的

lol八月那服务器有无限火力,英雄联盟无限火力8月开启时间 2021年8月无限火力时间...

1小时前

导读现在已经是7月末了，英雄联盟官方在这个月推出了比较法，比如推出了全新玩法终极宝典，体验这个新模式，玩家可以将召唤师技能替换成其他英雄技能&

英雄联盟皮肤图片爬取

1小时前

文章目录思路分析完整代码效果展示思路分析首先，进入英雄联盟的官网资料站。通过抓包分析，我们可以得到每个英雄的ID。随便找个英雄点开，进入详情页面。查看页

ID CS6怎么加框_英雄联盟手游怎么修改游戏id-lol手游改中文名方法分享

1小时前

相信很多的小伙伴都有去玩lol手游吧，虽然都在外服玩。那么各位童鞋，你们知道要怎么把自己的游戏id变成中文吗，对于还不会这个操作的大兄弟们，ie小编也是

英雄联盟手游注册及下载教程（ios及安卓android最新最全版）

1小时前

据官方消息，28号公测地区的所有用户均可访问游戏，作为苦兮兮的国服安卓选手该如何抢先体验呢？ 注意本文以安卓用户为例，ios请在微信公众号搜索&

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）_游戏数据抓取

1小时前

（1）Python所有方向的学习路线（新版） 这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点

牛散村:python怎么爬取英雄联盟皮肤图片？爬虫实战！

1小时前

相信很多小伙伴都是喜爱英雄联盟的玩家，英雄联盟的皮肤制作还是比较精美的，有收集癖好的小编打算用爬虫将官网的皮肤爬取下来。接下来就看小编怎么用python爬取英雄联盟皮肤吧！&

04-爬取单个英雄联盟英雄的符文图片

1小时前

业务需求，需要爬取英雄联盟英雄的符文图片，然后在把它们拼接回去。以下是爬取单个英雄katarina的符文图片到本地的代码，爬取地址为： http:

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）

1小时前

🚀用Java爬一下英雄联盟数据 📓推荐网站(不断完善中)：个人博客 📌个人主页：个人主页 👉相关专栏

利用matlab爬虫从OPGG上整理LOL英雄信息

1小时前

问题描述 OPGG是最权威的LOL数据网站，从这个网站上我们可以得到很多有关LOL的非常有用的数据，而matlab爬虫就是一个能够从网站上搜集信息的工具。这篇文章将要讲述如何利用matlab爬虫从OPGG上整理LOL英雄信息。结果展示

拳头服务器什么时候修复,拳头：今年将修复《英雄联盟》客户端启动时间降到19秒...

1小时前

原标题：拳头：今年将修复《英雄联盟》客户端启动时间降到19秒《英雄联盟》新版客户端自上线以来虽然官方进行过几次修复，但仍然存在不少的BUG，客户端的

爬取实例三：爬取lol英雄联盟全阵容皮肤和爬王者荣耀全阵容皮肤

1小时前

1、结果展示将每一个英雄保存一个文件夹下，把他所有的皮肤保存在他对应的文件夹下(自动生成的你运行爬虫就好了) 2、代码解释 2.1用到第三方的模块有些自带，有些需要你自己安装&#

Requests库应用实例4：网络图片的爬取与存储(以爬取英雄联盟皮肤图片为例)

1小时前

网络图片的爬取与存储 1.获取爬取图片的URL2.代码3.批量下载lol皮肤图片完整代码 1.获取爬取图片的URL 以艾希的源计划联合为例这个图片的URL：https:game.gtimgimageslo

ios mailto: 用邮箱发邮件_英雄联盟手游公测，安卓苹果iOS注册最新下载安装教程！...

1小时前

目前安卓iOS在 28 日开启公测的地区有：日本、韩国、泰国、越南、菲律宾、马来西亚、新加坡。 12月首周公测地区:欧洲、中国台湾、大洋洲、越南，甚至还包括中东、北非、俄罗斯、土耳其。 202

python爬取千图网_python爬取lol官网英雄图片代码

1小时前

python爬取lol官网英雄图片代码可以帮助用户对英雄联盟官网平台的皮肤图片进行抓取，有很多喜欢lol的玩家们想要官方的英雄图片当作自己的背景或者头像，可以使用这款软件为你爬取图片资源&

kali入门到放弃系列二：破解wifi无线密码

1小时前

前置条件： 建议在淘宝购买一个linux免驱动无线网卡（自己买过绿联，水星等等无线网卡，发现都不能做到linux免驱动） 先上

电子爱好者 - 最新技术资讯及电子产品介绍！

Python爬虫入门-爬取LOL英雄信息写入txt文件

最新在学es，搭建完后要搞点数据进去测测。

首先到LOL官网，英雄资料库地址；分析，具体的英雄id都在hero_list.js中。

更多相关文章

lol服务器维护是拳头,拳头：今年将修复《英雄联盟》客户端 启动时间降到19秒...

lol服务器位置峡谷之巅,lol英雄联盟峡谷之巅怎么进_峡谷之巅是什么_峡谷之巅报名需要什么段位...

pbe下载教程 超简单的一键下载英雄联盟pbe教程

用Python爬取英雄联盟所有皮肤~隔壁小孩羡慕的哭了

Python3爬虫---抓取英雄联盟的所有英雄皮肤

lol八月那服务器有无限火力,英雄联盟无限火力8月开启时间 2021年8月无限火力时间...

英雄联盟皮肤图片爬取

ID CS6怎么加框_英雄联盟手游怎么修改游戏id-lol手游改中文名方法分享

英雄联盟手游注册及下载教程（ios及安卓android最新最全版）

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）_游戏数据抓取

牛散村:python怎么爬取英雄联盟皮肤图片？爬虫实战！

04-爬取单个英雄联盟英雄的符文图片

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）

利用matlab爬虫从OPGG上整理LOL英雄信息

拳头服务器什么时候修复,拳头：今年将修复《英雄联盟》客户端 启动时间降到19秒...

爬取实例三：爬取lol英雄联盟全阵容皮肤和爬王者荣耀全阵容皮肤

Requests库应用实例4：网络图片的爬取与存储(以爬取英雄联盟皮肤图片为例)

ios mailto: 用邮箱发邮件_英雄联盟手游公测，安卓苹果iOS注册最新下载安装教程！...

python爬取千图网_python爬取lol官网英雄图片代码

kali入门到放弃系列二：破解wifi无线密码

发表评论

推荐文章

QNAP威联通主机故障数据恢复操作流程

计算机版本低怎么升级,电脑ie浏览器版本过低怎么升级（浏览器版本过低升级步骤）...

【Git】Git国内官网下载地址、淘宝镜像下载地址以及卸载安装

聊聊微信内打开H5链接时如何自动跳转外部浏览器打开

CCD工业相机电脑连接正常但无法采集图像的相关设置

热门文章

硬盘数据被覆盖了怎么恢复

360浏览器开启webGL硬件加速解决百度地图3D视角正常展示的解决方案

Risk Management FINANCE 362 S2 2024 Processing

如何配置一台深度学习主机？

联想Y7000的屏幕亮度不能调节

C#实现检测打印机状态(包括打印机是否缺纸、打印队列任务数)

CompilationFailureException: Compilation failure error: cannot access NotThreadSafe

Ubuntu 18.04 Temporary failure resolving

用浏览器打开Excel文件的Java程序

拉我室友打了一把英雄联盟搞会了IntelliJ IDEA的安装与配置

最新文章

linux deploy安装并ssh连接教程

【手把手教你树莓派3 （二）】 启动wifi模块

使用Fluxion搭建钓鱼热点破解WiFi密码

frp内网穿透教程，ssh远程连接，服务自启动

查看自己手机连接过的wifi密码

图文手把手教程--ESP32 MQTT连接阿里云生活物联网平台

海尔随身WiFi型号F231ZC刷机去控过程分享

【微信小程序控制硬件15 】 开源一个微信小程序，支持蓝牙快速配网+WiFi双控制ESP32-C3应用示范；（附带Demo）

PacketTracer模拟器物联网教程3—家庭设备无线连接方法

ESP32-C3入门教程 蓝牙篇②——基于EspBlufiForAndroid极简的Blufi配网Demo

树莓派4b设置WiFi

【一站式教程】精通ESP32：使用VSCode与PlatformIO构建FreeRTOS项目、WIFI网页智能灯控系统、蓝牙、有趣的小功能 — 从轻松入门到项目实战~

ESP32学习笔记----WiFi使用(网页控制)

使用Arduino开发ESP32:wifi基本功能使用

0. 江协科技江科大-STM32入门教程-各章节详细笔记-查阅传送门-STM32标准库开发

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

lol服务器维护是拳头,拳头：今年将修复《英雄联盟》客户端启动时间降到19秒...

pbe下载教程超简单的一键下载英雄联盟pbe教程

拳头服务器什么时候修复,拳头：今年将修复《英雄联盟》客户端启动时间降到19秒...

【手把手教你树莓派3 （二）】启动wifi模块

【微信小程序控制硬件15 】开源一个微信小程序，支持蓝牙快速配网+WiFi双控制ESP32-C3应用示范；（附带Demo）

ESP32-C3入门教程蓝牙篇②——基于EspBlufiForAndroid极简的Blufi配网Demo

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载