爬虫实战6：爬取英雄联盟官网五个位置的综合排行榜保存到excel|电子爱好者

admin管理员组
文章数量:1619183

申明：资料来源于网络及书本，通过理解、实践、整理成学习笔记。

文章目录

英雄联盟官网
获取一个位置的综合排行榜所有数据（上单为例）
获取所有位置的综合排行榜所有数据

英雄联盟官网

获取一个位置的综合排行榜所有数据（上单为例）

以上单排行榜为例：

1、使用谷歌的无头浏览器访问该网页

url = 'http://lol.qq/guides/hero.shtml?ADTAG=cooperation.glzx.web'
# 创建一个参数对象，用来控制chrome以无界面的方式打开
options = Options()
# 后面的两个是固定写法 必须这么写
options.add_argument('--headless')
options.add_argument('--disable-gpu')
# 创建浏览器对象
driver = webdriver.Chrome(options=options)
driver.get(url)

2、获取上单的所有数据进行数据处理

# 获取上单英雄的所有数据
driver.find_element(By.XPATH, '//a[@data-types="top"]').click()
element = driver.find_element(By.ID, 'rankTable')
data = element.text.split('\n')
data.pop(0)

3、创建一个excel表格并写入第一行数据

# 新建一个工作簿
wb = Workbook()
ws1 = wb.active
# 更改sheet名称
ws1.title = '上单英雄'
# excel表单第一行
first_line = ('排名', '排名波动', '英雄', '位置', '胜率', '登场率')
for i in range(len(first_line)):
    ws1.cell(1, i + 1, first_line[i])

4、处理空值，网页信息中的英雄排名波动有部分英雄是没有值的，这会影响到我们后面批量处理获得的数据，所以我们可以按照索引添加数据0

创建一个列表，将有空值的索引添加进去，并在该位置插入数据0
```
# 排名波动空值
employ = [28, 43]
for i in range(46):
    if i in employ:
        data.insert(i * 5 + 1, '0')
```

5、将所有获得的数据分别保存至变量

# 将获取的数据进行处理并保存
    rank = data[i * 5]
    rank_float = data[i * 5 + 1]
    hero = data[i * 5 + 2]
    location = data[i * 5 + 3]
    win_rate = data[i * 5 + 4].split(' ')[0]
    appearance_rate = data[i * 5 + 4].split(' ')[1]

6、将所有数据保存到excel表，并保存到本地

# 将数据写入excel表格
    ws1.cell(i + 2, 1, rank)
    ws1.cell(i + 2, 2, rank_float)
    ws1.cell(i + 2, 3, hero)
    ws1.cell(i + 2, 4, location)
    ws1.cell(i + 2, 5, win_rate)
    ws1.cell(i + 2, 6, appearance_rate)
    # 保存excel表
    wb_name = '英雄联盟上单英雄总和排行榜数据.xlsx'
    wb.save(wb_name)

7、完整代码如下

from openpyxl import Workbook
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By

url = 'http://lol.qq/guides/hero.shtml?ADTAG=cooperation.glzx.web'
# 创建一个参数对象，用来控制chrome以无界面的方式打开
options = Options()
# 后面的两个是固定写法 必须这么写
options.add_argument('--headless')
options.add_argument('--disable-gpu')
# 创建浏览器对象
driver = webdriver.Chrome(options=options)
driver.get(url)
driver.implicitly_wait(10)
# 新建一个工作簿
wb = Workbook()
ws1 = wb.active
ws1.title = '上单英雄'
# excel表单第一行
first_line = ('排名', '排名波动', '英雄', '位置', '胜率', '登场率')
for i in range(len(first_line)):
    ws1.cell(1, i + 1, first_line[i])
# 获取上单英雄的所有数据
driver.find_element(By.XPATH, '//a[@data-types="top"]').click()
element = driver.find_element(By.ID, 'rankTable')
data = element.text.split('\n')
data.pop(0)
# 排名波动空值
employ = [28, 43]
for i in range(46):
    if i in employ:
        data.insert(i * 5 + 1, '0')
    # 将获取的数据进行处理并保存
    rank = data[i * 5]
    rank_float = data[i * 5 + 1]
    hero = data[i * 5 + 2]
    location = data[i * 5 + 3]
    win_rate = data[i * 5 + 4].split(' ')[0]
    appearance_rate = data[i * 5 + 4].split(' ')[1]
    # 将数据写入excel表格
    ws1.cell(i + 2, 1, rank)
    ws1.cell(i + 2, 2, rank_float)
    ws1.cell(i + 2, 3, hero)
    ws1.cell(i + 2, 4, location)
    ws1.cell(i + 2, 5, win_rate)
    ws1.cell(i + 2, 6, appearance_rate)
    # 保存excel表
    wb_name = '英雄联盟上单英雄总和排行榜数据.xlsx'
    wb.save(wb_name)
    print(rank, rank_float, hero, location, win_rate, appearance_rate)

8、运行结果

获取所有位置的综合排行榜所有数据

由于需要获取所有位置的数据，如果依次获取，会导致代码量很大，可以使用for循环加上if判断获取
完整代码如下：

from openpyxl import Workbook
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
import time


class LOL:
    def get_hero_info(self):
        # LOL官网url
        url = 'http://lol.qq/guides/hero.shtml?ADTAG=cooperation.glzx.web'
        # 创建一个参数对象，用来控制chrome以无界面的方式打开
        options = Options()
        # 后面的两个是固定写法 必须这么写
        options.add_argument('--headless')
        options.add_argument('--disable-gpu')
        # 创建浏览器对象
        driver = webdriver.Chrome(options=options)
        driver.get(url)
        driver.implicitly_wait(10)
        # 新建一个工作簿
        wb = Workbook()
        for j in range(5):
            # 获取上单英雄时所要变更的变量
            if j == 0:
                self.ws = wb.active
                self.ws.title = '上单英雄'
                driver.find_element(By.XPATH, '//a[@data-types="top"]').click()
                self.element = driver.find_element(By.ID, 'rankTable')
                # 页面中上单英雄排行波动为空值的索引
                self.employ = [28, 43]
                # 上单英雄排行总个数
                self.num = 46
            # 获取打野英雄时所要变更的变量
            elif j == 1:
            	# 创建第2个sheet表单并命名
                self.ws = wb.create_sheet('打野英雄', index=1)
                # 切换到打野英雄排行榜
                driver.find_element(By.XPATH, '//a[@data-types="jungle"]').click()
                self.element = driver.find_element(By.ID, 'rankTable')
                # 页面中打野英雄排行波动为空值的索引
                self.employ = [1, 5, 20, 29, 35]
                # 打野英雄排行总个数
                self.num = 40
            # 获取中单英雄时所要变更的变量
            elif j == 2:
            	# 创建第3个sheet表单并命名
                self.ws = wb.create_sheet('中单英雄', index=2)
                # 切换到中单英雄排行榜
                driver.find_element(By.XPATH, '//a[@data-types="mid"]').click()
                self.element = driver.find_element(By.ID, 'rankTable')
                # 页面中中单英雄排行波动为空值的索引
                self.employ = [24, 59]
                # 中单英雄排行总个数
                self.num = 60
            # 获取下路英雄时所要变更的变量
            elif j == 3:
            	# 创建第4个sheet表单并命名
                self.ws = wb.create_sheet('下路英雄', index=3)
                # 切换到下路英雄排行榜
                driver.find_element(By.XPATH, '//a[@data-types="bottom"]').click()
                self.element = driver.find_element(By.ID, 'rankTable')
                # 页面中下路英雄排行波动为空值的索引
                self.employ = [12]
                # 下路英雄排行总个数
                self.num = 21
            # 获取辅助英雄时所要变更的变量
            elif j == 4:
            	# 创建第5个sheet表单并命名
                self.ws = wb.create_sheet('辅助英雄', index=4)
                # 切换到辅助英雄排行榜
                driver.find_element(By.XPATH, '//a[@data-types="support"]').click()
                self.element = driver.find_element(By.ID, 'rankTable')
                # 页面中辅助英雄排行波动为空值的索引
                self.employ = []
                # 辅助英雄排行总个数
                self.num = 37
            # 处理数据
            data = self.element.text.split('\n')
            data.pop(0)
            # excel表单第一行
            first_line = ('排名', '排名波动', '英雄', '位置', '胜率', '登场率')
            for i in range(len(first_line)):
                self.ws.cell(1, i + 1, first_line[i])
            time.sleep(1)
            # 排名波动空值
            for i in range(self.num):
                if i in self.employ:
                    data.insert(i * 5 + 1, '0')
                # 将获取的数据进行处理并保存
                rank = data[i * 5]
                rank_float = data[i * 5 + 1]
                hero = data[i * 5 + 2]
                location = data[i * 5 + 3]
                win_rate = data[i * 5 + 4].split(' ')[0]
                appearance_rate = data[i * 5 + 4].split(' ')[1]
                # 将数据写入excel表格
                self.ws.cell(i + 2, 1, rank)
                self.ws.cell(i + 2, 2, rank_float)
                self.ws.cell(i + 2, 3, hero)
                self.ws.cell(i + 2, 4, location)
                self.ws.cell(i + 2, 5, win_rate)
                self.ws.cell(i + 2, 6, appearance_rate)
                # 保存excel表
                wb_name = '英雄联盟数据.xlsx'
                wb.save(wb_name)
                print(rank, rank_float, hero, location, win_rate, appearance_rate)


if __name__ == '__main__':
    LOL().get_hero_info()

运行结果：

上单英雄综合排行榜数据
打野英雄综合排行榜数据
中单英雄综合排行榜数据
下路英雄综合排行榜数据
辅助英雄综合排行榜数据

Python爬虫实战专栏：

爬虫实战5：爬取全部穿越火线武器的图片以武器名称命名保存到本地文件

爬虫实战6：爬取英雄联盟官网五个位置的综合排行榜保存到excel

爬虫实战7：更新中—

一个坚持学习，坚持成长，坚持分享的人，即使再不聪明，也一定会成为优秀的人！

如果看完觉得有所收获的话，记得一键三连哦，谢谢大家！

本文标签：爬虫官网实战位置排行榜

版权声明：本文标题：爬虫实战6：爬取英雄联盟官网五个位置的综合排行榜保存到excel 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1728792652a1173859.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

spider英雄联盟官网英雄皮肤图片的获取并保存

2小时前

Spider爬取英雄联盟官网皮肤图片实验名称：英雄联盟图片爬虫一、实验准备工作二、实验过程分析写了好几个实验报告了，还是不会写总结是从这里开始找的英雄联盟资料库感觉还能更优化一点，哈哈！参考了这位大哥的一点点代码 --------

Python爬取英雄联盟官网图片

2小时前

脚本下载图片预览—草丛三兄弟 #encodinggbkimport re,os,requests,jsonfrom selenium import webdriverimport pprint,time# https:lol.

html游戏官网制作英雄联盟LOL游戏网站设计与实现 (web课程与设计)

2小时前

🌩️ 精彩专栏推荐👇🏻👇🏻👇🏻💂 作者主页:

英雄联盟官网网页设计 html源码大作业

2小时前

👉文末查看项目源码作品编号：0454页面数目：2页技术特点：htmlcss 英雄联盟2页 👇 大家点赞、收藏、评论啦

初学者之《复刻英雄联盟官网之人脸识别登录》①

2小时前

初学者之《复刻英雄联盟官网之人脸识别登录》① 第1章绪论第2章 Web项目需求分析前言英雄联盟是在这个电竞时代被推至至高点的一款MOBA游戏，然而其官网的登录方式在个人认为或许有些繁琐，而本文就是针对这一问题提出的一种基于人

Python爬虫之selenium爬取英雄联盟官网英雄皮肤图片下载到本地和保存到数据库

2小时前

从英雄联盟皮肤网站的网页源代码中获取不到英雄的皮肤地址通过selenium可以轻松获取想要的内容源码展示 from selenium import webdriverfrom time import sleepfrom pyqu

网页设计期末课程设计大作业-HTML、CSS、JS仿英雄联盟LOL官网)

2小时前

🌩️ 精彩专栏推荐👇🏻👇🏻👇🏻💂 作者主页:

python爬虫脚本初级入门爬虫英雄联盟所有皮肤_Python爬虫实战，60行代码爬取英雄联盟全英雄全皮肤，找寻曾今那些被删除的绝版皮肤...

2小时前

学了一周多的爬虫课后终于按捺不住了，小编决定自己手动编写爬虫程序，刚好LJ在鼓励学员分享成果，优秀作品有奖励，就把自己用Python编程爬取各大游戏高清

Python爬虫：英雄联盟近期战绩查询

2小时前

c语言选手早已听说Python的方便和其各大爬虫模块的实用性，于是暑假无所事事的我决定在没有系统学习Python语法的情况下，一边写一个和自己兴趣有关的爬虫，一边学习一下Py

python爬取英雄联盟所有皮肤价格表_用python网络爬虫爬取英雄联盟英雄图片

2小时前

用python爬虫爬取lol皮肤。这也用python网络爬虫爬取lol英雄皮肤，忘了是看哪个大神的博客(由于当时学了下就一直放在这儿，现在又才拿出来，再加上马上要考二级挺忙

Python爬虫采集英雄联盟皮肤图片

1小时前

LOL大家都爱玩吧，今天我们来爬一波图。用requests爬取英雄联盟官网所有英雄的皮肤图片，并以英雄分类保存。一，网页分析首先打开英雄联盟官网，

Python爬虫实战| Python爬取英雄联盟高清壁纸

1小时前

先看一下最终爬取的效果，每个英雄的壁纸都被爬取下来了： “黑暗之女安妮”的12张壁纸： 高清大图： 下面开始正式教学！ 版本&a

Java爬虫爬取英雄联盟英雄的皮肤图片到本地

1小时前

1.打开英雄联盟的官网，找到英雄介绍的页面 https:lol.qqdatainfo-heros.shtml 所有英雄的页面 https:lol.qqdatainfo-defai

爬虫分享(三)：多线程爬取英雄联盟皮肤图片

1小时前

爬虫分享(三)：多线程爬取皮肤 1.获取英雄数据首先进入LOL官网打开游戏资料我们先尝试用该url构建一个请求 import requestsurlhttps:lol.qqdatainfo-her

lol服务器维修时间,英雄联盟2014.1.9维护时间 lol官网服务器维护公告

1小时前

亲爱的LOL玩家： 我们将于2014年1月9日2点-12点进行全区停机版本更新，届时您将暂时无法登录游戏。停机时间：1月9日2点至12点(开机时间会因工作进度推迟或者提前)

使用爬虫框架scrapy爬取LOL英雄数据

1小时前

Scrapy框架实战爬取目标：英雄联盟所有英雄的基本信息(名字，背景故事，技能名称及介绍)、下载所有英雄的皮肤并保存至本地首先来到LOL官网首页&#xff0c

LPL比赛数据可视化，完成这个项目，用尽了我的所有Python知识_lol英雄信息爬虫数据可视化

1小时前

代码过多，请到源码中查看 Echarts部分小总结 Echarts部分不是很难，直接到Echarts官网实例中找你想要的图表，然后复制代码，修改图表的

python爬虫--实战英雄联盟LOL壁纸下载

1小时前

爬取的是国服的官网，所以图片并没有所谓的4K之类的， 尺寸可选择的也不多，所以我就下载了个人比较喜欢的两种尺寸。 import osfrom urllib import

利用matlab爬虫从OPGG上整理LOL英雄信息

1小时前

问题描述 OPGG是最权威的LOL数据网站，从这个网站上我们可以得到很多有关LOL的非常有用的数据，而matlab爬虫就是一个能够从网站上搜集信息的工具。这篇文章将要讲述如何利用matlab爬虫从OPGG上整理LOL英雄信息。结果展示

Python爬虫实战 | 利用多线程爬取 LOL 高清壁纸

1小时前

来源：公众号【杰哥的IT之旅】作者：阿拉斯加 ID：Jake_Internet 如需获取本文完整代码及 LOL 壁纸，请为本文右下角点赞并添加杰哥微信

电子爱好者 - 最新技术资讯及电子产品介绍！

爬虫实战6：爬取英雄联盟官网五个位置的综合排行榜保存到excel

文章目录

英雄联盟官网

获取一个位置的综合排行榜所有数据（上单为例）

获取所有位置的综合排行榜所有数据

更多相关文章

spider英雄联盟官网英雄皮肤图片的获取并保存

Python爬取英雄联盟官网图片

html游戏官网制作 英雄联盟LOL游戏网站设计与实现 (web课程与设计)

英雄联盟官网 网页设计 html源码 大作业

初学者之《复刻英雄联盟官网之人脸识别登录》①

Python爬虫之selenium爬取英雄联盟官网英雄皮肤图片下载到本地和保存到数据库

网页设计期末课程设计大作业-HTML、CSS、JS仿英雄联盟LOL官网)

python爬虫脚本 初级入门爬虫英雄联盟所有皮肤_Python爬虫实战，60行代码爬取英雄联盟全英雄全皮肤，找寻曾今那些被删除的绝版皮肤...

Python爬虫：英雄联盟近期战绩查询

python爬取英雄联盟所有皮肤价格表_用python网络爬虫爬取英雄联盟英雄图片

Python爬虫采集英雄联盟皮肤图片

Python爬虫实战| Python爬取英雄联盟高清壁纸

Java爬虫 爬取英雄联盟英雄的皮肤图片到本地

爬虫分享(三)：多线程爬取英雄联盟皮肤图片

lol服务器维修时间,英雄联盟2014.1.9维护时间 lol官网服务器维护公告

使用爬虫框架scrapy爬取LOL英雄数据

LPL比赛数据可视化，完成这个项目，用尽了我的所有Python知识_lol英雄信息爬虫数据可视化

python爬虫--实战英雄联盟LOL壁纸下载

利用matlab爬虫从OPGG上整理LOL英雄信息

Python爬虫实战 | 利用多线程爬取 LOL 高清壁纸

发表评论

推荐文章

硬盘被格式化后数据如何恢复（在mac电脑上抹掉了）

Mac系统 - 升级node版本

Android Studio新手教程

【玄学修机】REDMI笔记本用触摸板屏幕亮度自动调最大

The Innovation | Call for Youth Editors 青年编委招募

热门文章

荣耀6如何升级android版本号,华为荣耀6升级Android5.1(EMUI3.1)图文教程

解决移动端视频层级最高的问题，修改video属性

uc手机书签导出方法

解锁Windows所有电源选项

计算机无法屏幕亮度,win7电脑屏幕亮度无法调节怎么办？调节屏幕亮度的方法...

easyexcel使用模板导出时出现异常ExcelGenerateException: Create workbook failure

成功解决“Run-Time Check Failure #2 - Stack around the variable ‘arr‘ was corrupted.“问题

Laya浏览器调试

Python爬取英雄联盟官网壁纸源码分享

python爬虫脚本 初级入门爬虫英雄联盟所有皮肤_Python爬虫实战，60行代码爬取英雄联盟全英雄全皮肤，找寻曾今那些被删除的绝版皮肤...

最新文章

linux deploy安装并ssh连接教程

【手把手教你树莓派3 （二）】 启动wifi模块

使用Fluxion搭建钓鱼热点破解WiFi密码

frp内网穿透教程，ssh远程连接，服务自启动

查看自己手机连接过的wifi密码

图文手把手教程--ESP32 MQTT连接阿里云生活物联网平台

海尔随身WiFi型号F231ZC刷机去控过程分享

【微信小程序控制硬件15 】 开源一个微信小程序，支持蓝牙快速配网+WiFi双控制ESP32-C3应用示范；（附带Demo）

PacketTracer模拟器物联网教程3—家庭设备无线连接方法

ESP32-C3入门教程 蓝牙篇②——基于EspBlufiForAndroid极简的Blufi配网Demo

树莓派4b设置WiFi

【一站式教程】精通ESP32：使用VSCode与PlatformIO构建FreeRTOS项目、WIFI网页智能灯控系统、蓝牙、有趣的小功能 — 从轻松入门到项目实战~

ESP32学习笔记----WiFi使用(网页控制)

使用Arduino开发ESP32:wifi基本功能使用

0. 江协科技江科大-STM32入门教程-各章节详细笔记-查阅传送门-STM32标准库开发

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

html游戏官网制作英雄联盟LOL游戏网站设计与实现 (web课程与设计)

英雄联盟官网网页设计 html源码大作业

python爬虫脚本初级入门爬虫英雄联盟所有皮肤_Python爬虫实战，60行代码爬取英雄联盟全英雄全皮肤，找寻曾今那些被删除的绝版皮肤...

Java爬虫爬取英雄联盟英雄的皮肤图片到本地

python爬虫脚本初级入门爬虫英雄联盟所有皮肤_Python爬虫实战，60行代码爬取英雄联盟全英雄全皮肤，找寻曾今那些被删除的绝版皮肤...

【手把手教你树莓派3 （二）】启动wifi模块

【微信小程序控制硬件15 】开源一个微信小程序，支持蓝牙快速配网+WiFi双控制ESP32-C3应用示范；（附带Demo）

ESP32-C3入门教程蓝牙篇②——基于EspBlufiForAndroid极简的Blufi配网Demo

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载