admin管理员组

文章数量:1650907

前言:

同上篇爬虫练习-爬取小猪短租网北京地区短租房信息一样,均为极简的爬虫,仅仅爬取酷狗TOP500音乐信息(排名、歌手名、歌曲名、歌曲时长),可供入门和想入门的朋友学习。
本文为整理代码,梳理思路,并验证代码的有效性——2019.12.7


环境:
Python3(Anaconda3)
PyCharm
Chrome浏览器

主要模块:
BeautifulSoup
requests
time

1.

先看一下请求网址

# TOP500 首页
https://www.kugou.com/yy/rank/home/1-8888.html?from=rank


别被这个下载客户端唬住了,经过测试,我们可以通过修改“ /home/ ”后跟的数字来访问后面的页数,如:

https://www.kugou.com/yy/rank/home/2-8888.html?from=rank  # 第二页
https://www.kugou.com/yy/rank/home/3-8888.html?from=rank  # 第三页
... 
以此类推

一页有22首歌,我们可以推算出总共有23页。

 # 构造多页URL
urls = ['http://www.kugou/yy/rank/home/{}

本文标签: 爬虫酷狗信息音乐