批量下载和改名21世纪英文报学生周报听力|电子爱好者

admin管理员组
文章数量:1583584

批量下载和改名21世纪英文报学生周报听力

如何找到音频
痛点
python批量下载和改名

如何找到音频

建议使用 google chrome浏览器。
https://www.i21st/ 导航横栏–报纸听力–初中–初二，以初二为例，
https://paper.i21st/audio_21je2_1.html
打开一篇文章的链接，比如
https://paper.i21st/story/162390.html
右键–源码，可以找到
audio id=‘audio’ src=‘https://cdn.21elt/paper/21je2/21sp2_800/21je2_800_162390_1.mp3’ preload=‘auto’ device=‘other’ WXAgent=‘0’> </audio
通过迅雷可以下载。

痛点

（1）通过微信公众号听，播放器无法准确定位和前后拖动。所以最好下载后，通过其它播放器听。
（2）每个音频很短，而人工下载超过100个音频，过于浪费时间。
（3）每个音频通过数字命名，无法对应报纸的文章，而人工改名又是一大笔时间开销。

python批量下载和改名

import requests
from bs4 import BeautifulSoup
from time import sleep
import os
from win32com.client import Dispatch

Headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'
}

def get_url(url):
    wd_data = requests.get(url,headers=Headers)
    soup = BeautifulSoup(wd_data.text,'html.parser')
    return soup

def get_mp3(url):
    soup = get_url(url)
    audios = soup.select('audio')
    mp3 = ""
    for audio in audios:
        mp3 = mp3 + str(audio['src'])        
    return mp3

def get_links(url):
    soup1 = get_url(url)
    #获取链接
    links = soup1.select('a')
    audios = []
    titles = []
    for alink in links:
        if 'href' in alink.attrs:
            url2 = alink['href']
            title = alink.get_text()
            if(url2[:7] == '/story/'):
                url22 = 'https://paper.i21st' + url2                
                audios.append(get_mp3(url22))
                titles.append(title)
                
    o = Dispatch("ThunderAgent.Agent64.1")  
    for onemp3,onetitle in zip(audios,titles):
        mp3name = os.path.basename(os.path.dirname(onemp3)) + "_" +onetitle + ".mp3"
        print(str(onemp3)+"  "+str(mp3name))
        o.AddTask(str(onemp3), str(mp3name))              
    o.CommitTasks() 
    
if __name__ == '__main__':
    urls = ['https://paper.i21st/audio_21je2_{}.html'.format(number) for number in range(3,5)]
    for url in urls:
        get_links(url)
        sleep(2)

功能分析：
get_url利用requests的网页获取功能，自动遍历每个链接。
get_mp3，在打开独立文章的网页后，通过BS4，直接找到mp3链接。
get_links有三个功能，1遍历导航页，2自动打开迅雷，3为mp3改名，几乎没有人工干预，非常节省时间。
只需要修改urls = …range(3,5)中的数字，根据自己所需来下载哪个导航页。

本文标签：周报批量听力世纪学生

版权声明：本文标题：批量下载和改名21世纪英文报学生周报听力内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1727920293a1138127.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

批量下载和改名21世纪英文报学生周报听力

批量下载和改名21世纪英文报学生周报听力

如何找到音频

痛点

python批量下载和改名

更多相关文章

HTML学生个人网站作业设计：电影网站设计——迅雷看看电影网页(1页) HTML+CSS+JavaScript 简单DIV布局个人介绍网页模板代码 DW学生个人网站制作成品下载

[Qt]在Qt c++中调用迅雷openSDK,使用迅雷批量下载文件（demo程序）

如何使用Photoshop批量扫描保存文档

如何批量给pdf文件加密？

利用Python在NASA Earthdata Search 上批量下载MODIS数据

android+语音amr转mp3格式转换,安卓批量amr转mp3 微信amr批量转换

批量下载文件的设备和方法

Swift 周报 第十三期

任正非发声：把活下来作为最主要纲领；安卓山寨 iOS 启动器下载超 5000 万次；公司停电，程序员去网吧写代码 | EA周报...

抖音登陆统信UOS应用商店；特斯拉汽车有望能运行Steam游戏；微信试行1065工作制，晚18点强制下班 | EA周报...

CAD打印：CAD软件中如何批量打印CAD图纸？

高考英语真题网络计算机话题,历年高考英语真题听力

百度分享链接批量转存到百度网盘

Python3:批量读取excel百度分享链接保存到百度网盘

微软Office 2019 批量授权版

没有在计算机上发现office批量许可证,Microsoft Office无法找到此应用程序的许可证...

微软office365服务器地址,由世纪互联运营的 Office 365 的 URL 和 IP 地址范围

Bilidown：一键下载B站视频的神器，高清、批量、开源免费

bilibili视频格式m4s批量转换为mp3,mp4

【批量下载MP3文件】

发表评论

推荐文章

机器学习和深度学习资源汇总（陆续更新）

值得关注的开源软件推荐

【研究】国内外大模型公司进展

电脑开机后过一会就关机自动重启

苹果手机删除的照片怎么恢复？学会这3个宝藏方法

热门文章

谷歌浏览器（Chrome）：前进后退&amp;清除缓存_掌握这几个浏览器快捷键，提高五倍工作效率。

【开发调试】谷歌浏览器中调试移动网页和测试网速下页面效果

解决mac上Xmind8编辑卡顿的问题

技术人生-电脑突然卡顿怎么办

Windows修改编码方式 win10

Python 程序实现电脑自动定时关机

word恢复默认样式

TIDB - 使用BR工具进行数据热备份与恢复

嵌入式面试英文自我介绍参考（万字长文）

OpenAI前研究科学家开源面向未来的提示工程库 ell，重新定义提示工程

最新文章

Linux常用命令总结

Linux命令大全（非常详细）零基础入门到精通，收藏这一篇就够了

Linux常见指令以及权限理解(上)

锐捷NBR系列路由器存在管理员密码重置漏洞

怎么给文件夹设置密码？文件夹设置密码怎么操作？

Linux：20个linux常用命令

Linux常用命令，Linux常用基本命令大全

Linux常用命令大全 零基础入门到精通，收藏这一篇就够了！

修改路由器管理员密码

常见路由器初始密码合集

Linux常用命令大全——赶紧收藏

玩转linux 这些命令就够了

Linux 常用命令最全总结大全【推荐收藏】

php怎么黑admin管理员密码是什么,千兆路由器管理员密码是什么？

BitComet（比特彗星） BT磁力链下载推荐

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

Swift 周报第十三期

谷歌浏览器（Chrome）：前进后退&清除缓存_掌握这几个浏览器快捷键，提高五倍工作效率。

Linux常用命令大全零基础入门到精通，收藏这一篇就够了！

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载