python如何批量下载大文件（支持断点续传）|电子爱好者

admin管理员组
文章数量:1606473

1.python下载大文件（支持断点续传）

网上的很多爬取图片的程序，基本使用scrapy框架中的img管道进行加速下载，但是当要下载的文件太大的时候，scrapy框架中的文件下载管道也无能为力的时候，也确实听让人无奈，于是我写下了如下代码，其功能如下：

1.读取本地 ./english.txt 文件中的下载链接
2.for循环调用 download 函数分别下载各个下载链接
3.保存到本地（支持断点续传）

以下就是全部的代码，如果大家用得到就可以点赞支持一下。

# -*- coding:utf-8 -*-

'''

@项目名称:保密

@作者:kingback

@文件名称:Continue_big_files_download.py

@IDE:PyCharm

@文件创建时间:2021-04-16 14:45：20

@月份:4月


'''

import sys
import requests
import os

# 屏蔽warning信息
requests.packages.urllib3.disable_warnings()

def download(url):
    name = url.split('/')[-1]
    print("当前正在下载文件：",name)
    dir = "你的文件存储路径"		#此处的路径需要改成自己的路径
    filename=dir+name
    # 第一次请求是为了得到文件总大小
    r1 = requests.get(url, stream=True, verify=False)
    total_size = int(r1.headers['Content-Length'])
    # 这重要了，先看看本地文件下载了多少
    if os.path.exists(filename):
        temp_size = os.path.getsize(filename)  # 本地已经下载的文件大小
    else:
        temp_size = 0
    '''
    是否续传？
    '''
    if(temp_size==total_size):
        print("该文件已经下载过了！")
    else:
        # 显示一下已经下载了多少
        print("续传文件大小：%s,文件总大小：%s" % (temp_size, total_size))
        # 核心部分，这个是请求下载时，从本地文件已经下载过的后面下载
        headers = {'Range': 'bytes=%d-' % temp_size}
        # 重新请求网址，加入新的请求头的
        r = requests.get(url, stream=True, verify=False, headers=headers)

        # 下面写入文件也要注意，看到"ab"了吗？
        # "ab"表示追加形式写入文件
        with open(filename, "ab") as f:
            for chunk in r.iter_content(chunk_size=1024):
                if chunk:
                    temp_size += len(chunk)
                    f.write(chunk)
                    f.flush()

                    ###这是下载实现进度显示####
                    done = int(50 * temp_size / total_size)
                    sys.stdout.write("    《-----------下载进度：")

                    sys.stdout.write("\r[%s%s] %d%%" % ('█' * done, ' ' * (50 - done), 100 * temp_size / total_size))
                    sys.stdout.flush()
    print()  # 避免上面\r 回车符


if __name__ == '__main__':

    txt_path = "./english.txt"			#此处填写你的下载链接所在的txt路径
    # 读取所有url
    with open(txt_path, "r") as f:
        data = f.read()
    datas = data.split("\n")			#转成list,便于读取

    # 去重，去掉list列表中重复的内容
    datas = list(set(datas))
    #初始化输出，告诉使用者需要下载多少文件
    print("\n","*"*30,"总共需要下载文件：%s个"%len(datas),"*"*30,"\n")
    # 开始下载文件
    for file in datas:
        download(file)

2.使用截图

使用很方便哦~

本文标签：批量断点续传大文件 Python

版权声明：本文标题：python如何批量下载大文件（支持断点续传）内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1728501036a1161172.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

batchplot插件用法_Batchplot设置使用指南，实现批量打印CAD图纸

12小时前

Batchplot设置使用指南，实现批量打印CAD图纸 2019-12-19 已有人学习| 编辑：machine; 来源：知识屋; CAD图纸设计完成需要打印保存&#

5、【办公自动化】Python实现PDF转Word

8小时前

这周 HR 小姐姐让我提供一份可编辑的简历，于是，我找了半天发现只留存了 PDF 格式的简历，这显然不符合小姐姐的要求。为了省事，我从网上顺手下了一

基于pdf2docx模块Python实现批量将PDF转Word文档（安装+完整代码教程）

8小时前

PDF文件是一种常见的文档格式，但是在编辑和修改时不太方便，因为PDF本质上是一种静态的文档格式。因此，有时候我们需要将PDF文件转换成Word格式，以

pdf2docx：Python实现PDF转Word

8小时前

本文简介作者写的一个PDF转Word的Python库pdf2docx，包括基本思路、功能、使用方法及样例。2023-12-29 更新： 今天正式把 pdf2docx 仓库的所有版权通过技术转让

python --PDF转Word

8小时前

在当今信息时代，PDF和Word文档是工作中常用的文档格式。转换PDF为Word可以帮助我们更灵活地编辑和分享文档内容。在本文中，我们将探讨使用Python实现将PDF文件转换为Word文档的四种

Pdf转Word用Python轻松搞定！

8小时前

大家在日常的工作学习过程中，都会遇到一个问题就是将pdf中的文本内容转化为word的形式，也就是从只读变成可读写的形式。面对这种情况，大家大都采用网上的工具&#xff

一分钟玩转RPA——word批量转pdf

7小时前

大家好，我是无用兄，批量word转pdf文件我们在工作中有时会经常遇到，网上也有很多工具，有收费的也有免费的，今天我们主要介绍下如

如何用python把pdf转为word_Python-PDF转为Word

7小时前

手把手 | 20行Python代码教你批量将PDF转为Word 作者｜丁彦军给各位带来了一个免费简单快速的方法，手把手教你用Python批量处理PDF格式文件，获取自己想要的内容，存为word形式。在实现PDF转Word功能之前，我们需

基于Python+Django框架word和pdf文档格式转换系统设计与实现

7小时前

博主介绍：黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者，CSDN博客专家，在线教育专家，CSDN钻石讲师&#xff

4、【办公自动化】Python实现Word转PDF

7小时前

在日常办公过程中，总是离不开和文档打交道，有一个最常用的场景就是把 Word 文档转成 PDF 格式。PDF 文档的优势在于：在不同编辑器或不同设备上，

python扩展库用于科学计算的有哪些_数据科学必备的十大 Python 库

4小时前

Python 已成为当今使用最广泛的编程语言之一，尤其是在数据科学领域。 Python 是一种高性能的语言，易于学习和调试，并且具有广泛的库支持。这些库都有自己独特的功能&

盘点2017年最受欢迎的十大机器学习Python库

4小时前

选自tryolabs 机器之心编译参与：蒋思源、黄小天、刘晓坤 2017 年即将结束，又到了总结的时刻。本文作者把范围限定为机器学习，盘点了 2017 年以来最受欢迎的十大

Python代码大全，海量代码任你下载

3小时前

注：所有源代码均实测运行过。所有源代码均已上传CSDN，请有需要的朋友自行下载。代码大全持续更新，敬请收藏！ 毕业设计类 Python版自动组卷评卷

[网络克隆]利用tiny proxy实现局域网内批量安装WINDOWS操作系统。

2小时前

说明：本文支持UEFI及BIOS系统克隆。支持UEFI及BIOS网络引导，适用于新旧几乎所有支持网络启动的电脑。事前准备：保证被克隆的电脑为同一配置，或者各硬件差异不大，比如CPU同如英特尔8代的，I5和I7，也是可以正常同传的。若被克

爬取微博视频页并批量下载python+requests+ffmpeg(连接视频和音频)

2小时前

爬取微博视频页并批量下载可用于任何一个微博用户的视频页中所有视频的下载这里批量下载的视频量加多，故使用了多线程下载(少量视频的话看心情用不用线程下载) 注：并不是使用多线程就一定会快很多&a

蓝奏云外链批量下载软件

2小时前

软件介绍： 蓝奏云外链批量下载软件是一款功能强大的外链解析下载工具，能够帮助用户轻松下载各种蓝奏云文件，为文件的下载提供了便利；软件提供了各种方便快捷

java 批量下载图片并打包成zip压缩包

2小时前

项目需求： 对接第三方接口时，因为数据中存储的是图片链接，第三方审核时需要把所有图片以zip压缩包的方式传入到他们ftp服务中。提示：以下是本篇文章

气象大数据平台（天擎）数据读取方法（python）（雷达数据下载）

2小时前

一、下载雷达资料天擎中地面数据下载https:blog.csdnhq19940416articledetails124493688?spm1001.2014.3001.5502雷达下载方法与地面数据下载类似&#xff

python实现下载压缩包并且解压

2小时前

from keras.utils.data_utils import get_fileimport zipfileimport os# 下载代码filedata.zipdirdata1homeqljcodepytorch

python自动下载高品质无损歌曲

2小时前

不知道大家有没有这样的感觉，听到一些好听的歌曲，总是想要把歌曲下载到自己电脑或手机上才感觉到踏实，尤其是在早些年智能手机还没这么普及的时候，喜欢的歌曲不在自己电脑上就会没有安全感。虽然现在听歌基本都是在线听，下载歌曲到本地的

电子爱好者 - 最新技术资讯及电子产品介绍！

python如何批量下载大文件（支持断点续传）

1.python下载大文件（支持断点续传）

2.使用截图

更多相关文章

batchplot插件用法_Batchplot设置使用指南，实现批量打印CAD图纸

5、【办公自动化】Python实现PDF转Word

基于pdf2docx模块Python实现批量将PDF转Word文档（安装+完整代码教程）

pdf2docx：Python实现PDF转Word

python --PDF转Word

Pdf转Word用Python轻松搞定！

一分钟玩转RPA——word批量转pdf

如何用python把pdf转为word_Python-PDF转为Word

基于Python+Django框架word和pdf文档格式转换系统设计与实现

4、【办公自动化】Python实现Word转PDF

python扩展库用于科学计算的有哪些_数据科学必备的十大 Python 库

盘点2017年最受欢迎的十大机器学习Python库

Python代码大全，海量代码任你下载

[网络克隆]利用tiny proxy实现局域网内批量安装WINDOWS操作系统。

爬取微博视频页并批量下载python+requests+ffmpeg(连接视频和音频)

蓝奏云外链批量下载软件

java 批量下载图片并打包成zip压缩包

气象大数据平台（天擎）数据读取方法（python）（雷达数据下载）

python实现下载压缩包并且解压

python自动下载高品质无损歌曲

发表评论

推荐文章

浩海技术GHOSTXPSP3_2010浪漫圣诞纯净版

笔记本电脑怎么连接无线网wifi？笔记本电脑联网方法（详解）

linux学习笔记（一）

Google Play Instant Unity 插件指南

Express连接本地Mysql失败

热门文章

【权限提升】WIN本地用户&amp;BypassUAC&amp;DLL劫持&amp;引号路径&amp;服务权限

显示器html看电视声音,电脑连接HDMI显示器后没声音(无需外置转换线)的解决方法...

电脑蓝屏，无限重启修复

第 四 周 write up （BJDCTF-2020-Web-Cookie is so subtle! Bugku 蹭网先解开密码 [网鼎杯 2020 青龙组]AreUSerialz nmap）

windows 环境下，编译android 版opencv-4.5.5，并添加opencv_contrib-4.5.5 扩展模块

vmware下载

google play应用使用自己的签名（appSigning）

使用简短代码便可实现word批量转pdf

EXCEL：如何批量创建工作表

计算机禁用打印驱动服务器,设备: 防止用户安装打印机驱动程序

最新文章

虚拟机android原生系统下载地址,Android x86开源项目最新版虚拟机镜像下载VMVbox...

Android中 Download Manager系统下载管理器在Android 10系统中无法使用的情况

android 8原生系统下载地址,android8.0下载地址 android8.0系统下载网址

小米刷原生android系统下载地址,小米6刷原生安卓8.0下载|小米6刷原生安卓p 免费版_附教程_最火软件站...

U盘删除的文件能恢复吗，删除文件怎么恢复

android原生系统怎么下载地址,安卓全机型原生官方ROM下载地址

EMUI10android系统下载,华为EMUI11系统正式版安装包

安卓Android类原生系统官网集合

u盘文件删除如何恢复呢?

offic安装教程

android x86 32位64位系统,安卓x86 6.0 rc2下载

pc android系统下载,在PC上运行Android-x86 9.0-r1进行下载

android系统最新版本更新,安卓8.0系统最新下载安装

安卓最新系统如何下载安装

U盘文件删除如何恢复？U盘里的东西删除怎么还原？

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

【权限提升】WIN本地用户&BypassUAC&DLL劫持&引号路径&服务权限

第四周 write up （BJDCTF-2020-Web-Cookie is so subtle! Bugku 蹭网先解开密码 [网鼎杯 2020 青龙组]AreUSerialz nmap）

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载