程序员的超大文件下载方法|电子爱好者

admin管理员组
文章数量:1606317

场景

超大文件现在还是蛮常用的，尤其使用第三方数据库(集)资料时，都需要先进行下载。这不一个朋友就遇到了这个需求：

100多个G，先不说电脑内存，就是硬盘一般人的办公电脑估计都得腾点空间出来，更别提下载了。即使能达到网速1M/s且保持不便，那也得30个小时吧，但是现实是几乎不太现实，因为网速很不稳定，如果网断了，没办法续传，需要重头开始下载，这就很难搞。so针对这种方式该怎么下载呢？

迅雷什么的是否可以下载我倒没有尝试？不过看到过一个下载工具internetdownloadmanager(30天免费), 有兴趣的可以尝试下。这些工具先不说好不好用，绝大多数都需要VIP，甚至区分白金，黄金，钻石，星耀，王者，简直恶心死人。对于程序员，绝对不能惯着这些臭毛病，

思路：将大文件拆分成多个小文件单独下载，如果允许，你也可以多线程下载；下载完毕后，再将小文件们拼接在一起即可。

工具：Linux环境，curl, cat

难度：对于程序员，几乎没有；对于非程序员，windows上安装curl工具比较靠谱点，也可以安装一个WSL子系统

操作步骤

1. 指定文件大小，逐个下载

比如我想下载那个100G的文件，准备拆分成100个文件，每个文件1G，然后使用curl工具分别下载，通过range指定下载文件的开始和结束位置：

curl --range 0-1024000000 -o test.part1 https://kero.hgc.jp/cgi-bin/download/long_read/adenocarcinoma_cell_lines/genome/promethion/LC2ad/PromethION_LC2ad_30x.sorted.bam

curl --range 1024000001-2048000000 -o test.part2 https://kero.hgc.jp/cgi-bin/download/long_read/adenocarcinoma_cell_lines/genome/promethion/LC2ad/PromethION_LC2ad_30x.sorted.bam

curl --range 2048000001-4096000000 -o test.part3 https://kero.hgc.jp/cgi-bin/download/long_read/adenocarcinoma_cell_lines/genome/promethion/LC2ad/PromethION_LC2ad_30x.sorted.bam

... ...

1G = 1024 x 1024 x 1024 字节。上面由于不想计算，so直接用0代替了，因此下载文件时单个文件不够1G

2. 文件拼接

文件拼接直接通过cat工具即可。他们会自己按照序号顺序进行拼接

 cat test.part? > aaa.bam

3. 验证文件完整性

很多正经的官网，提供系统镜像时会提供MD5，SHA完整性校验值，因此可以对拼接后的文件计算MD5值；如果一样，说明文件下载没有问题；如果不一样，说明文件下载有问题。

当然，如果没有提供相应的校验，那就不用验证了，直接看看下载的文件能否使用就知道了。因为如果文件有损坏，正常情况下是无法打开的。

4. 问题定位

我当时使用几个24M的小文件进行测试(分了3个文件下载)，拼接后发现MD5不一样，于是乎我使用BeyondCompare工具把文件的二进制进行了比较：
比较后发现多了两个字节，后来发现是我range范围写重复导致的。重新修改了范围后，重新下载拼接发现是可行的。

后续

感觉可以去写一个下载工具了，支持并发下载大文件，哈哈哈

本文标签：程序员下载方法文件

版权声明：本文标题：程序员的超大文件下载方法内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1728497217a1160851.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

程序员的超大文件下载方法

场景

操作步骤

1. 指定文件大小，逐个下载

2. 文件拼接

3. 验证文件完整性

4. 问题定位

后续

更多相关文章

2024年给正在创作的程序员的实用工具_阿虚的笔记方案(上)

java程序员必备软件

Python PDF文件转Word格式，只需要3秒(附打包)

PDF文件免费转换为word文件（完美解决）

java实现图片、word、pdf等多文件融合到一个pdf（word转pdf）

python获取网页链接并下载,python通过链接下载文件

手机端 Android WebView 获取 blob 链接文件名并下载网页动态生成的 pdf 文件且调用外部程序打开

使用python将oss文件下载本地

html 下载超链接文件,不让其直接打开？

MAC实用SSH连接远程服务器，并实现文件上传下载

使用 Xshell7 从远程服务器下载文件的流程【图示】

Mac 基于HTTP方式访问下载共享文件

【GitHub】GitHub文件无法下载、无法访问网站

如何从网页上下载页面嵌入的PDF文件

关于Visual Studio 2017安装时VS installer无法下载文件，进度条为0，显示网络有问题的解决办法

IDM下载Google Drive文件

远程下载上传 服务器文件到本地

DAO层使用Mybatis-generator生成映射文件连接Mysql入门测试用例（无限速源码下载），单条增删改查CRUD（一）

html页面实现点击下载文件(js)

利用python实现自动下载sftp文件

发表评论

推荐文章

java使用Toolkit.getDefaultToolkit().beep();电脑没有声音的解决方案

Botnet趋势漏洞利用状况分析

ubuntu 软件指南

Ubuntu 系统中安装软件 -- apt命令

【正点原子Linux连载】第三章 初识Qt摘自【正点原子】I.MX6U嵌入式Qt开发指南V1.0.2

热门文章

nacos启动失败，Nacos Server did not start because dumpservice bean construction failure : No DataSource s

红米手机3S 3X获取ROOT权限的经验

Linux下的杀毒软件

python苹果手机照片导入电脑_拯救你的16GB iPhone利用Seafile创建私有云将照片同步到PC上...

电脑使用技巧系列之桌面图标设置、桌面美化、任务栏设置及美化

Springboot计算机毕业设计音乐播放系统mx104

HTML进阶- 4.6 补充一些不常用的元素

Java根据url下载文件到本地

python用pyqt5连接mysql数据库QSqlDatabase最新可用终极解决方法

在linux中下载迅雷链接(thunder:)

最新文章

前端开发工程师选16+512配置的MacBookPro 14够用吗？

群晖备份linux分区,数据丢失的后悔药，群晖NAS备份方案详解

联想小新15计算机在哪里,买定离手 后悔没处走？—联想小新15 2020 极简测试

Linux怎么把硬盘ex2改为ex4,linux磁盘管理和文件系统创建

MacbookPro 15硬盘升级踩坑记

硬盘7200mysql_新服务器中7200转硬盘的IO是瓶颈

硬盘如何1G如何变120G？

学计算机买电脑看什么,学长学姐很后悔，当初买电脑时就该看看这篇攻略！

笔记本光驱位安装固态硬盘及window系统一些过程记录

记一次折腾可移动式Ubuntu 20.04 安装在折腾折腾系列的WD p50上（即移动式挂在nvme协议下的移动固态硬盘以uefi模式启动的Ubuntu20.04 （to go））

固态硬盘现在已经不贵了，有没有必要放弃128GB直接买2TB的？

计算机不支持1T的硬盘,现在竟然还有这样的奸商，修电脑还跟客户换硬件，大家要当心啊！...

计算机管理磁盘怎么这么多,电脑的硬盘究竟要如何分区？分错区很麻烦，后悔没有早点知道！...

解压到计算机硬盘,电脑硬盘是新买的，重装系统解压总失败，问题到底出现在哪？...

笔记本电脑升级固态硬盘好吗_如何升级笔记本电脑硬盘

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

远程下载上传服务器文件到本地

【正点原子Linux连载】第三章初识Qt摘自【正点原子】I.MX6U嵌入式Qt开发指南V1.0.2

联想小新15计算机在哪里,买定离手后悔没处走？—联想小新15 2020 极简测试

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载