HDFS回收站、Trash机制、Trash Checkpoint、快照功能使用、通过Snapshot快照恢复数据、备份数据、HDFS快照的实现|电子爱好者

admin管理员组
文章数量:1652105

HDFS回收站、Trash机制、Trash Checkpoint、快照功能使用

1、回收站

回收站的功能给了我们一剂“后悔药”。回收站保存了删除的文件、文件夹、图片、快捷方式等。这些项目将一直保留在回收站中，直到您清空回收站。我们许多误删除的文件就是从它里面找到的。

HDFS本身也是一个文件系统，那么就会涉及到文件数据的删除操作。默认情况下，HDFS中是没有回收站垃圾桶概念的，删除操作的数据将会被直接删除，没有后悔药。

1.1 功能概述

Trash机制，叫做回收站或者垃圾桶。Trash就像Windows操作系统中的回收站一样。它的目的是防止你无意中删除某些东西。默认情况下是不开启的。

启用Trash功能后，从HDFS中删除某些内容时，文件或目录不会立即被清除，它们将被移动到回收站Current目录中(/user/${username}/.Trash/current)。

.Trash中的文件在用户可配置的时间延迟后被永久删除。也可以简单地将回收站里的文件移动到.Trash目录之外的位置来恢复回收站中的文件和目录。

1.1.1 Trash Checkpoint

检查点仅仅是用户回收站下的一个目录，用于存储在创建检查点之前删除的所有文件或目录。如果你想查看回收站目录，可以在/user/${username}/.Trash/{timestamp_of_checkpoint_creation}处看到:

最近删除的文件被移动到回收站Current目录，并且在可配置的时间间隔内，HDFS会为在Current回收站目录下的文件创建检查点/user/${username}/.Trash/<日期>，并在过期时删除旧的检查点。

1.2 功能开启

1.2.1 关闭HDFS集群

在节点上，执行一键关闭HDFS集群命令：stop-dfs.sh。

1.2.2 修改core-site.xml文件

在节点上修改core-site.xml文件，添加下面两个属性：

vim /export/server/hadoop-3.1.4/etc/hadoop/core-site.xml

<property>  
    <name>fs.trash.interval</name>  
    <value>1440</value>  
</property>  
<property>  
    <name>fs.trash.checkpoint.interval</name>  
    <value>0</value>  
</property>

fs.trash.interval：分钟数，当超过这个分钟数后检查点会被删除。如果为零，Trash回收站功能将被禁用。

fs.trash.checkpoint.interval：检查点创建的时间间隔(单位为分钟)。其值应该小于或等于fs.trash.interval。如果为零，则将该值设置为fs.trash.interval的值。每次运行检查点时，它都会从当前版本中创建一个新的检查点，并删除在数分钟之前创建的检查点。

1.2.3 启动HDFS集群

在节点上，执行一键启动HDFS集群命令：start-dfs.sh。

1.3 功能使用

1.3.1 删除文件到Trash

开启Trash功能后，正常执行删除操作，文件实际并不会被直接删除，而是被移动到了垃圾回收站。

当然也可以去Trash回收站下面查看一下：

1.3.2 删除文件跳过Trash

有的时候，我们希望直接把文件删除，不需要再经过Trash回收站了，可以在执行删除操作的时候添加一个参数：

-skipTrash
hadoop fs -rm -skipTrash /smallfile1/3.txt

1.3.3 从Trash中恢复文件

回收站里面的文件，在到期被自动删除之前，都可以通过命令恢复出来。使用mv、cp命令把数据文件从Trash目录下复制移动出来就可以了。

hadoop fs -mv /user/root/.Trash/Current/smallfile1/* /smallfile1/

1.3.4 清空Trash

除了fs.trash.interval参数控制到期自动删除之外，用户还可以通过命令手动清空回收站，释放HDFS磁盘存储空间。

首先想到的是删除整个回收站目录，将会清空回收站,这是一个选择。此外。HDFS提供了一个命令行工具来完成这个工作：

hadoop fs -expunge

该命令立即从文件系统中删除过期的检查点。

2. Snapshot快照

2.1 快照介绍和作用

HDFS snapshot是HDFS整个文件系统，或者某个目录在某个时刻的镜像。该镜像并不会随着源目录的改变而进行动态的更新。可以将快照理解为拍照片时的那一瞬间的投影，过了那个时间之后，又会有新的一个投影。

HDFS快照的核心功能包括：数据恢复、数据备份、数据测试。

2.1.1 数据恢复

可以通过滚动的方式来对重要的目录进行创建snapshot的操作，这样在系统中就存在针对某个目录的多个快照版本。当用户误删除掉某个文件时，可以通过最新的snapshot来进行相关的恢复操作。

2.1.2 数据备份

可以使用snapshot来进行整个集群，或者某些目录、文件的备份。管理员以某个时刻的snapshot作为备份的起始结点，然后通过比较不同备份之间差异性，来进行增量备份。

2.1.3 数据测试

在某些重要数据上进行测试或者实验，可能会直接将原始的数据破坏掉。可以临时的为用户针对要操作的数据来创建一个snapshot，然后让用户在对应的snapshot上进行相关的实验和测试，从而避免对原始数据的破坏。

2.2 HDFS快照的实现

在了解HDFS快照功能如何实现之前，首先有一个根本的原则需要记住：快照不是数据的简单拷贝，快照只做差异的记录。这一原则在其他很多系统的快照概念中都是适用的，比如磁盘快照，也是不保存真实数据的。因为不保存实际的数据，所以快照的生成往往非常迅速。

在HDFS中，如果在其中一个目录比如/A下创建一个快照，则快照文件中将会存在与/A目录下完全一致的子目录文件结构以及相应的属性信息，通过命令也能看到快照里面具体的文件内容。但是这并不意味着快照已经对此数据进行完全的拷贝。这里遵循一个原则：对于大多不变的数据，你所看到的数据其实是当前物理路径所指的内容，而发生变更的inode数据才会被快照额外拷贝，也就是所说的差异拷贝。

inode译成中文就是索引节点，它用来存放文件及目录的基本信息，包含时间、名称、拥有者、所在组等信息。

HDFS快照不会复制datanode中的块，只记录了块列表和文件大小。

HDFS快照不会对常规HDFS操作产生不利影响，修改记录按逆时针顺序进行，因此可以直接访问当前数据。通过从当前数据中减去修改来计算快照数据。

2.3 快照的命令

2.3.1 快照功能启停命令

HDFS中可以针对整个文件系统或者文件系统中某个目录创建快照，但是创建快照的前提是相应的目录开启快照的功能。

如果针对没有启动快照功能的目录创建快照则会报错。

启用快照功能：

hdfs dfsadmin -allowSnapshot /allenwoon

禁用快照功能：

hdfs dfsadmin -disallowSnapshot /allenwoon

2.3.2 快照操作相关命令

[root@node1 ~]# hdfs dfs
Usage: hadoop fs [generic options]
        [-createSnapshot <snapshotDir> [<snapshotName>]]
        [-deleteSnapshot <snapshotDir> <snapshotName>]
        [-renameSnapshot <snapshotDir> <oldName> <newName>]

[root@node1 ~]# hdfs lsSnapshottableDir
[root@node1 ~]# hdfs snapshotDiff <path> <fromSnapshot> <toSnapshot>

快照相关的操作命令有：createSnapshot创建快照、deleteSnapshot删除快照、renameSnapshot重命名快照、lsSnapshottableDir列出可以快照目录列表、snapshotDiff获取快照差异报告。

本文标签：快照数据回收站备份机制

版权声明：本文标题：HDFS回收站、Trash机制、Trash Checkpoint、快照功能使用、通过Snapshot快照恢复数据、备份数据、HDFS快照的实现内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1729573268a1207032.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

HDFS回收站、Trash机制、Trash Checkpoint、快照功能使用、通过Snapshot快照恢复数据、备份数据、HDFS快照的实现

HDFS回收站、Trash机制、Trash Checkpoint、快照功能使用

1、回收站

1.1 功能概述

1.1.1 Trash Checkpoint

1.2 功能开启

1.2.1 关闭HDFS集群

1.2.2 修改core-site.xml文件

1.2.3 启动HDFS集群

1.3 功能使用

1.3.1 删除文件到Trash

1.3.2 删除文件跳过Trash

1.3.3 从Trash中恢复文件

1.3.4 清空Trash

2. Snapshot快照

2.1 快照介绍和作用

2.1.1 数据恢复

2.1.2 数据备份

2.1.3 数据测试

2.2 HDFS快照的实现

2.3 快照的命令

2.3.1 快照功能启停命令

2.3.2 快照操作相关命令

更多相关文章

电脑回收站清空后恢复教程

回收站清空了怎么恢复？6个方法将丢失文件统统找回！

误清空回收站怎么办

回收站清空文件恢复？恢复文件，就看这4种方法！

土豆视频服务器丢失了怎么找回,电脑里视频丢失误删了怎么恢复？回收站被清空后还能找回吗? 万兴恢复专家教程...

清空了回收站的文件还能找回吗

成功解决win10电脑桌面回收站图标变成白板

处理回收站“属性”不可用，没有“清空回收站”功能

回收站清空的文件也可以找回吗？这是什么技术

如何找回回收站被清空的文件？详细步骤来了

为什么清空了回收站，黑客还是能找到小视频？

误删代码，回收站又被清空还没有备份教你如何解决

linux系统还原回收站,Trash-Cli：让你的Linux系统也有回收站

回收站恢复软件分享，这7款值得一试！

Linux 下回收站机制

清空的回收站文件如何还原？这个方法超实用

误删的文件怎么恢复（在已经清空回收站的情况下）

电脑桌面上没有计算机回收站,电脑桌面没有回收站,怎么处理

用命令行下载百度网盘数据的方法

COCO2014训练数据集！！！百度网盘！！！

发表评论

推荐文章

解决Git出现Your account has been blocked报错

设置控制面板下拉菜单样式或面板样式

excel表格加密：电脑文件加密的5个方法介绍【新手篇】

python之酷狗音乐飙升榜歌曲下载

加密算法

热门文章

OPPO Enco X无线降噪耳机体验评测，加钱变强！

Android HAL层浅析

C#【必备技能篇】使用批处理脚本（.bat文件）打开控制台应用程序

页面头部head标签加上对应的标签让360浏览器选择相应的内核

计算机文件恢复快捷键,文件变成快捷方式怎么恢复

License server system does not support this version of this feature

u盘删除的文件怎么找回？3个策略，恢复数据乐开颜

win10完美还原桌面图标快捷方式小箭头的方法

python爬虫实战之逆向分析酷狗音乐

Red Hat 6.x 搭建 Gitlab10.1.14 （1）

最新文章

Mac下的几个免费杀毒软件

如何在Linux系统中有效杀毒

关于我对杀毒软件的个人见解（六）

计算机无效d盘的错误怎么解决,D盘怎么打不开

天逸510pro 安装win7后USB无法使用的解决方案-实战补充说明

服务器是否需要安装杀毒软件

推荐6款优秀的海外免费杀毒软件 附下载链接

2024年最新Linux下Clamav 杀毒软件安装使用文档，2024年最新大牛最佳总结

win装机失败的一次记录

matlab中xpcapi库的调用,关于MATLAB中xpc实时控制平台搭建的心得

2024好用免费的mac苹果电脑杀毒软件CleanMyMac

七大免费杀毒软件

6 款最佳 Linux 系统防病毒软件！

免费杀毒软件真的能杀木马吗?

黑苹果 【 I7 8700K z370 1060 和I7 7700K z270 集显 的安装记录】

小米手机肿么还原时钟

推荐6款优秀的海外免费杀毒软件附下载链接

黑苹果【 I7 8700K z370 1060 和I7 7700K z270 集显的安装记录】

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载