admin管理员组

文章数量:1532074

2024年6月28日发(作者:)

大数据技术Hadoop面试题,看看你能答对多少?

(3)

de负责管理metadata,client端每次读写请求,它

都会从磁盘中读取或则会写入metadata信息并反馈client端。(错

误)

此题分析:

NameNode不需要从磁盘读取metadata,所有数据都在内存中,

硬盘上的只是序列化的结果,只有每次namenode启动的时候才会读

取。

1)文件写入

Client向NameNode发起文件写入的请求。

NameNode根据文件大小和文件块配置情况,返回给Client它所

管理部分DataNode的信息。

Client将文件划分为多个Block,根据DataNode的地址信息,

按顺序写入到每一个DataNode块中。

2)文件读取

Client向NameNode发起文件读取的请求。

de本地磁盘保存了Block的位置信息。(个人认为正

确,欢迎提出其它意见)

分析:DataNode是文件存储的基本单元,它将Block存储在本

地文件系统中,保存了Block的Meta-data,同时周期性地将所有

存在的Block信息发送给NameNode。NameNode返回文件存储的

DataNode的信息。

Client读取文件信息。

de通过长连接与NameNode保持通信。()

这个有分歧:具体正在找这方面的有利资料。下面提供资料可参

考。

首先明确一下概念:

(1).长连接

Client方与Server方先建立通讯连接,连接建立后不断开,然

后再进行报文发送和接收。这种方式下由于通讯连接一直存在,此

种方式常用于点对点通讯。

(2).短连接

Client方与Server每进行一次报文收发交易时才进行通讯连接,

交易完毕后立即断开连接。此种方式常用于一点对多点通讯,比如

多个Client连接一个Server.

自身具有严格的权限管理和安全措施保障集群正常运

行。(错误)

hadoop只能阻止好人犯错,但是不能阻止坏人干坏事

节点要存储数据,所以它的磁盘越大越好。(错误)

分析:一旦Slave节点宕机,数据恢复是一个难题

dfsadmin–report命令用于检测HDFS损坏块。(错误)

默认调度器策略为FIFO(正确)

27.集群内每个节点都应该配RAID,这样避免单磁盘损坏,影响

整个节点运行。(错误)

分析:首先明白什么是RAID,可以参考百科磁盘阵列。这句话

错误的地方在于太绝对,具体情况具体分析。题目不是重点,知识

才是最重要的。因为hadoop本身就具有冗余能力,所以如果不是很

严格不需要都配备RAID。具体参考第二题。

本文标签: 文件信息读取连接进行