Hadoop 系列（一）伪分布式模式搭建|电子爱好者

admin管理员组
文章数量:1530018

修改主机名和用户名（root用户执行）

配置静态IP地址（root用户执行）

关闭防火墙（root用户执行）

SSH免密登录（hadoop执行）

安装JDK（root用户执行）

安装Hadoop（root用户执行）

启动Hadoop（hadoop用户执行）

使用WinSCP连通本机（Windows）和Linux

修改主机名和用户名（root用户执行）

1）使用su root命令切换至root用户，回车后输入设置的密码（可能为123456）；切换成功后，使用

useradd hadoop

命令创建一个名为hadoop的用户；然后使用

passwd hadoop

命令设置hadoop用户的密码，输入完成后需要再确认输入一遍（建议使用123456，方便记忆）。

2）使用

vi /etc/sysconfig/network

命令编辑该文件，修改为下图右侧所示效果。其中HOSTNAME可以随意设置，不一定与图中一致。

3）使用

vi /etc/hosts

命令编辑该文件，修改为下图右侧所示效果。其中前面的IP地址设置需根据自己电脑的配置信息填写。后面的主机名为上一步设置的HOSTNAME。IP地址与主机名中间有空格。

4）IP地址获取位置如下图所示，点击VMware的编辑菜单，选择下拉框中的虚拟网络编辑器

5）弹出如下所示页面，选择类型为NAT模式，可以看到子网IP和子网掩码。点开NAT设置和DHCP设置，了解详细内容。IP地址与子网IP前3位需一致，即192.168.192.XXX。

配置静态IP地址（root用户执行）

1）使用

vi /etc/sysconfig/network-scripts/ifcfg-eth0

命令编辑该文件。修改为下方中间图所示效果。主要是修改 BOOTPROTO 和红框圈中的部分：BOOTPROTO 要修改为 static，否则无法连通 IP；IPADDR 的值与上一步设置的 IP 地址一致；NETMASK 的值是上一张图片中显示的子网掩码；GATEWAY 的值是上一张图片点开 NAT 设置后显示的网关 IP，如下方底部图所示；DNS1 的值可以使用 8.8.8.8。

关闭防火墙（root用户执行）

1）使用

service iptables status

命令查看防火墙状态，如果出现如图所示效果，则说明防火墙是开启状态。

2）使用

service iptables stop

命令关闭防火墙，效果如图所示。

3）但这不意味着永久关闭了，还有可能开机启动，故需要使用

chkconfig iptables --list

命令查看防火墙开机启动状态，如果出现如图所示效果，则说明防火墙开机时是开启状态。

4）使用

chkconfig iptables off

命令关闭防火墙开机启动，如果出现如图所示效果，则说明防火墙开机不会启动。

SSH免密登录（hadoop执行）

1）使用

su hadoop

命令切换用户为 hadoop，为了避免原有配置干扰新配置，首先查看 ~/.ssh 目录下是否存在文件（可能存在known_hosts文件、不存在任何文件或不存在该文件夹），如果存在文件使用 rm 命令删除该文件夹下的文件，否则使用

ssh-keygen -t rsa

命令生成密钥和公钥，输入命令后一直回车即可。

2）查看 ~/.ssh 文件夹，可以看出生成了 id_rsa（私钥）和 id_rsa.pub（公钥）两个文件，如下图所示。

3）使用

ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@hdp4

命令（和

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

命令的本质一样，即将公钥信息发送给某一台你需要 ssh 的机器）将 id_rsa.pub（公钥）拷贝至要 ssh 的机器，过程需要确定是否继续连接，输入 yes 即可，接着按要求输入要 ssh 机器的密码。

4）使用

ssh hdp4

（要ssh机器的主机名）命令验证是否成功，出现如下图所示页面即为成功，输入 exit 即可退出 ssh 的机器。

安装JDK（root用户执行）

1）使用

mkdir -p /app/java

命令创建文件夹，使用

cd /app/java

命令切换至该目录，使用 ls 命令查看该目录下是否有文件。使用 WinSCP 将 JDK 的 tar 包放入该目录，使用方式参照使用WinSCP连通本机（Windows）和Linux。传输完毕后再使用 ls 命令查看该目录下是否有文件，如果找到 JDK 的 tar 包，使用

tar -zxvf jdk-7u79-linux-x64.tar.gz

（文件名，根据实际情况进行替换）命令解压。

2）解压后会生成对应的文件夹，使用ls命令查看一下，生成了如下图左边蓝色文件夹所示，使用

cd jdk1.7.0_79

（文件夹名，根据实际情况进行替换）命令切换至该目录，使用

pwd

命令获取当前路径，复制该路径。使用

vi /etc/profile

命令编辑文件，输入:$或G将光标置于文件末尾，文件末尾加上两行内容

export JAVA_HOME=/app/java/jdk1.7.0_79
export PATH=$PATH:$JAVA_HOME/bin

写完后输入:wq保存并退出文件编辑，使用

source /etc/profile

命令让新添加的 JAVA_HOME 环境变量生效。

3）使用

java -version

检验是否安装成功，如果成功将出现如下页面。

安装Hadoop（root用户执行）

1）使用

mkdir -p /app/hadoop

命令创建一个存放 Hadoop 的文件夹，使用

cd /app/hadoop

命令切换至该目录，使用

wget http://archive.apache/dist/hadoop/core/hadoop-2.6.5/hadoop-2.6.5.tar.gz

命令或用 WinSCP 将 hadoop2.6.5 放置在该目录。传输完毕后再使用 ls 命令查看该目录下是否有文件，如果找到 Hadoop 的 tar 包，使用

tar -zxvf hadoop-2.6.5.tar.gz

（文件名，根据实际情况进行替换）命令解压。

温馨的小提示：当某台机器上存在 tar，在该机器上使用

scp hadoop-2.6.5.tar.gz root@192.168.192.103:/app/hadoop/

命令可将tar包粘贴至想要发送机器的指定目录下，传输完成效果如下图。

2）解压后会生成对应的文件夹，使用ls命令查看一下，生成了如下图左边蓝色文件夹所示，使用

cd hadoop-2.6.5

（文件夹名，根据实际情况进行替换）命令切换至该目录，使用

pwd

命令获取当前路径，复制该路径。使用

vi /etc/profile

命令编辑文件，如下方顶部图所示。输入:$或G将光标置于文件末尾，文件倒数第二行加上一行内容

export HADOOP_HOME=/app/hadoop/hadoop-2.6.5

，然后修改PATH环境变量为：

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

，如下方中间图所示。写完后在非编辑模式下输入:wq保存并退出文件编辑，使用

source /etc/profile

命令让新添加的 HADOOP_HOME 环境变量生效。如下方底部图所示。

3）使用 ls 命令查看一下该目录结构，如下图。

4）其中 etc/hadoop 的目录下是需要配置的文件，使用

cd etc/hadoop

命令切换至该目录，使用ls命令看一下都有哪些文件，如下方顶部图所示。红框圈中的即为需要修改配置的文件。其中 mapred-site.xml 文件本身不存在，需要使用

mv mapred-site.xml.template mapred-site.xml

命令重命名，如下方底部图所示。

5）按照上图标记的文件，首先修改 hadoop-env.sh，使用

vi hadoop-env.sh

命令查看并编辑该文件，文件初始如下图。

6）修改完 JAVA_HOME，如下图。该路径为真实路径，不一定与下图内容一样。

7）设置完 JAVA_HOME，接着修改 core-site.xml 文件，初始效果如下图。

8）修改后效果如下图。需要添加

<property>
    <name>fs.defaultFS</name>
    <value>hdfs://hdp4:9000</value>
</property>

至两个<configuration></configuration>标签之间。在非编辑状态下，输入wq保存退出

9）修改完 core-site.xml 文件，接下来修改 hdfs-site.xml 文件，初始效果如下图。

10）修改后效果如下图，需要添加

<property>
    <name>dfs.replication</name>
    <value>1</value>
</property>

至两个<configuration></configuration>标签之间。在非编辑状态下，输入wq保存退出。

11）修改完 hdfs-site.xml 文件，接下来修改 mapred-site.xml 文件，初始效果如下图。

12）修改后效果如下图，需要添加

<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>

至两个<configuration></configuration>标签之间。在非编辑状态下，输入wq保存退出。

13）修改完 mapred-site.xml 文件，接下来修改 yarn-site.xml 文件，初始效果如下图。

14）修改后效果如下图，需要添加

<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>

至两个<configuration></configuration>标签之间。在非编辑状态下，输入wq保存退出。

15）修改slaves为下图所示效果，在非编辑状态下，输入wq保存退出。

16）修改完所有配置文件，需要将 namenode 格式化。格式化之前，要先确保 hadoop 用户有操作的权限。使用

ll /app

命令查看文件夹所有者和群，使用

chown -R hadoop:hadoop /app

命令将该目录的所有者换为hadoop用户。再使用

ll /app

命令查看文件夹所有者和群，确保改变生效。

启动Hadoop（hadoop用户执行）

1）使用

exit

命令退出 root 用户，回归 hadoop 用户。使用

cd /app/hadoop/hadoop-2.6.5

命令切换目录，首次启动 hadoop 前，需使用

bin/hdfs namenode -format

命令格式化 HDFS，如下方顶部图所示。执行完毕后，如果可以从输出信息中找到下方底部图中红框所圈住的部分，即为成功。

2）使用

ssh-copy-id 0.0.0.0

命令配置一下 0.0.0.0 的免密登录，以确保后续 secondrynamenode 可以正常启动，而不用再输入密码。

3）使用

sbin/start-all.sh

命令启动 hadoop，如下方顶部图所示。启动完毕后，使用 jps 命令查看启动情况，启动效果如下方第二张图所示，即为成功。共有5种角色：NameNode、SecondaryNameNode、DataNode、ResourceManager 和 NodeManager。如果执行 jps 后出现如下方第三张图所示效果（无论是 hadoop 用户还是 root 用户），说明环境变量可能并未生效，回到 hadoop 用户，使用

source /etc/profile

命令再次使环境变量生效即可，然后输入 jps，效果如下方底部图所示。

4）使用

vi ~/words

命令编辑一个文本文件，作为被统计文本，文本内容可以随便写，效果如下图所示。

5）使用

hadoop dfs -mkdir /input

命令在hdfs上创建一个用于放统计文本文件的文件夹。

6）使用

hadoop dfs -ls /

命令查看该文件夹是否创建成功，如果成功，效果如下图所示。

7）使用

hadoop dfs -put ~/words /input

命令将被统计文本文件放到 input 文件夹下。

8）运行词频统计的程序，即使用

hadoop jar /app/hadoop/hadoop-2.6.5/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar wordcount /input /output

命令运行 mapreduce 程序，如下方顶部图所示。红框圈中的部分需要注意看，该地址输入浏览器后可查看任务情况，如下方中间图所示。任务完成后如下方底部图所示。

9）运行完成后，使用

hadoop dfs -ls /output

命令查看该目录下是否有文件生成，以及生成了哪些文件。

10）使用

hadoop dfs -cat /output/part-r-00000

命令查看该文件的内容。词频统计效果如下图所示。

11）使用

sbin/stop-all.sh

命令停止 hadoop，如下方顶部图所示。该命令执行完毕后，使用 jps 命令查看，刚才启动的角色是否还存在，如果只剩 jps 了，如下方底部图所示。说明关闭成功。

使用WinSCP连通本机（Windows）和Linux

1）下载并安装 WinSCP，点击新建站点，输入如下图所示的信息，主机名为配置的固定 IP 地址，用户名为Centos6.5安装中第3）步输入的用户名，而不是登录的用户名（或者说是全名）。密码则是Centos6.5安装中第3）步输入的密码。

2）输入完毕后点击保存，弹出如下所示页面，勾选保存密码，点击确定，以便下次使用。

3）点击确定后自动回到上一个页面，点击登录，过程中弹出如下所示页面。

4）点击是选择将密钥添加至缓存中，以便后续直接登录。弹出如下页面即代表登录成功。可以与 Linux 互发文件了。

本文标签：分布式模式系列 Hadoop

版权声明：本文标题：Hadoop 系列（一）伪分布式模式搭建内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1726440953a1070820.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

Hadoop 系列（一）伪分布式模式搭建

修改主机名和用户名（root用户执行）

配置静态IP地址（root用户执行）

关闭防火墙（root用户执行）

SSH免密登录（hadoop执行）

安装JDK（root用户执行）

安装Hadoop（root用户执行）

启动Hadoop（hadoop用户执行）

使用WinSCP连通本机（Windows）和Linux

更多相关文章

华为AR1200系列路由器WEB登录服务开启

html 让360浏览器兼容模式,360浏览器兼容模式的设置方法

如何通过浏览器访问Hadoop文件系统

映泰主板H100系列安装win7的各种坑

开启WIN10的卓越性能模式

如何在chrome浏览器设置夜间模式

chrome浏览器F12开发模式network不显示接口请求解决办法

deepinV20一路艰辛系列一：卸载firefox浏览器并安装chrome浏览器

谷歌chrome浏览器设置成深色（护眼）模式

chrome浏览器实现进入网页自动全屏模式

FL2440——RT3070 softAP模式 实现无线路由器功能

linux显卡驱动安全模式,win7在安全模式安装显卡驱动的详细教程

在Windows 10中至少有7种方法进入安全模式，但不一定是按F8键

解决 联想小新13 Pro 重装系统后 Fn+Q 性能模式切换 失灵

AMD GPU 系列版本信息

UEFI模式安装win8，让开机速度快如闪电！

windows蓝屏问题困扰,错误代码：0x000000ED,已解决。（使用于无法进入安全模式，且无法还原上一次的正确配置等情况）

VMware设置静态ip地址及不同网络模式讲解【Linux网络问题】

VirtualBox的Linux虚拟机文本模式和图形模式的切换

C++设计模式之建造者模式(三)

发表评论

推荐文章

任务-JPA-Competition

承诺会计预留款会计(commitment accountingEncumbrance Accounting) in AX 2012

win10 如何快速显示桌面

AMD EPYC——CPU命名规则

苹果切换输入法_落格五笔输入法苹果版下载-落格五笔输入法APP

热门文章

安装Centos镜像遇到的问题，Unable to contact settings server

Kylin4 执行cube报错Job failed eventually. Reason: Error occurred when generate retry configuration

华三路由器开启web访问

【VMware】Windows系统启用共享文件夹

HDU 6095 Rikka with Competition

给Chrome浏览器添加 IPhone 13、12等手机型号做兼容适配

windows系统重置系统SID进行Sysprep失败

电脑卡在LOGO界面，进步了系统，也进不了bios解决办法

【手把手AI项目】一、安装win10+linux-Ubuntu16.04的双系统（超细致）

戴尔电脑[MBR分区类型+Legacy引导]win10下安装Ubuntu18.04双系统。亲测

最新文章

IDEA 下载、安装、配置和案例

2024年会声会影哪个版本最新版

【杂谈】当当最新购书优惠来了，满300-60，AI好书推荐

2024最新版IntelliJ IDEA安装教程（非常详细）从零基础入门到精通，看完这一篇就够了

Windows下自制程序捕获6GHzWiFi7无线报文（mt7921au网卡WiFi6E）

会声会影哪个版本最新

IDEA2021.2安装与配置（持续更新）

dbeaver-ultimate23.3安装注册免费试用

会声会影2023旗舰版V26.0.0.136完整版2024免费下载最新中文旗舰版新功能讲解

视频编辑软件会声会影2025旗舰版即将来临

eset nod32 v11无限试用补丁

会声会影哪个版本最好用?

Ubuntu安装 IDEA

【IntelliJ IDEA 2024 激活及安装教程，亲测可以使用】

会声会影Corel VideoStudio2025旗舰版最新中文旗舰版新功能讲解及使用会声会影使用教程

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

FL2440——RT3070 softAP模式实现无线路由器功能

解决联想小新13 Pro 重装系统后 Fn+Q 性能模式切换失灵

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载