大数据运维实战第二十四课 Yarn 资源调度 Fair Schedule 与 Capacity Scheduler 配置选型|电子爱好者

admin管理员组
文章数量:1612065

在大数据平台运维中，会经常遇到集群资源争抢的问题。因为在公司内部，Hadoop Yarn 集群一般会被多个业务、多个用户同时使用，共享 Yarn 资源。此时，如果不对集群资源做规划和管理的话，那么就会出现 Yarn 的资源被某一个用户提交的 Application（App）占满，而其他用户只能等待；或者也可能会出现集群还有很多剩余资源，但 App 就是无法使用的情况。

如何解决这个问题呢？此时就需要用到 Hadoop 中提供的资源调度器。

Yarn 多用户资源管理策略

Yarn 提供了可插拔的资源调度算法，用于解决 App 之间资源竞争的问题。在 Yarn 中有三种资源调度器可供选择，即 FIFO Scheduler、Capacity Scheduler、Fair Scheduler，目前使用比较多的是 Fair Scheduler 和 Capacity Scheduler。下面对这三种资源调度器分别进行介绍。

1. FIFO Scheduler

在 Hadoop 1.x 系列版本中，默认使用的调度器是 FIFO，它采用队列方式将每个任务按照时间先后顺序进行服务。比如排在最前面的任务需要若干 Map Task 和 Reduce Task，当发现有空闲的服务器节点时就分配给这个任务，直到任务执行完毕。

2. Capacity Scheduler

在 Hadoop 2.x/3.x 系列版本中，默认使用的调度器是 Capacity Scheduler（容量调度器），这是一种多用户、多队列的资源调度器。每个队列可以配置资源量，可限制每个用户、每个队列的并发运行作业量，也可限制每个作业使用的内存量；每个用户的作业有优先级，在单个队列中，作业按照先来先服务（实际上是先按照优先级，优先级相同的再按照作业提交时间）的原则进行调度。

容量资源调度器，支持多队列，但默认情况下只有 root.default 这一个队列。

当不同用户提交任务时，任务都会在这个队列里按照先进先出策略执行调度，很明显，单个队列会大大降低多用户的资源使用率。

因此，要使用容量资源调度，一定要配置多个队列，每个队列可配置一定比率的资源量（CPU、内存）；同时为了防止同一个用户的任务独占队列的所有资源，调度器会对同一个用户提交的任务所占资源量进行限定。

举个简单的例子，下图是容量调度器中配置好的一个队列树：

上图通过队列树方式对 Yarn 集群资源做了一个划分，可以看到，在 root 队列下面定义了两个子队列 dev 和 test，分别占 30% 和 70% 的 Yarn 集群资源；而 dev 队列又被分成了 dev1 和 dev2 两个子队列，分别占用 dev 队列 30% 中的 40% 和 60% 的 Yarn 集群资源。

容量调度除了可以配置队列及其容量外，还可以配置一个用户或任务可以分配的最大资源数量、同时可以配置运行应用的数量、队列的 ACL 认证等。

如何让任务运行在指定的队列呢？ 有两种方式，一种是直接指定队列名，另一种是通过用户名、用户组和队列名进行对应。注意：对于容量调度器，我们的队列名必须是队列树中的最后一部分，如果使用队列树则不会被识别。例如，在上面配置中，可直接使用 dev1 和 dev2 作为队列名，但如果用 root.dev.dev1 或者 dev.dev2 则都是无效的。

3. Fair Scheduler

Fair Scheduler（公平调度器）支持多用户、多分组管理，每个分组可以配置资源量，也可限制每个用户和每个分组中并发运行的作业数量；每个用户的作业有优先级，优先级越高分配的资源就越多。公平调度器的主要目标是实现 Yarn 上运行的任务能公平的分配到资源。

Fair Scheduler 将整个 Yarn 的可用资源划分成多个队列资源池，每个队列中可以配置最小和最大的可用资源（内存和 CPU）、最大可同时运行 Application 数量、权重，以及可以提交和管理 Application 的用户等。

资源池以及用户的对应关系如下图所示：

在上图中，假设整个 Yarn 集群可用的 CPU 资源为 100vCPU，可用的内存资源为 100GB。现在为三个业务线各自划分一个队列，分别是 Queue1、Queue2 和 Queue3，每个队列可用的资源均为 20vCPU 和 20GB 内存，最后还规划了一个 default 队列，用于运行其他用户和业务提交的任务。可用资源为 40vCPU 和 40GB 内存，这样，四个队列将整个 Yarn 集群资源刚好分配完毕。

在执行任务的时候，可以显性地指定任务运行的队列，但更多情况下不指定队列，而是通过用户名作为队列名称来提交任务，即用户 user1 提交的任务被分配到队列 Queue1 中，用户 user2 提交的任务被分配到资源池 Queue2 中。注意，这里的 user1 和 user2 是配置的固定用户，除了这些用户外，其他未指定的用户提交的任务将会被分配到 default 队列中。这里的用户名，就是提交 App 所使用的 Linux/Unix 的系统用户名。

除了可以通过用户名作为队列名，在用户比较多的时候，还可以使用用户组，将同一类用户放到一个用户组下，然后将这个用户组配置到资源调度策略中。

接下来，向你介绍 Fair Scheduler 调度的配置。

Fair Scheduler 调度的配置

要启用公平调度器，首先需要配置 yarn-site.xml 文件，添加如下设置：

<property>
  <name>yarn.resourcemanager.scheduler.class</name>
  <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value>
</property>

公平调度器的配置文件路径位于 HADOOP_CONF_DIR下的 fair-scheduler.xml 文件中，这个路径可以通过配置 yarn-site.xml 文件，添加如下内容来实现：

    <property>
      <name>yarn.scheduler.fair.allocation.file</name>
      <value>/etc/hadoop/conf/fair-scheduler.xml</value>
    </property>

若没有这个配置文件，调度器会在用户提交第一个应用时为其自动创建一个队列，队列的名字就是用户名，所有的任务都会被分配到 default 队列中。

接下来重点看看 fair-scheduler.xml 文件如何编写，此文件中定义队列的层次是通过嵌套元素实现的。所有的队列都是 root 队列的孩子，下面是一个定义好的公平调度策略：

<?xml version="1.0"?>
<allocations>  
        <!-- users max running apps -->
        <userMaxAppsDefault>10</userMaxAppsDefault>
<queue name="root">
        <aclSubmitApps> </aclSubmitApps>
        <aclAdministerApps> </aclAdministerApps>
        <queue name="default">
                <minResources>12000mb,5vcores</minResources>
                <maxResources>100000mb,50vcores</maxResources>
                <maxRunningApps>22</maxRunningApps>
                <schedulingMode>fair</schedulingMode>
                <weight>1</weight>
                <aclSubmitApps>*</aclSubmitApps>
        </queue>
    <span class="hljs-tag">&lt;<span class="hljs-name">queue</span> <span class="hljs-attr">name</span>=<span class="hljs-string">"dev_group"</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">minResources</span>&gt;</span>115000mb,50vcores<span class="hljs-tag">&lt;/<span class="hljs-name">minResources</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">maxResources</span>&gt;</span>500000mb,150vcores<span class="hljs-tag">&lt;/<span class="hljs-name">maxResources</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">maxRunningApps</span>&gt;</span>181<span class="hljs-tag">&lt;/<span class="hljs-name">maxRunningApps</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">schedulingMode</span>&gt;</span>fair<span class="hljs-tag">&lt;/<span class="hljs-name">schedulingMode</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">weight</span>&gt;</span>5<span class="hljs-tag">&lt;/<span class="hljs-name">weight</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">aclSubmitApps</span>&gt;</span> dev_group<span class="hljs-tag">&lt;/<span class="hljs-name">aclSubmitApps</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">aclAdministerApps</span>&gt;</span>hadoop dev_group<span class="hljs-tag">&lt;/<span class="hljs-name">aclAdministerApps</span>&gt;</span>
    <span class="hljs-tag">&lt;/<span class="hljs-name">queue</span>&gt;</span>
                                                                                                     
                                      
    <span class="hljs-tag">&lt;<span class="hljs-name">queue</span> <span class="hljs-attr">name</span>=<span class="hljs-string">"test_group"</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">minResources</span>&gt;</span>23000mb,10vcores<span class="hljs-tag">&lt;/<span class="hljs-name">minResources</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">maxResources</span>&gt;</span>300000mb,100vcores<span class="hljs-tag">&lt;/<span class="hljs-name">maxResources</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">maxRunningApps</span>&gt;</span>22<span class="hljs-tag">&lt;/<span class="hljs-name">maxRunningApps</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">schedulingMode</span>&gt;</span>fair<span class="hljs-tag">&lt;/<span class="hljs-name">schedulingMode</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">weight</span>&gt;</span>4<span class="hljs-tag">&lt;/<span class="hljs-name">weight</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">aclSubmitApps</span>&gt;</span> test_group<span class="hljs-tag">&lt;/<span class="hljs-name">aclSubmitApps</span>&gt;</span>
            <span class="hljs-tag">&lt;<span class="hljs-name">aclAdministerApps</span>&gt;</span>hadoop test_group<span class="hljs-tag">&lt;/<span class="hljs-name">aclAdministerApps</span>&gt;</span>
    <span class="hljs-tag">&lt;/<span class="hljs-name">queue</span>&gt;</span>

</queue>
<queuePlacementPolicy>
<rule name=“user” create=“false” />
<rule name=“primaryGroup” create=“false” />
<rule name=“secondaryGroupExistingQueue” create=“false” />
<rule name=“default” queue=“default” />
</queuePlacementPolicy>
</allocations>

下面介绍这个配置中的几个配置项的含义：

配置项	含义
userMaxAppsDefault	默认的用户最多可同时运行多少个应用程序
minResources	设置最少资源保证量，设置格式为“X mb, Y vcores”，当一个队列的最少资源保证量未满足时，它将优先于其他同级队列获得资源
maxResources	设置最多可以使用的资源量，fair scheduler 会保证每个队列使用的资源量不会超过该队列的最多可使用资源量
maxRunningApps	设置最多同时运行的应用程序数
schedulingMode	设置队列采用的调度模式，可以是 fifo、fair 或者 drf
weight	设置队列的权重，权重越高，可获取的资源就越多
aclSubmitApps	表示可向队列中提交应用程序的用户和组列表，默认情况下为“*”，表示任何用户和组均可以向该队列提交应用程序

再来看一下队列执行规则列表（Queue Placement Policy），Fair 调度器采用了一套基于规则的配置来确定应用应该放到哪个队列中。在上面的例子中，我定义了一个规则列表，总共有四个规则，其中的每个规则会被逐个尝试，直到匹配成功。

例如，第一个规则是 user，表示将提交任务的用户名作为队列名，然后将任务放到这个队列中执行；第二个规则 primaryGroup，表示将提交任务的用户所属的主组作为队列名；第三个规则 secondaryGroupExistingQueue 表示将提交任务的用户所属的附属组作为队列名；最后一个规则 default，表示当前面所有规则都不满足时，用户提交的任务会放到 default 队列中。

除了上面的规则之外，还可以在 yarn-site.xml 文件添加如下配置：

<property>
<name>yarn.scheduler.fair.user-as-default-queue</name>
<value>true</value>
<description>default is True</description>
</property>

此配置值默认为 true，表示当任务中未指定队列名时，将以用户名作为队列名，这个配置就实现了根据用户名自动分配队列；如果设置为 false，那么所有任务会被放入 default 队列，而不是放到基于用户名的队列中。

另外，我们还可以在 yarn-site.xml 文件添加如下配置：

<property>
<name>yarn.scheduler.fair.allow-undeclared-pools</name>
<value>false</value>
<description>default is True</description>
</property>

此配置表示是否允许创建未定义的队列，默认值为 true，表示 Yarn 将会自动创建任务中指定的未定义过的队列名。设置成 false 后，用户就无法创建队列了，该任务会被分配到 default 队列中。

最后，再来说下资源抢占，当一个任务提交到一个繁忙集群中的空队列时，任务并不会马上执行，而是暂时阻塞，直到正在运行的任务释放系统资源，才开始执行。为了使提交的任务执行时间更具预测性（可以设置等待的超时时间），Fair 调度器支持抢占。

抢占就是允许调度器杀掉占用超过其应占资源份额队列的 containers，这些 containers 资源释放后可，被分配到应该享有这些份额资源的队列中。需要注意，抢占会降低集群的执行效率，因为被终止的 containers 需要被重新执行。

要启用抢占模式，可以在 yarn-site.xml 文件中添加如下配置：

    <property>
      <name>yarn.scheduler.fair.preemption</name>
      <value>true</value>
    </property>

可以设置此参数为 true 来启用抢占功能。此外，还需要在 fair-scheduler.xml 文件中添加一个参数用来控制抢占的过期时间，参数设置如下：

<fairSharePreemptionTimeout>60</fairSharePreemptionTimeout>

此参数用来设置某个队列的超时时间，如果队列在指定的时间内未获得最小的资源保障，调度器就会抢占 container。

还可以在 fair-scheduler.xml 文件中添加全局配置参数，内容如下：

<defaultFairSharePreemptionTimeout>60</defaultFairSharePreemptionTimeout>

此参数用来配置所有队列的超时时间。

这里需要注意，在 fair-scheduler.xml 配置中，添加了用户和用户组，这里的用户和用户组的对应关系，需要维护在 ResourceManager 上，ResourceManager 在分配资源池时候，是从 ResourceManager 所在的操作系统上读取用户和用户组的对应关系的，否则就会被分配到default 队列中。而客户端机器上的用户对应的用户组无关紧要。

在 fair-scheduler.xml 第一次添加、配置完成后，需要重启 Yarn 集群才能生效，而后面再对 fair-scheduler.xml 进行修改用户或者调整资源池配额后，无须重启 yarn 集群，只需执行下面的命令刷新即可生效：

[hadoop@yarnserver ~]$ yarn rmadmin -refreshQueues
[hadoop@yarnserver ~]$ yarn rmadmin -refreshUserToGroupsMappings

动态更新只支持修改资源池配额，如果是新增或减少资源池，则还需要重启 Yarn 集群。

容量调度与公平调度对比与选型

1. 相同

容量调度和公平调度实现的功能基本一致，例如，它们都支持多用户、多队列，即都适用于多用户共享集群的应用环境。同时，单个队列均支持优先级和 FIFO 调度方式，还支持资源共享，即某个队列中的资源有剩余时，可共享给其他缺资源的队列。

2. 不同

核心调度策略不同

容量调度器的调度策略是，先选择资源利用率低的队列，然后在队列中同时考虑 FIFO 和内存因素；而公平调度器仅考虑公平，而公平是通过任务缺额体现的，调度器每次选择缺额最大的任务（队列的资源量，任务的优先级等仅用于计算任务缺额）。

对特殊任务的处理不同

容量调度器调度任务时会考虑作业的内存限制，为了满足某些特殊任务的特殊内存需求，可能会为该任务分配多个 slot；而公平调度器对这种特殊的任务无能为力，只能杀掉这种任务。

因此，具体选用哪种调度算法，可根据实际应用需求而定。一个基本的经验是，小型 Yarn 集群（100 个节点以内），可考虑使用公平调度器，而大型 Yarn 集群（超过 100 个节点）可采用容量调度器效果会更好。

小结

本课时主要介绍了 Yarn 集群中常用的两个资源调度器：容量调度和公平调度。通过该课时的学习，我们了解到，在多个用户同时使用 Yarn 集群的时候，合理地设置调度器可以有效利用集群资源，并减少资源争抢，使集群资源利用率达到最大化。

精选评论

**5241：

老师您好，谢谢您提供了这么好的课程，关于capacity scheduler即容量调度器有个问题咨询您下。经常看到介绍capacity scheduler时一般会说“当某个队列的资源空闲时，可以将它的剩余资源共享给其他队列”，即所谓弹性。我举个例子，我有A、B两个队列，其中B队列又有B1和B2两个子队列，假设B队列的yarn.scheduler.capacity…maximum-capacity参数设为60%，如果此时A队列没有任务，那么系统最多也是将60%的资源给B队列是吗？即一个队列占有的资源是不能突破maximum-capacity的，哪怕此时别的队列都是idle的？不知道我理解的是否正确，请老师指点，谢谢。

讲师回复：

队列资源是可以抢占的，前提是要开启抢占，所谓抢占就是其他队列空闲，而我的队列资源不够，是可以强占空闲队列资源的，至于抢占多少，是根据你需要的资源而定，不是全部抢占，而此时如果之前空闲队列有任务要运行的话，他也会抢占回来他自己应得的资源，这种情况下，如果你的队列正在运行任务，可能导致运行失败。Yarn优先选择优先级低的Container作为资源抢占对象，且不会立刻杀死Container，而是将释放资源的任务留给应用程序自己：ResourceManager将待杀死的Container列表发送给对应的ApplicationMaster，以期望它采取一定的机制自行释放这些Container占用的资源，比如先进行一些状态保存工作后，再将对应的Container杀死，以避免计算浪费，如果一段时间后，ApplicationMaster尚未主动杀死这些Container，则ResourceManager再强制杀死这些Container。通过将yarn.scheduler.fair.preemption设置为true，可以全面启用抢占功能。有两个相关的抢占超时设置，一个用于最小共享（minimum share preemption timeout），另一个用于公平共享（fair share preemption timeout），两者设定时间均为秒级。默认情况下，两个超时参数均不设置。所有为了允许抢占容器，需要至少设置其中一个超时参数。

**7324：

对小型 Yarn 集群更适合公平调度器，而yarn集群规模变大时适合容量调度器，这句话不理解

讲师回复：

这是一个使用的经验，小型集群，可能机器配置资源不高，最好是公平调度原则，资源平均分配，而大集群的话，使用容量调度会更好，因为主机较多，资源较多，这其实是跟两种调度策略有关，因为容量调度会尽量让任务在一个节点跑满，主要此节点有资源，不追求公平分配资源。

本文标签：第二十四实战数据资源 Capacity

版权声明：本文标题：大数据运维实战第二十四课 Yarn 资源调度 Fair Schedule 与 Capacity Scheduler 配置选型内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1728622030a1166476.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

大数据运维实战第二十四课 Yarn 资源调度 Fair Schedule 与 Capacity Scheduler 配置选型

Yarn 多用户资源管理策略

1. FIFO Scheduler

2. Capacity Scheduler

3. Fair Scheduler

Fair Scheduler 调度的配置

容量调度与公平调度对比与选型

1. 相同

2. 不同

小结

精选评论

**5241：

讲师回复：

**7324：

讲师回复：

更多相关文章

什么是容量调度器（Capacity Scheduler）？

capacity()与size()的区别

yarn 调度器 resourcemanager 的 Capacity Scheduler 部分配置说明

vector.capacity()

C++容器中 size(), capacity, reserve() ,resize() 函数讲解

conflict miss 和 capacity miss

ElasticSearch报 EsThreadPoolExecutor[search, queue capacity = 1000, org.elasticsearch.common.util.con...

Capacity Scheduler and Dynamic Scheduler

java.nio.ByteBuffer的 capacity, limit, position, mark

ByteBuffer的position、limit和capacity

[Cloud Computing]Patterns: Elastic Resource Capacity

hadoop Capacity Scheduler 完整配置

StringBuilder对象Capacity属性

大数据运维实战第二十四课 Yarn 资源调度 Fair Schedule 与 Capacity Scheduler 配置选型

Hadoop 2.0中Capacity Scheduler与Fair Scheduler对比

Capacity Scheduler配置说明

Buffer的重要属性 positionlimitcapacity

StringBuilder类的capacity()方法和length()方法的一些小坑

【Ambari】设置yarn队列资源为绝对值[memory=10240,vcores=12,yarn.iogpu=4]

使用el-table过程中current-change事件获取当前选中行数据，用于修改框数据出现数据联动

发表评论

推荐文章

The Llama 3 Herd of Models.Llama 3 模型第1,2,3部分全文

gdb 调试遇到的问题 #0＜unavailable＞ in ?? ()

Unexpected token o in JSON at position 1 报错原因

电脑140个技巧

crtp

热门文章

怎么关闭win10虚拟机服务器,如何关闭Win10自带虚拟机？三种关闭Win10专业版系统hyper-v虚拟机的方法...

架构师修炼系列【微服务】

[Java Web]Error parsing HTTP request headerNote: further occurrences of HTTP header parsing errors

UAV和基站通信的天线模型

测试牛人总结APP&amp;移动端测试流程汇总

win7系统设置 服务器设置,win7系统服务器环境配置

mysql cluster cge (commercial)_Mysql 产品分类和版本说明

RecyclerView使用notifyItemRemoved()方法导致界面position错乱问题

stl vector 函数_vector :: capacity（）函数以及C ++ STL中的示例

CentOS7 docker报错 usrbindocker-current: Error response from daemon: oci runtime error（需要禁用SELinux）

最新文章

计算机系统的用户分那几类,windows7有几种类型账户权限分别是什么

windows计算机查看里设置,windows10电脑配置怎么查看

js判断电脑是windows系统还是mac系统(干货满满哦)

设置计算机系统语言,windows系统默认语言如何设置-windows系统默认语言设置方法 - 河东软件园...

w ndows10摄像头设置,windows10系统电脑摄像头怎么打开

在Mac 电脑上使用虚拟机 VirtualBox 安装 Windows 11 问题：当前电脑不满足安装Windows 11 的条件要求...

【windows】windows 11 安装解决 这台电脑无法运行 Windows 11

Windows完全更换ubuntu系统

问题：windows日志系统事件36887造成电脑蓝屏重启

苹果电脑装双系统利弊有哪些

苹果 MAC 电脑 boot camp 助手装 Windows10 双系统出现的各种问题和解决方法

如何在Windows电脑上启动并配置SSH服务

如何查看自己windows电脑的IP地址

清除计算机用户缓存,如何在Windows 7中清除内存缓存，释放电脑空间？

windows7到底是多用户多任务操作系统还是单用户多任务操作系统

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

测试牛人总结APP&移动端测试流程汇总

win7系统设置服务器设置,win7系统服务器环境配置

【windows】windows 11 安装解决这台电脑无法运行 Windows 11

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载