Flink重启策略Restart-Strategy|电子爱好者

admin管理员组
文章数量:1530967

Flink重启策略

为什么需要设置重启策略？

当任务失败时，Flink需要重新启动失败的任务和其他受影响的任务，以将作业恢复到正常状态。

重新启动策略和故障转移策略用于控制任务重新启动。重新启动策略决定是否以及何时可以重新启动失败/受影响的任务。故障转移策略决定应重新启动哪些任务以恢复作业。

NOTE：重启策略需要配合Checkpoint启动，因为需要用到flink的内部State

使用RestartStrategy

配置文件配置

配置文件中是DataSet&DataStream通用的。

如果enableCheckpoint()没有设置，那么restart-strategy默认为:none

如果设置了enableCheckpoint()，那么restart-strategy为：fixed-delay且delay=1s

#这里有3种不同的重启策略，
restart-strategy: none, off, disable|fixeddelay, fixed-delay|failurerate, failure-rate

通过ExecutionConfig配置

//限定重启次数
val env = StreamExecutionEnvironment.getExecutionEnvironment
  env.setRestartStrategy(
	RestartStrategies.fixedDelayRestart(
  3, // 尝试重启的次数
  Time.of(10, TimeUnit.SECONDS) // 每次重启之间的时间间隔，即重启尝试时间
)
  
//限定失败率
  //如果Duration被设为5分钟 = 300s，那么10s尝试重启一次，那么实际可重试30次
  //failure-rate = n/30 其中n为重试但失败的次数，如果达到一定的阈值，那么任务重启失败
val env = ExecutionEnvironment.getExecutionEnvironment()
env.setRestartStrategy(RestartStrategies.failureRateRestart(
  3, // 5min内允许失败的最大次数，可以适当调整
  Time.of(5, TimeUnit.MINUTES), //用来衡量失败率的时间间隔
  Time.of(10, TimeUnit.SECONDS) //2个连续的重试尝试之间的时间间隔
))

重启策略 Restart strategy

fixed-delay

#假如 restart-strategy: fixed-delay
restart-strategy.fixed-delay.attempts=3 [default]
restart-strategy.fixed-delay.delay=2s [default]

举个栗子：
===> 假如 delay=1s,attempts=1,那么重启的策略就为每2秒尝试重启一次，要么重启成功，要么失败进入下一次重启尝试，如果累计重试次数达到3次但是任然没有成功，那么这个task重启就算失败

failure-rate

restart-strategy.failure-rate.max-failures-per-interval: 3  
restart-strategy.failure-rate.failure-rate-interval: 5 min
restart-strategy.failure-rate.delay: 10 s

举个栗子：
===> 假如failure-rate-interval=5min，max-failures-per-interval=3，delay=10，那么重启策略就是每10s尝试重启一次，如果连续重试失败次数超过3次，那么表示重启失败

non-restart

不启用重启策略

fallback-restart

Flink自动管理重启策略，如果用这个策略，那么默认就是使用fixed-dalay

失败策略Failover strategy

官网参考：https://ci.apache/projects/flink/flink-docs-release-1.10/dev/task_failure_recovery.html

可以通过flink-conf.yaml来设置failover strategy

Restart All Failover Strategy

这个策略是重启整个job中所有的task，从失败恢复到正常状态

Restart Pipelined Region Failover Strateg

用来决定在region 失败策略中的region范围，这种策略比重启所有任务代价要小的多env.getConfig.setExecutionMode(ExecutionMode.PIPELINED)

jobmanager.execution.failover-strategy	value to config
Restart all 重启所有的任务	Full
Restart pipelined region 重启单个分区内的任务	Region

简单的实践Checkpoint代码

package com.shufang.state.chekpoint

import com.shufang.broadcast.People
import com.shufang.entities.WorkPeople
import com.shufang.source.MyUDFPeopleSource
import org.apache.flink.api.common.ExecutionMode
import org.apache.flink.api.common.restartstrategy.RestartStrategies
import org.apache.flink.api.common.state.MapStateDescriptor
import org.apache.flink.api.common.time.Time
import org.apache.flink.api.common.typeinfo.TypeInformation
import org.apache.flink.runtime.executiongraph.restart.RestartStrategy
import org.apache.flink.streaming.api.CheckpointingMode
import org.apache.flink.streaming.api.datastream.BroadcastStream
import org.apache.flink.streaming.api.environment.CheckpointConfig
import org.apache.flink.streaming.api.functions.co.{BroadcastProcessFunction, KeyedBroadcastProcessFunction}
import org.apache.flink.streaming.api.scala._
import org.apache.flink.util.Collector

object CheckPointDemo {

  def main(args: Array[String]): Unit = {

    //获取执行环境
    val env: StreamExecutionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment

    //用来决定在region (failover strategy)失败策略中的region范围
    env.getConfig.setExecutionMode(ExecutionMode.PIPELINED)
    /**
     * --------------------------------------checkpoint的配置-----------------------------------------------
     */
    env.enableCheckpointing(1000) //每1s checkpoint 一次
    env.getCheckpointConfig.setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE) //默认是EXACTLY_ONCE
    env.getCheckpointConfig.setCheckpointInterval(1000) //每隔 1s进行一次checkpoint 的工作
    env.getCheckpointConfig.setCheckpointTimeout(6000) //如果checkpoint操作在6s之内没有完成，那么就discard终端该checkpoint操作
    //true：假如在checkpoint过程中产生了Error，那么Task直接显示失败
    //false：产生了error，Task继续运行，checkpoint会降级到之前那个状态
    env.getCheckpointConfig.setFailOnCheckpointingErrors(false) //默认为true
    env.getCheckpointConfig.setMaxConcurrentCheckpoints(1) //在统一时间只能同时有1个checkpoint操作，其他的操作必须等当前操作执行完或者超时之后才能执行
    env.getCheckpointConfig.enableExternalizedCheckpoints(CheckpointConfig.ExternalizedCheckpointCleanup.DELETE_ON_CANCELLATION) //清除或保留状态
    env.getCheckpointConfig.setMinPauseBetweenCheckpoints(0) //下一个checkpoint操作触发之前最小的阻塞时间，必须>=0


    /** --------------------------------------配置重启策略----------------------------------------------------
     * When a task failure happens, (当一个任务失败后)
     * Flink needs to restart the failed task and other affected tasks to recover the job to a normal state.
     * （Flink 需要重启失败的任务和其他受影响的task并恢复到一个正常的状态）
     * 重启配置与checkpoint设置有关：
     * 如果没有开启checkpoint，那么重启策略为：no restart！
     * 如果开启了checkpoint，那么重启策略默认为：fixed-delay strategy is used with Integer.MAX_VALUE
     *
     * restart-strategy 可以在flink-conf.yaml中进行设置，也可以通过env.setRestartStrategy（）设置
     */


    /*env.setRestartStrategy(
      RestartStrategies.failureRateRestart(
        10,
        Time.minutes(5),
        Time.seconds(10))
    )*/

    //env.setRestartStrategy(new RestartStrategies.FallbackRestartStrategyConfiguration) //自动按照fixed-dalay重启策略

    /*env.setRestartStrategy(
      new RestartStrategies.FailureRateRestartStrategyConfiguration(
      10,
      Time.minutes(5),
      Time.seconds(10)))*/

    //env.setRestartStrategy(new RestartStrategies.NoRestartStrategyConfiguration())

    //env.setRestartStrategy(new RestartStrategies.FixedDelayRestartStrategyConfiguration(5,Time.seconds(4)))

    //env.setRestartStrategy(RestartStrategies.fixedDelayRestart(5,Time.seconds(4)))

    val config = new RestartStrategies.FailureRateRestartStrategyConfiguration(3, Time.minutes(5), Time.seconds(10))
    env.setRestartStrategy(config)

    val ds: DataStream[WorkPeople] = env.addSource(new MyUDFPeopleSource)

    val ds1: DataStream[(Int, Char)] = env.fromElements((1, '男'), (2, '女'))

    val describer = new MapStateDescriptor[Int, Char]("genderInfo", classOf[Int], classOf[Char])

    val bcStream: BroadcastStream[(Int, Char)] = ds1.broadcast(describer)

    val resultStream: DataStream[People] = ds.connect(bcStream).process(
      new BroadcastProcessFunction[WorkPeople, (Int, Char), People] {
        override def processElement(value: WorkPeople,
                                    ctx: BroadcastProcessFunction[WorkPeople, (Int, Char), People]#ReadOnlyContext,
                                    out: Collector[People]): Unit = {
          val gender: Char = ctx.getBroadcastState(describer).get(value.genderCode).charValue()
          out.collect(People(value.id, value.name, gender, value.address, value.price))
        }

        override def processBroadcastElement(value: (Int, Char), ctx: BroadcastProcessFunction[WorkPeople, (Int, Char), People]#Context, out: Collector[People]): Unit = {
          ctx.getBroadcastState(describer).put(value._1, value._2)

        }
      }
    )


    ds.print("before:")
    resultStream.print("after:")


    env.execute("checkpoint")
  }
}

本文标签：重启策略 Flink restart Strategy

版权声明：本文标题：Flink重启策略Restart-Strategy 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1725699924a1037343.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

计算机为什么老是重启,为什么电脑开机后总是自动重启?电脑开机后自动重启怎么办?...

3天前

说到开机后自动重启的问题，相信很多朋友都曾经遇到这个问题。电脑新手在遇到这种情况的时候，往往不知道应该如何去解决。其实，这种情况我们可以通过硬件和软件两个方法去分析电脑开机后

惠普服务器开机无限重启,惠普笔记本无限重启的有效解决办法

3天前

惠普笔记本无限重启如何解决?惠普笔记本虽然性能不错，但是使用久了也难免会出现问题，今天小编要帮大家解决的是惠普笔记本无限重启的问题，有相同问题的朋友不妨来参考下吧。惠普笔记

华硕幻13（ROG flow X13）安装ubuntu20.04驱动问题以及高版本内核无限重启的方法记录

3天前

本本即是一片解决问题的方法记录，也希望是一片讨论贴。我所使用的设备：ROG幻13，2021版（5900hs3050ti） 系统&

在操作系统重启后恢复应用程序的工作状态

2天前

Windows 10 创意者更新之后，默认开启了重启后恢复应用程序状态的功能。这是自 Vista 以来就提供的功能——Restart Manager。应用程序实现这一功能只需要调用 RegisterApplicationRestart 即

在非web请求中使用Feign完成微服务调用（定时任务，过期策略等）

2天前

某天某个地方，正在愉快的撸代码，突然异常邮件报警，赶快上服务器看日志，发现是定时任务在疯狂报错，错误如下：

使用大白菜U盘进入PE后再次重启电脑会留后门的清理方法

2天前

使用大白菜U盘进入PE后再次重启电脑会留后门，这个后门主要是自动下载安装一些软件，比如金山毒霸等。清除方法： 1、每次用完PE重启前，清理以下地方&a

Technology Strategy Patterns 学习笔记6-Communicating the Strategy-Approach Patterns

2天前

1 30-Second Answer 1.1 类似麦肯锡电梯谈话 Map an outline of three bullet points in your head, and then give the executives the

浏览器同源策略和跨域的实现方法

2天前

目录同源策略跨域资源共享(CORS) 跨域的实现方法 1、降域 document.domain 2、JSONP跨域 3、CORS跨域同源策略同源策略（Same Origin Policy&

浏览器的同源策略机制以及跨域请求

2天前

同源策略机制同源策略机制（Same Origin Policy，SOP）是一种约定，它是浏览器最核心也是最基本的安全功能，如果缺少了同源策略。则浏览器的正常功能可能都会受到影响。可以说Web是构建在同源策略基础上的，浏览器只是针对同源策

什么是浏览器同源策略？

2天前

同源策略限制了从同⼀个源加载的⽂档或脚本如何与来⾃另⼀个源的资源进⾏交互。这是⼀个⽤于隔离潜在恶意⽂件的重要安全机制。同源是指"协议域名端⼝"三者相同，即便两个不同的域名指向同⼀个ip地址&am

同源策略的限制，没有同源策略会怎么样？

2天前

目录同源策略同源策略的执行说说同源策略的限制没有同源策略的危害同源策略之前学习跨域方式的时候介绍过同源策略，但是学习真的不能知其一而不知其意，当时只是简单的了解，昨天

同源策略以及绕过此限制的方法

2天前

一、同源策略 1、何为同源？ 所谓"同源"指的两个网页url的三个部分是相同的： http:www.example：80dirpage.ht

远程重启h3c路由器_重启h3c路由器命令 h3c路由器登录地址

1天前

H3C路由器telnet进去以后重启的命令是什么啊？ 在用户模式下输入，reboot建议在重启之前进行设备配置的保存。避免丢失最近的配置操作。保存设备配置命令为：在用户模式下

安装win7系统时，硬盘模式为IDE模式时安装成功，硬盘模式为AHCI模式时重启蓝屏或一直启动的问题，以及IDE模式与AHCI模式的区别！

1天前

通俗易懂的说法就是,IDE就是ATA模式，是并口传输模式，04年前普及的技术，理论最大133Mb每秒，AHCI就是SATA模式，串

win10 VM启动宿主机重启问题

1天前

安装window10 VM后只要启动VM镜像，宿主机就重启，通过以下设置解决。

win10 一直循环重启，页面 “scanning and repairing (C): ”...（已解决！）

1天前

win10 一直循环重启， 页面 “scanning and repairing （C）: ” ... （已解决！&#xf

重启路由器可以换IP吗

20小时前

想换IP有哪些方法可以实现？有时候IP被限制了，怎么换IP访问，重启路由器可以换IP吗？一般家庭的基于PPPOE拨号方式上网的,使用的是动态IP&

计算机意外重启或遇错误无法继续,重装笔记本win7系统提示＂计算机意外的重新启动或遇到错误＂怎么办...

18小时前

很多用户都有过重装笔记本win7系统的经历，可是并不是每个人都可以顺利的完成系统安装。就有用户在重装笔记本系统的时候，遇到了一些问题，提示我们“计算机意外的重新启动或遇到错误

服务器2012重启进不了系统,windows server 2012 重启进入不了系统卡顿在哪里，安全模式和其他模式都是可以的...

11小时前

级别日期和时间来源事件 ID 任务类别错误 20201224 15:59:05 Microsoft-Windows-DistributedCOM 10005 无 "DCOM 在尝试使用参数“不可用”启动服务 netpr

ubuntu搜狗输入法重启

5小时前

在Ubuntu中使用搜狗输入法总会出现不能使用或者切换不到搜狗输入法的情况： 有以下两种解决办法： 1、右上角点击重新启动，或许可以解这个问题，但是

电子爱好者 - 最新技术资讯及电子产品介绍！

Flink重启策略Restart-Strategy

Flink重启策略

使用RestartStrategy

配置文件配置

通过ExecutionConfig配置

重启策略 Restart strategy

fixed-delay

failure-rate

non-restart

fallback-restart

失败策略Failover strategy

Restart All Failover Strategy

Restart Pipelined Region Failover Strateg

简单的实践Checkpoint代码

更多相关文章

计算机为什么老是重启,为什么电脑开机后总是自动重启?电脑开机后自动重启怎么办?...

惠普服务器开机无限重启,惠普笔记本无限重启的有效解决办法

华硕幻13（ROG flow X13）安装ubuntu20.04驱动问题以及高版本内核无限重启的方法记录

在操作系统重启后恢复应用程序的工作状态

在非web请求中使用Feign完成微服务调用（定时任务，过期策略等）

使用大白菜U盘进入PE后再次重启电脑会留后门的清理方法

Technology Strategy Patterns 学习笔记6-Communicating the Strategy-Approach Patterns

浏览器同源策略和跨域的实现方法

浏览器的同源策略机制以及跨域请求

什么是浏览器同源策略？

同源策略的限制，没有同源策略会怎么样？

同源策略以及绕过此限制的方法

远程重启h3c路由器_重启h3c路由器命令 h3c路由器登录地址

安装win7系统时，硬盘模式为IDE模式时安装成功，硬盘模式为AHCI模式时重启蓝屏或一直启动的问题，以及IDE模式与AHCI模式的区别！

win10 VM启动宿主机重启问题

win10 一直循环重启， 页面 “scanning and repairing (C): ”...（已解决！）

重启路由器可以换IP吗

计算机意外重启或遇错误无法继续,重装笔记本win7系统提示＂计算机意外的重新启动或遇到错误＂怎么办...

服务器2012重启进不了系统,windows server 2012 重启进入不了系统卡顿 在哪里，安全模式和其他模式都是可以的...

ubuntu搜狗输入法重启

发表评论

推荐文章

Kaggle Competition Favorita 项目使用文档

Win10操作系统上进行VMware虚拟机安装

电脑无法正常开机

win10启动 蓝屏 0xc000021a 解决方法 不重装

linux连接小米随身wifi密码忘记了,小米路由器app管理密码忘记了怎么办？

热门文章

HUAWEI华为笔记本MateBook 16 2021款 锐龙版 R7 集显(CREM-WFD9)原厂Win10系统

NOMURA Programming Competition 2020 C Postdocs 子又生孙,孙又生子,子子孙孙无穷尽也

Zoho邮箱怎么注册?最强完整指南

第三方邮箱客户端-是高效办公，也是一种生活态度

S7-200在win10下安装通讯报警“未找到指定的访问点”解决的方法

如何更新google chrome浏览器

GUI显示系统之SurfaceFlinger

centos-安装并使用五笔输入法-极点五笔输入法

从移动硬盘开机，引导VHD（Win10）

DELL电脑Windows出现蓝屏 0x0000007B代码解决办法

最新文章

Linux-4.x_x_64 内核配置选项简介

Linux-4.4-x86_64 内核配置选项简介

SATA工作模式咋选？揭秘AHCI和IDE区别（全文）

Windebug专题

Linux内核配置选项简介

命令行 - 很好的工具，很强大

Dell服务器做磁盘阵列

双系统安装-UEFI启动的Ubuntu 16.04 + 原装Win 10 （XPS 13）

电脑硬件知识大全(二)

一台电脑两个人用,省钱又省电(转)

终极文件文件夹隐藏方案大全

XP瘦身提速大法

Word、Excel操作技巧大全

DELL 1420 笔记本 BIOS设置

电脑故障修复

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

win10 一直循环重启，页面 “scanning and repairing (C): ”...（已解决！）

服务器2012重启进不了系统,windows server 2012 重启进入不了系统卡顿在哪里，安全模式和其他模式都是可以的...

win10启动蓝屏 0xc000021a 解决方法不重装

HUAWEI华为笔记本MateBook 16 2021款锐龙版 R7 集显(CREM-WFD9)原厂Win10系统

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载