Prometheus告警功能——对接邮箱|电子爱好者

admin管理员组
文章数量:1529441

前言

告警功能概述

告警规则

通知告警信息

prometheus监控系统的告警逻辑

告警功能:

部署告警对接邮箱

故障模拟

前言

Prometheus对指标的收集、存储同告警能力分属于Prometheus Server和AlertManager(通用的组件)两个独立的组件，前者仅负责基于"告警规则"生成告警通知，具体的告警操作则由后者完成;

Alertmanager负责处理由客户端发来的告警通知客户端通常是Prometheus server，但它也支持接收来自其它工具的告警;

Alertmanager对告警通知进行分组、去重后，根据路由规则将其路由到不同的receiver，如Email、短信或PagerDuty等;

目前Alertmanager还不支持钉钉，那用户完全可以通过Webhook与钉钉机器人进行集成，从而通过钉钉接收告警信息。同时AltManager还提供了静默和告警抑制机制来对告警通知行为进行优化

PS:webhook是一个APr概念, webhook是一种web回调或者http的push APT.Webhook作为一个轻量的事件处理应用

告警功能概述

prometheus对指标的收集、存储与告警能力分属于Prometheus serve和alertmanager两个独立的组件，pro-server只负责通过"告警规则"生成告警通知，具体告警操作是由alertmmanager完成

告警规则

是由PromQL编写的布尔值表达式使用>< =与一个常用量值，比如80%进行比较，其返回值为true或false

prometheus-server对抓取到的指标序列与告警规则中做为比较的Prometheus匹配，则会把此样本值抓取过来作比较，若返回值为true则认为指标异常，不能满足false，则为正常值以上表达式为告警规则表达式。比如：筛选一个指标数据cpu使用率<0%系统异常

通知告警信息

一旦条件表达式为true了就会触发通知信息，送给altermanager，由alter借助特定服务的API或者访问入口，将此信息发出去一般称为告警媒介，也可以借助邮件进行告警SMTP

prometheus监控系统的告警逻辑

route：告警路由，分组、分类分发告警消息给不同渠道

prometheus通过alter-rule规则，生成告警通知给altermanager，altermanager会生成本地的告警路由表（第一路由默认称为根路由，所有的告警信息都需要一个根路由，没有一个匹配项，则需要设置一个默认路由）为实现将特定的信息发送给特定的用户

例如：按消息级别来看，严重、中等、普通级别，红色报警、蓝色报警，应用发送方，按分组：业务运维、系统运维、基础设施运维、k8s运维

告警功能:

除了基本的告警通知能力外，Altermanager还支持对告警进行去重、分组、抑制、

静默、抑制、分组等功能;

分组（Grouping):将相似告警合并为单个告警通知的机制，在系统因大面积故障而触发告警潮时，分组机制能避免用户被大量的告警噪声淹没，进而导致关键信息的隐没;

抑制(Inhibition):系统中某个组件或服务故障而触发告警通知后，那些依赖于该组件或服务的其它组件或服务可能也会因此而触发告警，抑制便是避免类似的级联告警的一种特性，从而让用户能将精力集中于真正的故障所在;

静默(silent):是指在一个特定的时间窗口内，即便接收到告警通知，Alertmanager也不会真正向用户发送告警信息的行为;通常，在系统例行维护期间，需要激活告警系统的静默特性;路由(route):用于配置Alertmanager如何处理传入的特定类型的告警通知，其基本逻辑是根据路由匹配规则的匹配结果来确定处理当前告警通知的路径和行为

部署告警对接邮箱

在prometheus-server端定义告警规则，指定alertmanager的位置，将告警信息发送给alertmanager处理

上传软件包

[root@prometheus ~]# tar -zxf alertmanager-0.22.2.linux-amd64.tar.gz -C /usr/local/
[root@prometheus ~]# ln -s /usr/local/alertmanager-0.22.2.linux-amd64/ /usr/local/alertmanager

查看配置文件

[root@prometheus /usr/local/alertmanager]# cat alertmanager.yml
route:			#路由信息
  group_by: ['alertname']		#分组
  group_wait: 30s		 #分组缓冲/等待时间
  group_interval: 5m	 #重新分组时间
  repeat_interval: 1h	 #重新告警间隔
  receiver: 'web.hook'	 #接收方/媒介
receivers:
- name: 'web.hook'
  webhook_configs:
  - url: 'http://127.0.0.1:5001/'	#标注5001端口
		inhibit_rules:		#抑制规则的策略
  - source_match:	#匹配项
      severity: 'critical'	#严重的级别
    target_match:
      severity: 'warning'	#target匹配warning级别
    equal: ['alertname', 'dev', 'instance']		#符合alertname、dev、instance

修改alertmanager的配置文件

自己的邮箱开启smtp服务，获得授权码

[root@prometheus /usr/local/alertmanager]# cp alertmanager.yml alertmanager.yml.bak
[root@prometheus /usr/local/alertmanager]# vim alertmanager.yml

global:
  resolve_timeout: 5m
  smtp_from: 1973207956@qq
  smtp_auth_username: 1973207956@qq
  smtp_auth_password: tedkmlljybrheiei
  smtp_require_tls: false
  smtp_smarthost: 'smtp.qq:465'
route:
  group_by: ['alertname']
  group_wait: 10s
  group_interval: 30s
  repeat_interval: 1h
  receiver: 'email-demo'
receivers:
- name: 'email-demo'
  email_configs:
  - to: 1973207956@qq
    send_resolved: true

启动alertmanager

[root@prometheus /usr/local/alertmanager]# ./alertmanager

相关的配置文件

[root@prometheus /usr/local/alertmanager]# cd ../prometheus-2.27.1.linux-amd64/
[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64]# ls
console_libraries  consoles  consul-sd  data  file_sd  LICENSE  NOTICE  prometheus  promtool
[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64]# mkdir alert-config
[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64]# cd alert-config/
[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64/alert-config]# mkdir alert_rules targets
[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64/alert-config]# cd alert_rules/
[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64/alert-config/alert_rules]# vim demo-down.yml
groups:
- name: AllInstances
  rules:
  - alert: InstanceDown
    #节点服务挂掉
    # Condition for alerting
    expr: up == 0
    #up状态为0时
    for: 1m
    # Annotation - additional informational labels to store more information
    annotations:
      title: 'Instance down'
      description: Instance has been down for more than 1 minute.'
    # Labels - additional labels to be attached to the alert
    labels:
      severity: 'critical'
        #告警级别
~

编写yml文件


[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64/alert-config/targets]# vim alertmanagers.yml
[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64/targets]# cat alertmanagers.yml
- targets:
  - 192.168.37.100:9093
  labels:
    app: alertmanager

[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64/alert-config/targets]# vim nodes-centos.yml
- targets:
  - 192.168.37.100:9100
  - 192.168.37.101:9100
  - 192.168.37.102:9100
  - 192.168.37.107:9100
  labels:
    app: node-exporter
    job: node
[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64/alert-config/targets]# vim prometheus-servers.yml
- targets:
  - 192.168.37.100:9090
  labels:
    app: prometheus
    job: prometheus

目录结构图

[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64/alert-config]# tree
.
├── alert_rules
│   └── demo-down.yml
├── prometheus.yml
└── targets
    ├── alertmanagers.yml
    ├── nodes-centos.yml
    └── prometheus-servers.yml

prometheus启动文件

[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64/alert-config]# vim prometheus.yml
# my global config
# Author: MageEdu <mage@magedu>
# Repo: http://gitlab.magedu/MageEdu/prometheus-configs/
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).
#
# Alertmanager configuration
alerting:
  alertmanagers:
  - file_sd_configs:
    - files:
      - "targets/alertmanagers*.yml"

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  - "rules/*.yml"
  - "alert_rules/*.yml"

   # A scrape configuration containing exactly one endpoint to scrape:
   # Here it's Prometheus itself.
scrape_configs:
   # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'
    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.
    file_sd_configs:
    - files:
      - targets/prometheus-*.yml
      refresh_interval: 2m

    # All nodes
  - job_name: 'nodes'
    file_sd_configs:
    - files:
      - targets/nodes-*.yml
      refresh_interval: 2m
  - job_name: 'alertmanagers'
    file_sd_configs:
    - files:
      - targets/alertmanagers*.yml
      refresh_interval: 2m

指定文件启动prometheus

[root@prometheus /usr/local/prometheus-2.27.1.linux-amd64]# ./prometheus --config.file=./alert-config/prometheus.yml

故障模拟

关闭node——exporer

先看ui界面，此时断开状态

查看邮箱

大功告成了！！！！

本文标签：邮箱功能 prometheus

版权声明：本文标题：Prometheus告警功能——对接邮箱内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1726720469a1081807.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

Prometheus告警功能——对接邮箱

前言

告警功能概述

告警规则

通知告警信息

prometheus监控系统的告警逻辑

告警功能:

部署告警对接邮箱

故障模拟

更多相关文章

新东方报名系统服务器地址,新东方邮箱服务器地址

python接收163邮件以及下载附件（以163邮箱为例）

SpringBoot中发送Email(基于QQ邮箱版的)

[转]QQ邮箱开通提醒免费发送到手机

hao123.com上的邮箱登录

php-gene邮箱,网易域名邮箱AND腾讯域名邮箱，域名设置参考

15 分钟 教你搞一个专属于你的域名邮箱

修改 exchange服务器地址,绑定exchange邮箱服务器地址

比较好用的邮箱有哪些？收费邮箱主要哪家好呢？

DolphinScheduler理论知识以及手机、邮箱、钉钉、电话等多种告警部署实操

爱的邮箱（@love.com）申请方法!

3、TPshop之邮箱注册配置教程以及常见错误集合

中国企业邮箱网是什么？想申请公司的邮箱怎么注册

【探花交友DAY 02】项目搭建和用户登录功能的实现

忘记密码发送验证码到邮箱

使用Chrome浏览器的搜索引擎，谷歌浏览器开启同步功能

Chrome浏览器内置翻译功能突然失效(自动翻译不跳出来)解决方案

Google Chrome浏览器的回退功能快捷键

路由器 虚拟网服务器,虚拟路由器的功能有哪些？蒲公英路由器实现虚拟网组建...

fl2440-RT3070无线网卡（AP模式）实现路由器功能

发表评论

推荐文章

谷歌、华为、腾讯等纷纷布局，代表未来游戏方向的云游戏抢滩登陆

INFORMS 及 EJOR 系列主编汇总

删除计算机自带的游戏软件,win10系统删除自带游戏的处理办法

zip文件类型如何恢复系统默认值--右键-＞打开方式中 无 “资源管理器”选项

amd为什么还用针脚_为什么AMD不取消cpu上的针脚？

热门文章

Android隐藏app桌面图标

[chatGPT问题解决]An error occurred. If this issue persists please contact us through our help center at

Tomcat关闭失败，SEVERE: Could not contact localhost:8005. Tomcat may not be running.

bat自动输入密码_如何给电脑文件夹设置密码？一学就会

ChatGPT新手扫盲

mac m1可用的windows磁盘格式NTFS挂载软件，适用U盘或者硬盘

指纹浏览器是什么？有什么用？有好的指纹浏览器推荐吗？

使用 C# 开发浏览器扩展

谷歌浏览器怎么重发请求_chrome发送post请求操作方法_怎么用chrome浏览器发送post请求-win7之家...

你真正会安装系统么？

最新文章

windows 简单快速的查看电脑的启动和关闭时间【通过命令的形式】

CentOS 7通过yum安装fcitx五笔输入法

kali linux安装五笔输入法

linux centos 7安装极点五笔输入法

苹果切换输入法_落格五笔输入法苹果版下载-落格五笔输入法APP

电脑开机安装流氓软件、弹广告处理办法

[ubuntu] 安装五笔输入法

Ubuntu14.04中文版调出五笔输入法关键步骤

ubuntu下安装fcitx五笔输入法

曾火爆一时的五笔输入法，为什么彻底衰落了？

电脑开机自动推送微信通知

在线五笔输入法 86版是一款基于五笔字型编码方案的在线输入法。该输入法具有界面简洁、操作简单、学习成本低等优点。用户只需在网站上注册账号，即可开始使用。

ubuntu五笔输入法安装_打造最强Windows 10微软拼音输入法 + 600万词库下载

小狼毫五笔输入法设置

五笔字根查询接口,五笔输入法数据

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

15 分钟教你搞一个专属于你的域名邮箱

路由器虚拟网服务器,虚拟路由器的功能有哪些？蒲公英路由器实现虚拟网组建...

zip文件类型如何恢复系统默认值--右键-＞打开方式中无 “资源管理器”选项

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载