成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

prometheus告警問題分析

運維 系統運維
最近運維prometheus的過程中發現,有的時候它應該發送告警,可實際卻沒有;有的時候,不該發送告警卻發送了;還有的時候,告警出現明顯的延遲。為了找出其中的具體原因,特地去查閱了一些資料,同時也參考了官網的相關資料。希望對大家在今后使用prometheus有所幫助。

[[390597]]

今天來說一下我在使用prometheus過程中遇到的告警問題。

問題分析

最近運維prometheus的過程中發現,有的時候它應該發送告警,可實際卻沒有;有的時候,不該發送告警卻發送了;還有的時候,告警出現明顯的延遲。為了找出其中的具體原因,特地去查閱了一些資料,同時也參考了官網的相關資料。希望對大家在今后使用prometheus有所幫助。

先來看一下官網提供的prometheus和alertmanager的一些默認的重要配置。如下所示:

  1. # promtheus 
  2. global
  3.   # How frequently to scrape targets by default. 從目標抓取監控數據的間隔 
  4.   [ scrape_interval: <duration> | default = 1m ] 
  5.   # How long until a scrape request times out. 從目標住區數據的超時時間 
  6.   [ scrape_timeout: <duration> | default = 10s ] 
  7.   # How frequently to evaluate rules. 告警規則評估的時間間隔 
  8.   [ evaluation_interval: <duration> | default = 1m ] 
  9. # alertmanager 
  10. # How long to initially wait to send a notification for a group 
  11. of alerts. Allows to wait for an inhibiting alert to arrive or collect 
  12. # more initial alerts for the same group. (Usually ~0s to few minutes.) 
  13. [ group_wait: <duration> | default = 30s ] # 初次發送告警的等待時間 
  14.  
  15. # How long to wait before sending a notification about new alerts that 
  16. # are added to a group of alerts for which an initial notification has 
  17. # already been sent. (Usually ~5m or more.) 
  18. [ group_interval: <duration> | default = 5m ] 同一個組其他新發生的告警發送時間間隔 
  19.  
  20. # How long to wait before sending a notification again if it has already 
  21. # been sent successfully for an alert. (Usually ~3h or more). 
  22. [ repeat_interval: <duration> | default = 4h ] 重復發送同一個告警的時間間隔 

通過上面的配置,我們來看一下整個告警的流程。通過流程去發現問題。


根據上圖以及配置來看,prometheus抓取數據后,根據告警規則計算,表達式為真時,進入pending狀態,當持續時間超過for配置的時間后進入active狀態;數據同時會推送至alertmanager,在經過group_wait后發送通知。

告警延遲或頻發

根據整個告警流程來看,在數據到達alertmanager后,如果group_wait設置越大,則收到告警的時間也就越長,也就會造成告警延遲;同理,如果group_wait設置過小,則頻繁收到告警。因此,需要按照具體場景進行設置。

不該告警的時候告警了

prometheus每經過scrape_interval時間向target拉取數據,再進行計算。與此同時,target的數據可能已經恢復正常了,也就是說,在for計算過程中,原數據已經恢復了正常,但是被告警跳過了,達到了持續時間,就觸發了告警,也就發送了告警通知。但從grafana中看,認為數據正常,不應發送告警。這是因為grafana以prometheus為數據源時,是range query,而不是像告警數據那樣稀疏的。

 

責任編輯:姜華 來源: 運維開發故事
相關推薦

2021-08-27 07:06:10

應用

2023-09-12 07:11:33

Prometheus聚合告警GPT

2021-02-18 15:36:13

PrometheusAlertmanageGrafana

2023-03-26 08:41:37

2024-07-31 08:02:26

Prometheus服務器代碼

2022-07-29 21:23:54

Grafana微服務

2020-12-30 05:34:25

監控PrometheusGrafana

2022-09-04 17:53:20

Prometheus開源

2023-11-24 16:57:53

2023-04-26 08:20:54

2025-04-09 08:05:00

運維告警Prometheus

2017-07-14 14:52:25

MySQLAborted告警案例分析

2023-02-10 09:21:31

PG數據庫內存

2023-11-13 08:15:36

2009-12-29 15:33:54

無線接入網

2022-07-26 09:34:23

監控系統

2022-07-25 14:24:53

Docker容器安全

2022-08-30 13:03:39

prometheusAlert

2020-12-17 09:25:46

運維Prometheus監控

2020-08-04 17:42:28

MyBatis版本升級
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 99在线视频观看 | 久久99蜜桃综合影院免费观看 | 日韩中文字幕视频 | 亚洲精品国产a久久久久久 中文字幕一区二区三区四区五区 | 看片wwwwwwwwwww | 亚洲欧美中文日韩在线v日本 | 亚洲精品麻豆 | 中文在线观看视频 | 久久久久国产一区二区 | 亚洲一区二区三区在线 | 97视频在线看 | 东京久久| 狠狠色综合欧美激情 | 欧美一区二区免费电影 | 中文字幕1区2区3区 日韩在线视频免费观看 | 久久黄色网 | 亚洲精品资源 | 中文字幕av在线 | 久久精品99国产精品日本 | 国产精品久久久久久中文字 | 国产成人jvid在线播放 | 风间由美一区二区三区在线观看 | 天天宗合网 | 久久国产高清 | 日本久久网 | 国产精品成人久久久久 | 国产高清无av久久 | 亚洲综合色视频在线观看 | 亚洲一区二区三区四区五区中文 | 国产日韩免费视频 | 国产在线精品一区二区三区 | 午夜影院免费体验区 | 一a级片| 五月天天丁香婷婷在线中 | 自拍视频国产 | 国产成人免费视频 | 久久中文字幕一区 | 国产一级在线 | 欧美一级黄色片 | 亚洲天堂网站 | 国产精品日日夜夜 |