Je voudrais générer une alerte par exemple lorsque le compteur metricX chute de plus de 70% à tout moment pendant 5 minutes.

Voici mon fichier YAML de règle pour générer une alerte:

groups:
- name: MetricX dip
  rules:
  - alert: MetricX dip by more than 70%
    expr: 
    for: 0m
    labels:
      severity: warning
    annotations:
      descriptions: MetricX has been dropped by more than 70%

J'aimerais voir un guide sur la façon d'écrire des expressions promQL dans un fichier de règles pour mesurer la baisse du pourcentage de metricX à tout moment pendant 5 minutes.

1
Santosh M. 24 févr. 2021 à 20:12

2 réponses

Meilleure réponse

Après avoir bien compris promql, c'est ce que j'ai implémenté sous une forme simple qui répond à mes besoins.

(-100 * rate(MetricX[2m]) / rate(MetricX[5m] offset 1m)) > 70 

MetricX est un compteur. Donc, j'ai utilisé rate dans le calcul de la baisse en pourcentage. Mon prométhée scrape_interval est à 1 min. Donc, le creux est calculé sur 2 minutes qui suit 5 minutes.

J'espère que cela aide d'autres personnes.

1
Santosh M. 10 mars 2021 à 03:50

Essayez la requête suivante:

rate(metricX[2m]) < 0.7 * (rate(metricX[2m] offset 5m))
-1
valyala 11 mars 2021 à 10:38