stackrox · ludydoo · Jan 27, 2025
@@ -84,7 +84,7 @@ spec:
       rules:
         - alert: RHACSFleetshardOperatorContainerDown
           expr: |
-            avg_over_time(kube_pod_container_status_ready{pod=~"rhacs-operator-controller-manager-.*"}[10m]) < 0.5
+            avg_over_time(kube_pod_container_status_ready{pod=~"rhacs-operator-.*"}[10m]) < 0.5
           for: 20m
           labels:
             severity: critical
@@ -94,7 +94,7 @@ spec:
             sop_url: "https://gitlab.cee.redhat.com/stackrox/acs-managed-service-runbooks/blob/master/sops/dp-011-rhacs-operator-unavailable.md"
         - alert: RHACSFleetshardOperatorContainerFrequentlyRestarting
           expr: |
-            increase(kube_pod_container_status_restarts_total{pod=~"rhacs-operator-controller-manager-.*"}[30m]) > 3
+            increase(kube_pod_container_status_restarts_total{pod=~"rhacs-operator-.*"}[30m]) > 3
           labels:
             severity: critical
           annotations:

@@ -6,9 +6,9 @@ evaluation_interval: 1m
 tests:
   - interval: 1m
     input_series:
-      - series: kube_pod_container_status_ready{namespace="rhacs", pod="rhacs-operator-controller-manager-1234", container="manager"}
+      - series: kube_pod_container_status_ready{namespace="rhacs", pod="rhacs-operator-1234", container="manager"}
         values: "1+0x10 0+0x50"
-      - series: kube_pod_container_status_ready{namespace="rhacs", pod="rhacs-operator-controller-manager-1234", container="kube-rbac-proxy"}
+      - series: kube_pod_container_status_ready{namespace="rhacs", pod="rhacs-operator-1234", container="kube-rbac-proxy"}
         values: "1+0x10 0+0x50"
     alert_rule_test:
       - eval_time: 15m
@@ -21,19 +21,19 @@ tests:
               alertname: RHACSFleetshardOperatorContainerDown
               container: manager
               namespace: rhacs
-              pod: rhacs-operator-controller-manager-1234
+              pod: rhacs-operator-1234
               severity: critical
             exp_annotations:
-              summary: "Fleetshard operator container `rhacs-operator-controller-manager-1234/manager` in namespace `rhacs` is down or in a CrashLoopBackOff status."
-              description: "Fleetshard operator container `rhacs-operator-controller-manager-1234/manager` in namespace `rhacs` has been down or in a CrashLoopBackOff status for at least 10 minutes."
+              summary: "Fleetshard operator container `rhacs-operator-1234/manager` in namespace `rhacs` is down or in a CrashLoopBackOff status."
+              description: "Fleetshard operator container `rhacs-operator-1234/manager` in namespace `rhacs` has been down or in a CrashLoopBackOff status for at least 10 minutes."
               sop_url: "https://gitlab.cee.redhat.com/stackrox/acs-managed-service-runbooks/blob/master/sops/dp-011-rhacs-operator-unavailable.md"
           - exp_labels:
               alertname: RHACSFleetshardOperatorContainerDown
               container: kube-rbac-proxy
               namespace: rhacs
-              pod: rhacs-operator-controller-manager-1234
+              pod: rhacs-operator-1234
               severity: critical
             exp_annotations:
-              summary: "Fleetshard operator container `rhacs-operator-controller-manager-1234/kube-rbac-proxy` in namespace `rhacs` is down or in a CrashLoopBackOff status."
-              description: "Fleetshard operator container `rhacs-operator-controller-manager-1234/kube-rbac-proxy` in namespace `rhacs` has been down or in a CrashLoopBackOff status for at least 10 minutes."
+              summary: "Fleetshard operator container `rhacs-operator-1234/kube-rbac-proxy` in namespace `rhacs` is down or in a CrashLoopBackOff status."
+              description: "Fleetshard operator container `rhacs-operator-1234/kube-rbac-proxy` in namespace `rhacs` has been down or in a CrashLoopBackOff status for at least 10 minutes."
               sop_url: "https://gitlab.cee.redhat.com/stackrox/acs-managed-service-runbooks/blob/master/sops/dp-011-rhacs-operator-unavailable.md"
@@ -6,9 +6,9 @@ evaluation_interval: 1m
 tests:
   - interval: 1m
     input_series:
-      - series: kube_pod_container_status_restarts_total{namespace="rhacs", pod="rhacs-operator-controller-manager-1234", container="manager"}
+      - series: kube_pod_container_status_restarts_total{namespace="rhacs", pod="rhacs-operator-1234", container="manager"}
         values: "0+0x30 1+1x10 4+1x20"
-      - series: kube_pod_container_status_restarts_total{namespace="rhacs", pod="rhacs-operator-controller-manager-1234", container="kube-rbac-proxy"}
+      - series: kube_pod_container_status_restarts_total{namespace="rhacs", pod="rhacs-operator-1234", container="kube-rbac-proxy"}
         values: "0+0x30 1+1x10 4+1x20"
     alert_rule_test:
       - eval_time: 30m
@@ -21,19 +21,19 @@ tests:
               alertname: RHACSFleetshardOperatorContainerFrequentlyRestarting
               container: manager
               namespace: rhacs
-              pod: rhacs-operator-controller-manager-1234
+              pod: rhacs-operator-1234
               severity: critical
             exp_annotations:
-              summary: "Fleetshard operator container `rhacs-operator-controller-manager-1234/manager` in namespace `rhacs` restarted more than 3 times."
-              description: "Fleetshard operator container `rhacs-operator-controller-manager-1234/manager` in namespace `rhacs` has restarted more than 3 times during the last 30 minutes."
+              summary: "Fleetshard operator container `rhacs-operator-1234/manager` in namespace `rhacs` restarted more than 3 times."
+              description: "Fleetshard operator container `rhacs-operator-1234/manager` in namespace `rhacs` has restarted more than 3 times during the last 30 minutes."
               sop_url: "https://gitlab.cee.redhat.com/stackrox/acs-managed-service-runbooks/blob/master/sops/dp-011-rhacs-operator-unavailable.md"
           - exp_labels:
               alertname: RHACSFleetshardOperatorContainerFrequentlyRestarting
               container: kube-rbac-proxy
               namespace: rhacs
-              pod: rhacs-operator-controller-manager-1234
+              pod: rhacs-operator-1234
               severity: critical
             exp_annotations:
-              summary: "Fleetshard operator container `rhacs-operator-controller-manager-1234/kube-rbac-proxy` in namespace `rhacs` restarted more than 3 times."
-              description: "Fleetshard operator container `rhacs-operator-controller-manager-1234/kube-rbac-proxy` in namespace `rhacs` has restarted more than 3 times during the last 30 minutes."
+              summary: "Fleetshard operator container `rhacs-operator-1234/kube-rbac-proxy` in namespace `rhacs` restarted more than 3 times."
+              description: "Fleetshard operator container `rhacs-operator-1234/kube-rbac-proxy` in namespace `rhacs` has restarted more than 3 times during the last 30 minutes."
               sop_url: "https://gitlab.cee.redhat.com/stackrox/acs-managed-service-runbooks/blob/master/sops/dp-011-rhacs-operator-unavailable.md"