Aussagekräftige Metriken und Alarmierung
Messwerte sollen Verhalten abbilden: Durchsatz, Latenz, Fehlerquote, Alter der ältesten Nachricht, Abbruchraten, Kompensationshäufigkeit. Alerting richtet sich nach SLOs, nicht nach Bauchgefühl. Mit Anomalieerkennung und Saisonalität bleiben Benachrichtigungen relevant, vermeiden Alarmmüdigkeit und leiten Menschen zu klaren, dokumentierten Schritten.