Deine konkreten Aufgaben umfassen:
- Bearbeitung der gesamten Observability-Kette, vom Aufsetzen der Telemetrie in denServices, Verarbeitung im Cluster bis zur Visualisierung und Analyse in Dashboards
- Erstellung und Weiterentwicklung von Dashboards (Metrics, Logs, KPIs) für Engineering, Management und Sales
- Definition und Pflege von Alerts für unsere Site Reliability Engineers
- Kommunikation von Endnutzer-KPIs an das Management- und Sales-Team
- Mitarbeit an der Weiterentwicklung unserer Monitoring-Architektur (z. B. OpenTelemetry, Prometheus, Grafana)
