Nachverfolgen des Vorfallwerts in Azure SRE-Agent

Sie haben einen KI-Agent für die Behandlung von Vorfällen bereitgestellt. Die Führungsebene möchte wissen: Reduziert es den manuellen Aufwand? Welche Vorfälle löst es selbstständig? Erzielen wir einen ROI?

Die Beantwortung dieser Fragen bedeutet heute, Telemetrie abfragen, Tickets querverweisen und erraten, welche Antwortpläne funktionieren. Es gibt keine einzige Ansicht, aus der hervorgeht, was Ihr Agent getan hat, wie gut die einzelnen Reaktionspläne funktioniert haben oder ob sich die Mitigationsrate verbessert.

Dashboard für Vorfallmetriken

Navigieren Sie zu Überwachung>Vorfallmetriken, um das Dashboard anzuzeigen.

Screenshot eines Dashboards mit Vorfallmetriken, das fünf Statistikkarten mit Sparkline-Trends und ein Liniendiagramm zur Zusammenfassung der Vorfälle zeigt.

Metrikkarten

Jede Karte zeigt die Anzahl, ihren Anteil an der Gesamtzahl der Vorfälle und eine Sparkline mit der Veränderung gegenüber der Vorwoche:

Metrisch Was sie Ihnen sagt
Überprüfte Vorfälle Gesamtzahl der Vorfälle, die Ihr Agent im ausgewählten Zeitraum untersucht hat
Entschärfung durch Agent Autonom gelöste Vorfälle — die zentrale ROI-Kennzahl
Unterstützt durch einen Agenten Vorfälle, bei denen der Agent Untersuchungsdaten bereitgestellt hat und die Lösung von einem Menschen abgeschlossen wurde
Entschärfung durch Benutzer Vorfälle wurden vollständig von einem Menschen gelöst – potenzielle Automatisierungsmöglichkeiten
Ausstehende Benutzeraktion Vorfälle, die auf menschliche Eingabe warten – Ihr aktueller Backlog

Das Diagramm Vorfallszusammenfassung stellt alle fünf Metriken im Zeitverlauf dar, sodass Sie Trends erkennen können.

Aufschlüsselung des Antwortplans

Unterhalb des Diagramms bricht ein Reaktionsplanraster die Leistung pro Plan auf. Klicken Sie auf einen beliebigen Plan, um den Vorfallverlauf und die Ursachenkategorien zu durchsuchen.

Hier kommt es zu Entscheidungen. Sie können sehen, welche Pläne im autonomen Modus ausgeführt werden, und Vorfälle ohne menschliche Beteiligung im Vergleich zu Plänen beheben, die noch eine Genehmigung erfordern. Ein Plan ohne autonome Abhilfemaßnahmen ist ein Hinweis darauf, seine Anweisungen anzupassen oder seinen Autonomiegrad zu erhöhen.

Intent Met Score

Die Intent Met-Bewertung misst, wie effektiv Ihr Agent die Arbeit auf einer Skala von 1 bis 5 auflösen kann. Nach Abschluss jedes Threads bewertet eine automatisierte Auswertung das Ergebnis:

Ergebnis Bedeutung
5 Hervorragend gelöst — Erwartungen übertroffen
4 Gut gelöst – erfolgreich abgeschlossen
3 Teilweise behoben – Fortschritte gemacht, aber nicht vollständig aufgelöst
2 Unzureichend gelöst – versucht, aber deutlich gescheitert
1 Vollständig ungelöst — das Kernziel wurde nicht erreicht

Die Karte "Intent Met" im Übersicht-Dashboard zeigt den Durchschnittswert aller Threads der letzten 30 Tage mit einer täglichen Trend-Sparkline an. Die Bewertung kombiniert Vorfallthreads, geplante Aufgabenthreads und Unterhaltungen in einer einzigen Qualitätsmetrik.

Die Bewertung von Intent Met ist vollständig automatisch – keine Konfiguration erforderlich.

Tipp

Wenn Ihr Intent-Met-Score niedriger als erwartet ist, prüfen Sie einzelne Threads in Session Insights, um nachzuvollziehen, wo der Agent Schwierigkeiten hatte.

Vorfallübersicht

Wechseln Sie in der linken Randleiste zu Vorfällen , um jeden Vorfall, den Ihr Agent verarbeitet, in Echtzeit anzuzeigen. Jede Zeile verknüpft den Untersuchungsthread des Agents – überprüfen Sie, welche Tools sie aufgerufen hat, welche Nachweise sie gefunden hat und was sie empfohlen hat.

Tägliche Berichte

Ihr Agent generiert automatisierte tägliche Berichte an täglichen Berichten in der linken Randleiste.

Täglicher Bericht mit Sicherheitsergebnissen, Vorfallzusammenfassung, Ressourcenintegritätsmetriken und empfohlenen Aktionen

Wählen Sie ein Datum aus, um den Bericht dieses Tages anzuzeigen. Jeder Bericht umfasst:

  • Sicherheitsergebnisse – CVE-Sicherheitsrisiken in verbundenen Repositorys, gruppiert nach Schweregrad
  • Vorfälle – Aktive, abgemilderte und gelöste Anzahl von Vorfällen mit Details pro Vorfall
  • Zustand und Leistung — Der Zustand jeder Ressource mit Verfügbarkeit, CPU- und Arbeitsspeichermetriken
  • Empfohlene Aktionen – Priorisierte Aktionselemente mit Beschreibungen und geschätzter Leistung

Tägliche Berichte ersetzen die morgendliche Routine „Was ist über Nacht passiert?“ – die Informationen sind bereits zusammengestellt und liegen bereit.

Einschränkungen

Ressource Begrenzung
Scorecarddaten Aufbewahrt in Application Insights (folgt Ihrer Arbeitsbereichsaufbewahrungsrichtlinie)
Tägliche Berichte Einmal pro Tag generiert
Bewertung von "Intent Met" Automatisch auf Vorfälle, geplante Aufgaben und Unterhaltungen angewendet

Erste Schritte

Die Vorfallverfolgung ist integriert — öffnen Sie Monitor>Vorfallmetriken, sobald Ihr Agent mit der Bearbeitung von Vorfällen beginnt.

Ressource Was Sie lernen werden
Einrichten eines Antwortplans Konfigurieren von Antwortplänen zum Generieren von Nachverfolgungsdaten
Capability Welchen Mehrwert es bietet
Automatisieren der Reaktion auf Vorfälle Konfigurieren von Reaktionsplänen für jeden Vorfalltyp
Automatisieren von Aufgaben in einem Zeitplan Richten Sie wiederkehrende Aufgaben ein, die sich in den „Intent Met“-Bewertungen widerspiegeln
Überwachen der Agent-Nutzung AAU-Nutzung zusammen mit Metriken zu Vorfällen verfolgen
Agentenerkenntnisse überprüfen Qualitative Bewertung der Leistung des Agenten pro Thread
Überwachungs-Agent-Aktionen Überprüfen bestimmter Aktionen bei Vorfalluntersuchungen