Ein IT-Vorfall ist jede ungeplante Unterbrechung oder Qualitätsminderung eines IT-Dienstes. Vorfälle reichen von kleineren Problemen, wie einer langsamen Anwendung, bis hin zu kritischen Störungen, einschließlich Serverausfällen. Das Vorfallmanagement (IM) zielt darauf ab, diese Vorfälle effektiv zu bewältigen und sicherzustellen, dass IT-Dienste umgehend wiederhergestellt werden.
Ein Ereignis, das die Vertraulichkeit, Integrität oder Verfügbarkeit von Informationen oder eines Informationssystems gefährden oder eine Bedrohung für Sicherheitsrichtlinien oder -verfahren darstellen kann.
Die Vorfallreaktion (IR) ist ein organisierter Prozess, dem eine Organisation folgt, um sich von einem Sicherheitsvorfall zu erholen. Das Hauptziel eines Cybersicherheits-Vorfallreaktionsprogramms besteht darin, den Schaden zu begrenzen und die Kosten und Wiederherstellungszeit einer Sicherheitsverletzung zu reduzieren, um die Geschäftskontinuität zu gewährleisten und die Integrität von Systemen und Daten zu bewahren.
\ Vorfälle sollten unterschiedliche Schweregradebenen haben, da nicht alle Ereignisse die gleichen Auswirkungen auf das Geschäft haben. Die Zuweisung einer Schweregradebene ist ein kritischer Schritt, der die Geschwindigkeit und den Umfang der für die Reaktion bereitgestellten Ressourcen bestimmt.
Die allgemeine Nutzung von Methoden der Künstlichen Intelligenz (KI), einschließlich Generativer KI (GenAI) und großer Sprachmodelle (LLMs) für persönliche und berufliche Aktivitäten, wurde durch technologische Fortschritte in Generative Pre-trained Transformer (GPT)-Systemen möglich. GenAI-Anwendungen haben neue Sicherheitsrisiken geschaffen, die von Informationssicherheitsteams verlangen, ihre Schutzverantwortung auf diese Systeme auszuweiten.
\ Zu den möglichen Vorfallarten gehören Chatbots, die Kunden in die Irre führen, durch AI Agents durchgesickerte Daten und vieles mehr. Security Operations Center (SOC) und Incident Response (IR)-Teams benötigen eine angewandte Schweregrad-Matrix für KI-Vorfälle, um ein standardisiertes System zu schaffen, das die tatsächlichen Auswirkungen und Schweregradebenen von KI-bezogenen Ereignissen bestimmt.
\ Das im Artikel beschriebene Tool dient dazu, Vorfallschweregradebenen für die richtige IR-Ressourcenverteilung zu bestimmen. Das neue System integriert numerische Daten mit menschlichen Bewertungsfaktoren durch die Verwendung einer matrixbasierten Bewertungsmethode.
\ Die Matrix enthält fünf 'Auswirkungsdimensionen', die die Effekte auf KI-Funktionalität, Datenintegrität, Betriebsverfügbarkeit, Reputation und Abhilfemaßnahmen bewerten.
\ Das Tool ermöglicht die Bewertung jeder Dimension durch ein Bewertungssystem, das niedrige (1), mittlere (2), hohe (3) oder kritische (4) Werte haben kann.
Eine vorläufige Bewertung muss vor der Erklärung eines KI-Vorfalls erfolgen, da sie hilft, den Bedarf an erheblichen Ressourcen und sofortigen Triage-Verfahren festzustellen. KI-Systeme besitzen besondere Eigenschaften, die sie von allen anderen Systemen unterscheiden.
\ Die Bewertung muss identifizieren, welche KI-Systeme an dem Vorfall beteiligt waren und ihre Bedeutung für die Betriebssicherheit und Geschäftsabläufe bestimmen. Einige Beispiele für Systeme sind Chatbots, Computer-Vision-Modelle, Empfehlungssysteme, benutzerdefinierte Agenten usw. Die Bewertung der funktionalen Auswirkungen erfordert, dass Forscher analysieren, wie sich das Betriebsdesign ändert, wenn KI-Systeme auf gegnerische Angriffe stoßen.
\ Das System zeigt verschiedene Fehlfunktionsebenen, die kleinere Leistungsprobleme umfassen, die Genauigkeit und Geschwindigkeit beeinträchtigen, sowie größere Probleme, die zu Systemausfällen und gefährlichen oder unfairen Ergebnissen führen. Einige Leistungsprobleme können sich um verringerte Genauigkeit und erhöhte Latenz bei Antworten des Modells drehen.
\ Das System erfordert die Identifizierung von zwei Dingen gemäß dem ATLAS-Framework: die Art der erkannten Anomalie und ob sie aus einem gegnerischen Angriff oder einer Systemfehlfunktion stammt. MITRE ATLAS (MITRE, 2025) ermöglicht es Benutzern, bestimmte Angriffstechniken zu identifizieren (z.B. LLM Prompt Injection, Poison Training Data, Denial of AI Service), die sowohl die Angriffsziele als auch ihre entsprechende Klassifizierung zeigen.
\ Die Bewertung umfasst die Überprüfung der Datenintegrität und Vertraulichkeit durch Prüfung auf Kompromittierung von Trainings- oder Validierungsdaten und sensiblen Informationen (PII, PHI, proprietäres Modell-IP) sowie Datenabfluss. Der Bewertungsprozess muss bestimmen, wie stark die Ausgabe des KI-Systems betriebliche und systemische Geschäftsdienstelemente beeinflusst, die auf seinen Ergebnissen basieren. Es sollte eine Bestimmung über das Ausmaß der physischen Gefahr sowie des finanziellen Verlusts für das Unternehmen getroffen werden.
Die Bewertung erklärter Vorfälle benötigt standardisierte Methoden, um geeignete Reaktionsverfahren festzulegen. Die Bewertung des Vorfallschweregrads erfordert sowohl numerische Datenpunkte als auch menschliches Urteilsvermögen durch matrixbasierte Systeme, um eine genaue Bewertung zu erreichen. Der Vorfallschweregrad erreicht seinen Maximalwert aus jeder relevanten Auswirkungskategorie, was es schwerwiegenden Elementen ermöglicht, den gesamten Vorfall auf einen höheren Prioritätsstatus anzuheben.
Das Bewertungssystem für jede relevante Dimension (A-E) reicht von 1 bis 4, um den Vorfallschweregrad für Organisationen zu bestimmen. Die Vorfallschweregradbeurteilung wird zum maximalen Wert aus allen bewerteten Dimensionen, was den vollständigen Schweregrad bestimmt. Der Vorfall kann den Status 'Kritisch' erreichen, wenn der Funktionale Auswirkungswert '2' ist, aber die Datenauswirkung '4' erreicht, während andere Dimensionen zwischen '1' und '2' liegen. Der strukturierte Bewertungsprozess ermöglicht es Organisationen, standardisierte Ergebnisse zu erhalten und gleichzeitig den Bewertungsprozess zu beschleunigen.
\ Organisationen müssen sich zwischen der Implementierung dieses Frameworks in seiner jetzigen Form oder der Erstellung ihrer eigenen Version entscheiden, die ihren bestehenden Berechnungssystemen entspricht, um KI-Vorfallschweregrade festzulegen.
Die Berechnung des Schweregrads hilft Vorfallreaktionsteams zu entscheiden, welche Risiken bei der Planung ihrer Reaktion und Ressourcenzuweisung sofortige Aufmerksamkeit benötigen. Die Reaktion auf schwerwiegende Vorfälle erfordert den sofortigen Einsatz eines spezialisierten Teams, bestehend aus Cybersicherheitsexperten, KI/ML-Ingenieuren, Datenwissenschaftlern, Rechtsexperten und PR-Vertretern. Die Reaktion auf Vorfälle mit niedrigeren Schweregraden benötigt weniger Personal zu deren Bewältigung.
\ Kritische Vorfälle erfordern sofortige Benachrichtigung von Führungskräften und Vorstandsmitgliedern, Rechtsteam, Aufsichtsbehörden und öffentlichen Stakeholdern, aber Vorfälle mit niedrigem Schweregrad sollten nur begrenzte interne Informationsfreigabe erhalten. Systemabschaltungen zusammen mit API-Trennungen fungieren als erste Verteidigungsmechanismen, die verhindern, dass sich Vorfälle mit hohem Schweregrad ausbreiten. Der Eindämmungsprozess für Vorfälle mit niedrigerem Schweregrad muss größere Betriebsunterbrechungen verhindern.

