Der Einsatz von künstlicher Intelligenz im Bereich der IT nimmt immer mehr zu und Produkte ohne das Label «AI» sind nur noch schwer zu verkaufen. Gerade in Bereichen mit grossen Datenmengen macht eine Unterstützung durch AI augenscheinlich Sinn. In diesem Blog möchte ich hier den Einsatz im Bereich IT Operations Management beleuchten.
Was ist AI-Ops eigentlich?
Der Begriff AIOPs wurde 2016 von Gartner erfunden und umfasst vereinfacht gesagt, die Anwendung von» machine learning (ML)» und «data science» im Bereich der IT-Infrastruktur. Der Einsatzzweck ist die möglichst frühe Erkennung von Beeinträchtigungen der IT-Infrastruktur, bevor sie zu Ausfällen führt. So werden zum Beispiel Log Files analysiert, ob sich dort Warn- und Fehlermeldungen häufen und wenn ja dann werden diese Ergebnisse dem Anwender entsprechend präsentiert. Dadurch besteht die Möglichkeit die Ursache des potenziellen Ausfalls zu beheben, bevor dieser reale Auswirkungen hat.
AIOps innerhalb von ServiceNow
ServiceNow ist eine Enterprise Plattform Applikation mit deren Hilfe unstrukturierte Prozesse strukturiert und später automatisiert werden können. Diese Funktionalität ist nicht nur auf die IT beschränkt, sondern umfasst auch viele andere Geschäftsbereiche; HR, Projekt Management, CSM, Enterprise Asset Management, Operation Technology um nur ein paar zu nennen. Auch im Angesicht der zunehmenden und nicht mehr zu vermeidenden Virtualisierung benötigen wir immer noch Infrastruktur und Applikationen, selbst wenn diese nicht mehr in unseren eigenen Rechenzentren, sondern von einem Cloud Provider betrieben werden. Um diese Infrastruktur zu verwalten, gibt es entsprechende Applikationen innerhalb von ServiceNow, diese gehören zu IT Operations Management (ITOM). Seit ca. 1 Jahr wird bei ServiceNow die Synergie von ITOM und IT Service Management hervorgehoben und der umfassende Begriff ist «Service Operations». So werden Daten einfacher und übersichtlicher in die Prozesse integriert. In diesem Bereich findet man dann auch die Applikation «AI-Powered Service Operations (AIPSO)».
Mit AIPSO sollen unstrukturierte und nicht miteinander verbunden Daten strukturiert und miteinander in Bezug gestellt werden, wie es dieses Schaubild aufzeigt.
Neben den integrierten Daten geht es auch darum die Prozesse zu standardisieren, zu optimieren und zu automatisieren.
Hauptsächlich besteht AIPSO aus den Komponenten «Health Log Analytics (HLA)», «Metric Intelligence» und «Event Management». Damit AIPSO seine volle Wirkung entfalten kann, sollte AIPSO auf eine strukturierte und aktuelle CMDB aufsetzen. Optimalerweise wird diese CMDB die Servicestruktur enthalten und komplett automatisch gepflegt werden.
In der Erfassungsphase (Ingestion) werden die Log Dateien von Servern, Netzkomponenten, Applikationen, Log Verzeichnissen eingesammelt und an HLA übergeben. In der nächsten Phase werden diese Daten entsprechend strukturiert. Dies passiert automatisch, z.B. Prozess IDs, Log Level, kann aber auch nach eigenen Bedürfnissen ergänzt und manuell durchgeführt werden. In der Anreicherungsphase (Enrichment) werden die kontextbezogenen Eigenschaften aus den Log Dateien gezogen, so dass individuelle Meldungen, z.B. fehlgeschlagener Verbindungsaufbau zu Server XYZ mit IP und Port generalisiert werden können. In der Analyse Phase werden die bisher gesammelten Daten analysiert und «abnormales» Verhalten herausgefiltert, z.B. Anzahl von Logmeldungen innerhalb eines bestimmten Zeitraumes, fehlgeschlagene Anmeldung von einem bestimmten Service etc. In der ML & AI Phase werden durch ML-Algorithmen und AI künstliche Schwellenwerte ermittelt und Verhaltensmuster ermittelt. So kann zum Beispiel eine Häufung von Log Einträgen zu einem bestimmten Zeitpunkt normal sein, da dort gerade eine Datenübertragung stattfindet oder die oben angeführten Verbindungsabbrüche endeten mit einer erfolgreichem Verbindungsaufbau und die weiteren verbindungsaufbauten waren auf Anhieb erfolgreich. Sind jetzt noch relevante Auffälligkeiten vorhanden, dann wird dazu ein Alarm im Event Management angelegt. Diese Alarme werden im Service Operations Arbeitsbereich übersichtlich in Dashboards und Listen angezeigt und werden dort entsprechend bearbeitet. Dabei können Alarme auch als «irrelevant» eingestuft werden, so dass zu diesem Verhalten beim nächsten Mal kein Alarm mehr angelegt wird. Besteht die Fehlerbehebung aus strukturierten Schritten, dann können diese Schritte auch mit Hilfe von ServiceNow automatisiert werden.
Hört sich gut an – kaufe ich
Ja diese Anwendungsfälle hören sich gut an und die Präsentationen und Demos der Hersteller – nicht nur von ServiceNow – sehen immer sehr vielversprechend aus, aber fast immer werden die notwendigen Vorarbeiten ausgeblendet. Hierzu gehören unter anderem folgende Fragestellungen, die im Vorfeld geklärt werden sollten:
- Welche Applikationen sind geschäftskritisch?
- Welche Informationen werden in die Log Files geschrieben?
- Welche davon sind relevant und weisen auf einen Fehler hin?
- Welche Schwellenwerte gibt es?
- Tritt der Fall häufig auf und hat schwerwiegende Auswirkungen?
- Lohnt sich der Aufwand?
Neben den Kosten für die AIOPs Lösung kommen also noch entsprechende Aufwände dazu, um diese Lösung zu implementieren. Diese Ausgaben müssen im Vorfeld kalkuliert und im Nachhinein berechnet werden, nur so kann ein positiver Return on Investment (ROI) nachgewiesen werden und der Erfolg dieses Projektes beurteilt werden.
AI erleichtert uns die Durchführung solcher Optimierungsmassnahmen, aber die notwendigen Vorarbeiten «Vereinfachen» und «Strukturieren» fallen immer noch vor dem «Optimieren» und «Automatisieren» mit AI an. Die «alten» Methoden wie der Deming Cycle «Plan – Do – Check – Act» und der 7-stufige kontinuierliche Verbesserungsprozess von ITIL sind daher eine notwendige Voraussetzung für den Erfolg von AI-Ops.
Ebenso darf bei der Einführung einer AI Lösung Organisational Change Management nicht vergessen werden. Gerade jetzt muss eine offene und transparente Kommunikation stattfinden, um zu verhindern, dass Ängste bei den Mitarbeitern entstehen. Es muss klar kommuniziert werden welche Ziele mit der Initiative verfolgt werden, so dass keine unnötigen Widerstände entstehen. Auch wenn wir in der IT arbeiten, hängt der Erfolg von Projekten immer noch von den Menschen ab, die diese Projekte miteinander durchführen. Nur so kann AIOPs effizient eingeführt und genutzt werden. Aber bevor es so weit ist, ist noch eine Frage zu beantworten:
Warum?
Diese Fragen sollte man sich vor jeder AI-Initiative stellen: «Was will ich damit erreichen? Für welche Geschäftsbereiche mache ich das? Welches Problem möchte ich damit lösen?» Erst wenn diese Fragen beantwortet sind, kann die passende Lösung für den Anwendungsfall gefunden werden.
Diese AI Lösung muss in AI das Gesamtkonzept des Unternehmens passen. Im Idealfall wird diese Initiative von der Geschäftsführung explizit befürwortet und unterstützt, so dass Hindernisse während der Durchführung beseitigt werden können. Dies ist umso wichtiger, weil wenn die Initiative scheitern sollte, dann wird es schwierig werden weitere AI Massnahmen durchzuführen, auch wenn sie einen Nutzen für das Unternehmen darstellen.
Wir unterstützen euch gerne dabei die für euch passende AI-Strategie zu finden und wenn möglich mit Hilfe von ServiceNow zu implementieren und auch bei den notwendigen Vorarbeiten stehen wir euch gerne zur Seite. Zögern Sie nicht und kontaktieren Sie uns unter marketing@bithawk.ch oder 058 226 01 01. Gerne nehmen wir uns die Zeit, um Ihre individuellen Anliegen oder Fragen dazu zu besprechen.
Weitere Themen auf unserem Blog
Zukunftsbeständige IT: Konflikt moderne Technik und Energieeffizienz?