AI and Cloudomation - Cloudomation

Aller Anfang ist schwer. So auch, wenn man beginnt, Künstlicher Intelligenz (KI) in einem Unternehmen einzusetzen. Doch was sind dabei die häufigsten Herausforderungen und wie können Sie diese lösen?

Wo anfangen?

Den einfachsten Weg, um KI in Ihrem Unternehmen einzuführen, bieten standardisierte KI-Dienste. Diese ermöglichen einen schnellen Start und erlauben Ihnen, mit geringem Investment erste Erfahrungen mit KI-Modellen zu sammeln.

Google, beispielsweise, zählt zu den größten Playern auf den KI-Markt und bietet eine Vielzahl solcher KI-Diensten an. Dazu gehören unter anderem Speech-to-Text (STT) und Text-to-Speech (TTS) Dienste, die aus einer Audio Datei einen Text generieren und vice versa – und das alles, ohne dass Sie eine einzige Zeile Code selber schreiben oder das KI-Modell selber ausführen müssen. Google bietet auch Dienste zur automatischen Verarbeitung und Tagging von Bildern an, sowie eine Vielzahl weiterer praktischer KI-Anwendungen, die Ihnen als fertige Produkte zur Verfügung stehen.

Es gibt noch viele weitere Firmen, die KI-Dienste anbieten. Einer meiner Favoriten ist OpenCalais, ein sehr mächtiger KI-Dienst für Natural Language Processing (NLP), Named Entity Recognition und Text Tagging. Ein Beispiel: Sie schicken einen Text an die OpenCalais Schnittstelle und bekommen prompt ein Set standardisierter Tags zurück. Echt einfach! Gerade wenn man eine schier endlose Anzahl an Textdokumenten automatisch verarbeiten und kategorisieren muss.

Wo kommt Cloudomation da ins Spiel?

Cloudomation hilft ihnen, diese KI-Dienste in Ihre bereits existierenden Prozesse zu integrieren. Ein Beispiel: Sie müssen Dokumente mittels KI-Diensten taggen? Cloudomation kann die Dokumente aus ihrem Dokumentenmanagementsystem (DMS) extrahieren, sie an den Tagging-Dienst senden und die Dokumente mit deren Tags wieder in das DMS zurückschicken – vollautomatisch und innerhalb von Sekunden.

Nächster Schritt: eigene KI Modelle

Sollten Sie ein eigenes Data Science Team in Ihrem Unternehmen haben, können Sie maßgeschneiderte KI-Modelle basierend auf Ihren eigenen Daten entwickeln. Der häufigste Stolperstein beim Einsatz eigener KI-Modelle liegt jedoch meist nicht in der Entwicklung, sondern in der Inbetriebnahme dieser Modelle. Hier wird es meist schwierig.

Sobald es darum geht, eigene KI-Modelle in die bestehenden Prozesse Ihres Unternehmens einzubetten und an bestehende Systeme anzubinden, sind Data Scientists meist am Ende mit ihrem Latein – und die interne IT sieht sich neben ihren zahlreichen sonstigen Aufgaben mit einem komplett neuen Themenbereich mit ganz eigenen Herausforderungen konfrontiert. Hohe Anforderungen an Rechenleistung, große Datenmengen, das Zusammenfügen von Daten aus verschiedenen Quellen – all das sind Schwierigkeiten, die häufig erst dann in den Vordergrund treten, wenn das KI-Modell bereits entwickelt ist. Wie das Modell nun jeden Tag laufen soll, ist eine ganz eigene und häufig unterschätzte Frage.

Das ist der Punkt, an dem Cloudomation ins Spiel kommt. Als Code-basierte Automatisierungsplattform werden auf Cloudomation automatische Prozesse und Systemintegrationen in Python geschrieben. Python ist eine der verbreitetsten Programmiersprachen unter Data Scientists. Cloudomation ist damit ein Werkzeug, das sich nahtlos in die Arbeitsweise Ihrer Data Scientists einfügt. In Python geschriebene KI-Modelle können ohne Mehraufwand in automatisierte Prozesse auf der Cloudomation Plattform eingebunden werden. Als Integrationsplattform ermöglicht Cloudomation die Anbindung an verschiedene Datenquellen, die Ausführung von Datenaufbereitungsprozessen sowie die Anbindung von Zielsystemen, in denen Folgeaktionen nach der Durchführung eines KI-Modells ausgestoßen werden sollen.

Das ermöglicht ein einfaches tägliches Nutzen Ihrer Modelle. Die Zielgruppe Ihrer Marketing-Kampagne auswählen lassen? Kundenservice-Anfragen klassifizieren? Alles kein Problem!

Wie genau funktioniert das?

Einfache KI-Modelle wie Regressionsmodelle oder Cluster-Analysen können Sie direkt auf der Cloudomation Plattform durchführen. Komplexere Modelle wie neuronale Netze oder Random Forests erfordern jedoch mehr Rechenleistung und mehr Daten. Solche Modelle in Produktion zu setzen, ist daher etwas komplizierter.

Häufige Herausforderungen sind:

Bereitstellung und Vorverarbeitung von Daten: KI-Modelle benötigen frische Daten in großen Mengen und im richtigen Format. Oft ist eine umfangreiche Vorverarbeitung erforderlich, bevor die Daten aggregiert und ausreichend bereinigt sind, um von dem KI-Modell verwendet werden zu können.
Bereitstellung der Infrastruktur für den Betrieb von KI-Modellen – die meist teuer ist, daher sollten die leistungsstarken virtuellen Maschinen auch nur dann laufen, wenn sie benötigt werden.
Integration von KI-Modellen in bestehende Prozesse: Bereitstellung der Ergebnisse des KI-Modells für den nächsten Prozessschritt, z.B. eine Kundenplattform oder App.

Bereitstellung und Vorverarbeitung von Daten

Hier findet sich bereits die erste Hürde. Die meiste Zeit verbringt ein*e Data Scientist mit dem Auswählen, Bereinigen, Umstrukturieren und Zusammenlegen von Daten. Es ist der weniger glamouröse Teil der Arbeit und wird oft als lästige Pflicht angesehen, die vielen Data Scientists keinen Spaß macht. Dennoch ist dieser Schritt unumgänglich in der Modellentwicklung.

Denn während der Modellentwicklung arbeiten Data Scientists oft mit Beispieldaten. Das können beispielsweise Daten von einem bestimmten Tag oder von allen Kunden zu einem bestimmten Zeitpunkt sein. Data Scientists definieren Datenvorverarbeitungsroutinen in Python, nach denen die Daten in einem Format vorliegen, das in Ihrem Modell verwendet werden kann.

Sobald es zu dem Punkt kommt, an dem das Modell regelmäßig ausgeführt werden soll, wird dies zu einem Problem. Die Daten müssen regelmäßig für jeden Modelllauf geliefert werden. Sie benötigen direkte Verbindungen zu Ihren Datenquellen, oft mehrere Datenbanken, Dateisysteme, Blob-Stores usw., die nicht selten in verschiedenen Netzwerken, wie beispielsweise Ihrer privaten Cloud und Ihrem internen Netzwerk, liegen.

Mit Cloudomation ist es einfach möglich, diese verschiedenen Datenquellen miteinander zu verknüpfen, auch über Netzwerkgrenzen hinweg. Die Python-Skripte (oder SQL-Abfragen) der Data Scientists können direkt im Automatisierungsskript von Cloudomation verwendet werden. Der Aufwand, um vom Prototypen des Data Scientists bis zur produktionsreifen Datenbereitstellungspipeline zu gelangen, wird drastisch reduziert.

On-Demand Infrastruktur für Ihre Data Scientists

Beim Arbeiten mit großen Datensätzen stoßen Data Scientists häufig auf Probleme mit ihrer IT-Infrastruktur: z.B. kommt es vor, dass zu wenig Arbeitsspeicher für die Modellrechnung verfügbar ist. Pragmatische Data Scientists lösen das, indem sie ihrem Computing-Cluster einfach Arbeitsspeicher hinzufügen. Bis ihnen der Festplattenspeicher ausgeht. Also fügen sie Festplattenspeicherplatz hinzu. Und so weiter, und so fort. Am Ende haben Sie einen sehr großen und sehr teuren Computing-Cluster – was keine schlechte Sache ist! Denn wenn Sie wollen, dass Ihre Data Scientists gute Big-Data-Modelle entwickeln, müssen Sie ihnen die nötige Rechenleistung zur Verfügung stellen. Das Problem liegt darin, dass Sie unnötigerweise für diese Computing-Cluster bezahlen, wenn Ihre Data Scientists zu Hause sind und die Cluster ungenutzt bleiben.

Der Wert einer On-Demand-Infrastruktur kommt bei solch teuren Clustern, wie sie für die Ausführung von Big-Data-Modellen erforderlich sind, erst richtig zum Tragen. Mit Cloudomation können Sie die gewünschte Infrastruktur entwerfen und sie auf Knopfdruck erstellen. Ja, mit wirklich nur einer einzigen Taste; kein Konfigurations-Albtraum, durch den man sich stundenweise klicken muss.

Das kann Ihnen in zwei Situationen helfen, Geld zu sparen:

On-Demand-Infrastruktur für die Modellentwicklung: Ihre Data Scientists stellen ihren Mammut-Cluster über Cloudomation bereit, wenn sie ihn brauchen und entfernen ihn wieder, wenn sie abends nach Hause gehen.
On-Demand-Infrastruktur für die Modellausführung in der Produktion: Cloudomation stellt einen Computing-Cluster zu dem Zeitpunkt bereit, zu dem die Modellausführung geplant oder ausgelöst wird und entfernt ihn wieder, wenn die Modellberechnungen abgeschlossen sind. Es kann sein, dass der Cluster nur ein paar Minuten pro Tag läuft, was Ihnen viel Geld spart.

In beiden Fällen stellen Sie sicher, dass Ihre Modelle mit optimaler Leistung laufen und Ihre Data Scientists produktiv arbeiten können, während Sie gleichzeitig die Kosten im Griff haben.

Jetzt haben Sie Ihre Daten, Ihre Infrastruktur und Ihr Modell. Es fehlt nur noch der letzte und wichtigste Schritt: die Integration Ihres Modells in die Prozesse Ihres Unternehmens.

Integration der Modelle in vorhandene Prozesse

Je nach Zweck des Modells müssen Sie dessen Ergebnisse in verschiedene Systeme innerhalb Ihres Unternehmens einspeisen. Wenn Sie ein Modell haben, das die Kündigungswahrscheinlichkeit Ihrer Kunden vorhersagt, könnten Sie dieses z.B. in Ihr Marketingkampagnentool integrieren. Dann können Sie den Kunden mit der höchsten Kündigungswahrscheinlichkeit ein maßgeschneidertes Angebot schicken, um sie von der Kündigung abzuhalten. Wenn Sie ein Modell für predictive Maintenance (vorausschauenden Wartung) haben, sollten Sie dessen Ergebnisse in Ihr Arbeitsplanungstool einspeisen, um sicherzustellen, dass die Maschinen, für die eine Wartung vorhergesagt wurde, auch tatsächlich gewartet werden.

Es gibt viele weitere Prozesse, bei denen sich eine Nutzung von KI-Modellen anbietet. Unabhängig davon, was Ihr Modell leistet, sind nach der Berechnung des Modells immer einige weitere Schritte erforderlich, um sicherzustellen, dass die Ergebnisse auch verwendet werden können.

Auch hier ist Cloudomation ein wertvolles Werkzeug. Da Cloudomation mit vielen verschiedenen Systemen und Tools integriert werden kann, können Sie damit die Ergebnisse Ihrer Modellberechnung an ein oder mehrere Zielsysteme weiterleiten: ein Cloud-CRM-Tool, eine On-Premise-Datenbank, ein Kampagnentool, einen Wartungsarbeitsplaner oder beliebige sonstige Systeme.

Fazit

Künstliche Intelligenz (KI) in Ihr Unternehmen einzuführen ist eine Herausforderung. Zuerst müssen Sie entscheiden, ob Sie auf KI-Dienste von Anbietern wie Google zurückgreifen oder Ihre eigenen KI-Modelle intern entwickeln wollen. Sollten Sie intern ein eigenes Data Scientists Team bilden, müssen Sie Ihrem Team ausreichend Rechenleistung zur Verfügung stellen, damit sie gute Modelle entwickeln können. Und sobald ihr Team diese Modelle entwickelt hat, müssen Sie sich der Herausforderung der Integration dieser Modelle stellen: Bereitstellung des Datenzugriffs und der Vorverarbeitung für jeden Modelllauf, Entscheidung über einen Zeitplan oder Auslöser für die Modellberechnung, Bereitstellung der Infrastruktur für die Ausführung des Modells in der Produktion und Verbindung des Modells mit den Zielsystemen, in denen die Ergebnisse verwendet werden sollen.

Die Verwendung eines Tools wie Cloudomation bietet die Chance, diese Herausforderungen zu meistern, indem es Ihnen und Ihrem Data Science Team eine Sammlung an Werkzeugen zur Verfügung stellt, die in die Arbeitsweise von Data Scientists passt. Es hilft Ihnen, Ihre Fähigkeiten voll auszunutzen, Kosten zu kontrollieren und sowohl Zeit als auch Aufwand zu reduzieren, bis Ihre Modelle in der Produktion eingesetzt werden können.