zurück
Markt & Innovationen

Künstliche Intelligenz (KI) im Stammdatenmanagement – Heute und in Zukunft

,Lesezeit ca. 6 Minuten

In der Vergangenheit wurde das Thema Stammdatenmanagement sehr oft als rein technisches Problem angesehen, das gedanklich wohl optimal in der IT-Abteilung aufgehoben wäre. Dieser verfälschte Eindruck hat sich jedoch im Laufe der Zeit relativiert. Die Fachabteilungen rückten bei diesem Thema mehr und mehr in den Mittelpunkt.

Stammdatenmanagement – Heute

Denn sie kennen die inhaltlichen Anforderungen an korrekten Daten am besten und verfügen über das Detailwissen in den jeweiligen Geschäftsprozessen des Unternehmens. Mittlerweile kann man sagen, sie sind die Treiber in Stammdatenmanagement-Projekten. Die IT-Abteilung leistet nur noch unterstützende Tätigkeiten, wie zum Beispiel die Software-Installation oder die notwendige Administration der Infrastruktur.

 

Der Run auf gute Stammdaten hat begonnen. Sie sind die Grundlage für effiziente und funktionierende Geschäftsprozesse. Die Mühen für eine gute Stammdaten-Qualität sind groß. Mit ausgeklügelten Geschäftsregeln wird heutzutage versucht, den Wildwuchs der Daten in den Griff zu bekommen. Dies lässt sich aber oft nur mit großem Domänen-Wissen ermöglichen. Aufwändige Pflegearbeiten mit unzähligen Regel-Varianten lassen schnell den Überblick verlieren und erhöhen das Fehlerpotenzial.

Stammdatenmanagement – In Zukunft

Intelligente, selbst lernende Mappings

Die Anreicherung der Stammdaten in Systemen erfolgt oftmals durch externe Daten aus anderen Systemen, welche mittels Dateien oder Web-Services übertragen werden. Nicht nur bei Transition-Projekten, sondern auch im täglichen Alltag müssen zum Beispiel Daten von Geschäftspartnern aus den unterschiedlichsten Systemen hinzugezogen werden. Hierzu ist es notwendig, diese Daten in die richtigen Strukturen und Tabellen zu überführen.

 

Um ein vordefiniertes Mapping (der eingehenden Daten) in die entsprechenden Ziel-Tabellen beziehungsweise Tabellen-Felder kommt man nicht herum. Wiederkehrende Dateien sind in der Regel nicht gleich aufgebaut und besitzen oft unterschiedliche Namen. Deshalb ist es schwierig, einen automatisierten Prozess für eingehende Stammdaten zu integrieren.

 

Ein intelligentes Mapping, welches automatisch die tabellarisch aufgebauten Datei-Inhalte erkennt und mit den richtigen Tabellen-Feldern mappt, ist hierfür die Lösung. Exakte Mapping-Regeln sind nicht mehr notwendig. Dynamisch und selbständig erfolgt der Aufbau des Mappings mittels Maschinellen Lernens.

 

Harmonisierung von Stammdaten mittels KI

Die Harmonisierung von Stammdaten ist eine Herkules-Aufgabe. Vor allem dann, wenn die Daten aus heterogenen Systemen stammen und Dubletten (auch mit Domain-Wissen) nur schwer erkennbar sind. Fragestellungen (wie zum Beispiel "was sind meine golden Records?", "wie wäre die ideale Vorgehensweise?" oder "welche Verfahren und Algorithmen sind zielführend?") sind nur schwer zu beantworten, bevor keine umfangreichen und intensiven Analyse- und Recherche-Tätigkeiten für Feldversuche oder Prototypen unternommen wurden.

 

Was sind dafür die Mittel der Wahl? Sind es intelligente Suchhilfen, ausgefeilte Machine-Learning-Algorithmen der zweiten oder dritten Generation oder etwa mathematische Zeichenketten-Funktionen (zum Beispiel der Hamming- oder Levenshtein-Distanz, wie sie bei der Fuzzy-Suche genutzt werden)?

 

Einige Frameworks im Data-Science-Umfeld bieten bereits gute Möglichkeiten, verschiedene Algorithmen und Verfahren für die Harmonisierung von Daten anzuwenden. Es gibt dabei viele ähnliche Verfahren, welche die gleichen Ziele verfolgen, aber auf Basis unterschiedlicher Algorithmen und Vorgehensweisen.

 

Ein Verfahren reicht in der Regel nicht aus, um ein akzeptables Endergebnis zu erreichen. Eine Kombination unterschiedlicher Verfahren, die kausal miteinander verbunden sind, ist wahrscheinlich zielführender.

 

Eine strukturierte Vorbereitung der Daten (welche Felder aus welchen Tabellen sind für die Harmonisierung der Daten relevant beziehungsweise welchen Stellenwert und welche Wichtigkeit nehmen sie dabei ein) ist ein wesentlicher Schritt für ein erfolgversprechendes Ergebnis. Selbst für Experten ist es teilweise schwierig, deren Priorität richtig einzuschätzen, da viele Felder manchmal nur unter bestimmten Bedingungen mehr oder weniger wichtig sind. Ein intelligenter Prozess, welcher selbständig die Priorität der Felder (nach Kontext und Vorkommen) richtig einschätzen würde, wäre sicherlich der Königsweg.

 

Bei den Versuchen treten häufig auch Unstimmigkeiten auf. Durch große Datensätze können bei bestimmten Verfahren Probleme mit dem Speicher oder auch fehlende Assoziationen zu den Dubletten entstehen. Durch die Kombination der richtigen Verfahren erhält man als Ergebnis Dubletten mit einer Range von Wahrscheinlichkeiten. Bei einem hohen Wert handelt es sich sehr wahrscheinlich um eine Dublette, ein geringer Wert stellt vermutlich ein Unikat dar. Die Schwelle, wann es sich noch um eine Dublette handelt und wann nicht mehr, kann im Einzelfall nur der Anwender entscheiden. Die passende Lösung dient dabei als wichtige Entscheidungshilfe (für eine fehlerfreiere Stammdaten-Pflege oder als möglicher Ansatz für ein zukünftig intelligentes Stammdatenmanagement-System) für den Anwender.

Validierung von Stammdaten mittels KI

Materialien in ihren Eigenschaften zu beschreiben, ist oft ein schwieriges Unterfangen, da diese in den unterschiedlichsten Ausprägungen existieren können. Allein die valide Dimensionierung eines Materials lässt sich mittels Regelwerke nur aufwändig im Customizing abbilden.

 

Würde man aber ein KI-System mit all den möglichen Material-Eigenschaften trainieren und es für die Validierungsprüfung bei der Neuanlage beziehungsweise Änderung von Stammdaten anwenden, wären nur solche Kombinationen zulässig, die auch gültig sind. Ausgeklügelte Regelwerke wären für ein valides Stammdatenmanagement somit nicht mehr notwendig.

Intelligente Unterstützung durch Assistenz-Systeme

Zu einer zukunftsorientierten Stammdatenmanagement-Anwendung gehört auch eine gute User Experience. Dies lässt sich zum einen durch einen großen Automatismus in den Prozessen und zum anderen durch eine komfortable Interaktion mit der Applikation erzielen. Welche Art der Interaktion ist natürlicher als die Sprache?

 

Ein Chatbot-Assistent könnte zum Beispiel aufgrund seiner Fähigkeiten (Skills) Routine-Tätigkeiten übernehmen (wie die Vorbelegung von ganzen Stammdaten-Sätzen) und der Anwender schreitet nur noch kontrollierend in den Prozess ein.

Fazit

Unternehmen sind auf qualitative ERP-Stammdaten angewiesen, um im Wettbewerb konkurrenzfähig zu bleiben. Mit SAP MDG und integrierten SAP-Optimierungen lassen sich Probleme zwar minimieren, aber auch diese haben in heterogenen Systemen ihre Grenzen.

 

Stammdaten-Verantwortung, Prozessdefinition und -optimierung, benutzerfreundliche Oberflächen und KI-gestützte Prozesse und Techniken – so oder so ähnlich könnte man sich die schöne neue Welt des Stammdatenmanagements vorstellen. Doch wie weit sind wir davon noch entfernt?

 

Es besteht kein Zweifel darin, dass konsistente Stammdaten auch in Zukunft der elementare Schlüssel für wertschöpfende Geschäftsprozesse sein werden.

Martin Tempel

Als Business Development and Innovation Manager bin ich mit meinem Team immer auf der Suche nach neuen, innovativen Lösungen für altbekannte Probleme im Geschäftsalltag. "Hindernisse und Schwierigkeiten sind Stufen an denen wir in die Höhe steigen" – nach diesem Zitat von Friedrich Nietzsche entwickeln wir daher stetig neue Produkte und Lösungen, um die individuellen Hürden unserer Kunden gemeinsam mit ihnen zu überwinden und den Geschäftsalltag Stück für Stück zu optimieren.

Seite weiterempfehlen