Berlin, den 23. März 2020 | Unser studentischer Mitarbeiter Erik Schlüter veröffentlichte seine Bachelorarbeit zum Thema: “Konzeption eines Standards zur Messung der Datenqualität am Beispiel des Materialstammsatzes von SAP ERP”. Die innoscale AG war Praxispartner der Bachelorarbeit von Herrn Schlüter. Gemeinsam konnten wir eine Brücke von der wissenschaftlichen Arbeit in die Unternehmenspraxis schlagen.
In seiner Bachelorarbeit beschrieb er, wie aufwendig es für Unternehmen ist, Qualitätskriterien für ihre Daten zu ermitteln, weil unterschiedliche unternehmensspezifische Datenstrukturen bestehen und effiziente Konzepte für die Messung mit Hilfe einer Software wie DataRocket entwickelt werden müssen. Erik Schlüter betont die Wichtigkeit der Entwicklung eines Standards für den SAP ERP Materialstammsatz – zum Einen wegen der hohen Verbreitung des ERP-Systems am Markt und zum Anderen weil Standards für andere Datenarten wie Debitoren- und Kreditorendaten im Gegensatz zum Materialstamm mit seinen Artikel- und Stücklistenhierarchien bereits existieren. Darüber hinaus ist der Aufbau von Qualitätskriterien auf der grünen Wiese ein aufwendiges und kostenintensives Unterfangen in jedem MDM- und Datenqualitätsprojekt.
Template zur Messung der Datenqualität für den SAP Materialstamm
Herr Schlüter entwickelte in seiner praxisnahen Bachelorarbeit an der Hochschule Brandenburg ein standardisiertes Set an Qualitätskriterien. Dieses Template kann als Blueprint zur Messung der Datenqualität für den SAP Materialstammdaten eingesetzt werden. Es wurde von einem großen Automotive-Zulieferer (Woco Industrietechnik GmbH) praktisch evaluiert.
Die Vorgehensweise bestand darin, zunächst einen Entwurf für standardisierte Datenqualitätskriterien auf Basis eines Praxisprojektes zu erstellen und durch einen Kunden der innoscale AG evaluieren und validieren zu lassen. Dazu wurde ein Interview mit Woco durchgeführt, um deren Anforderungen zu ermitteln. Herr Schlüter nutzte außerdem vergangene Projektarbeiten der innoscale AG (in anonymisierter Form) in Hinblick auf die verwendeten Attribute, um sie mit der Software DataRocket zu analysieren. Deren Datenqualität konnte er unter Nutzung verschiedener Funktionen von DataRocket messen.
Anforderungen an die Datenqualität im SAP Materialstamm
Die Testdateien und abgeschlossenen Projekten wurden auf deren Anforderungen an Datenqualität geprüft. Dazu wurden entsprechende Regeln formuliert, die bspw. die Vollständigkeit, Aktualität, Übersichtlichkeit, Fehlerfreiheit und Glaubwürdigkeit der Daten betreffen. Eine Zusammensetzung aus mehreren Dimensionen, die innerhalb einer Regel abgebildet werden, ist ebenfalls möglich.
Die einzelnen Regeln wurden in Form von Datenqualitätskriterien im Tool DataRocket abgebildet. Einige Beispiele sollen hier vorgestellt werden:
Beispiel 1: Regel für DQ-Dimension Vollständigkeit:
Das Feld Kurztexte darf nicht leer sein, wenn als Sprache Englisch hinterlegt wurden ist und die Materialarten ‘DRUK’, ‘FERT’, ‘HALB’, ‘HAWA’, ‘ROH’, ‘TEIL’, ‘VERP’ sind.
- Regelumschreibung: Materialien müssen mindestens Kurztexte mit Sprachschlüssel EN haben bei den Materialarten ‘DRUK’, ‘FERT’, ‘HALB’, ‘HAWA’, ‘ROH’, ‘TEIL’, ‘VERP’.
- Geltungsbereich: MARA-MTART = ‘DRUK’, ‘FERT’, ‘HALB’, ‘HAWA’, ‘ROH’, ‘TEIL’, ‘VERP’
- Technische Spezifikation: MAKT-Datensatz mit SPRAS = EN existiert
Beispiel 2: Regel für DQ-Dimension Fehlerfreiheit
-  Regelumschreibung: Bei verkaufsfähigen Ids (VTL Status „leer“oder
„01“oder „02“ oder „03“) muss das Feld „StatistikGrMaterial“ mit dem Wert 1 gefüllt sein. - Geltungsbereich: MVKE-VMSTA = leer, ’01’, ’02’, ’03’
- Technische Spezifikation: MVKE-VERSG = ‘1’
Nicht nur im Rahmen dieser Bachelorarbeit sondern auch in Kundenprojekten muss das Regelset durch das Unternehmen und seine Fachbereiche angepasst werden. Deshalb wurden im Anschluss die Anforderungen des Praxispartners ergänzt. Dieser legte einen besonderen Fokus auf drei Arten von Regeln:
- Schreibweisen (scharfes S, Umlaute, keine Abkürzungen, keine Sonderzeichen)
- Attribute als Pflichtfelder (z. B. Materialstatus, Brutto- und Nettogewicht, Kurztexte)
- Abhängigkeiten zwischen den einzelnen Attributen
Bluefield-Ansatz für die Messung der Datenqualität in SAP
Im Ergebnis konnten für 321 Attribute im SAP ERP Materialstammsatz Prüfregeln definiert werden. Die gewonnenen Erkenntnisse wurden zusammengeführt und zu einem Standardset für Datenqualitätskriterien im SAP Materialstamm verdichtet. Die nachfolgende Abbildung zeigt einen Auszug aus dem Standardset zur Messung der Datenqualität im SAP Materialstamm.
Die Spalten “Tabelle”, “Feldname” und “Kurzbeschreibung” stammen aus der SAP Tabelle MARA – Allgemeine Materialdaten – Stammdaten. Die nächste Spalte enthält den Namen der Pipeline, die in DataRocket zur Qualitätsprüfung für dieses Attribut zur Verfügung steht. Die “Textuelle Regelbeschreibung” erstellte Herr Schlüter unter Auswertung der Praxisprojekte und den Anforderungen des Praxispartners.
In der Spalte “Regelbeschreibung Attribute” wird die Anforderung in Form der verwendeten Attribute beschrieben. In der Spalte “Art der Messung” wird die Einteilung der Regeln in die Kategorien Syntaktik, technische Messung und Vollständigkeit vorgenommen. Die Spalte “Umsetzung in DataRocket” beschreibt Filterarten und Typen von Qualitätskriterien, die DataRocket prüft. Beispielsweise ermöglicht Range Checker die Prüfung, ob Werte eines Attributs innerhalb oder außerhalb eines individuell definierten Intervalls liegen. Attribute Compare ermöglicht einen Vergleich von zwei Attributen miteinander – mit einem individuell definierten Grad an Unschärfe.
Diese Standardkriterien stehen nun in einem Template bereit und können für zukünftige Projekte der innoscale AG genutzt werden. Getreu dem Bluefield-Ansatz, etwas Vorhandenes als Grundlage zu nutzen und darauf aufzubauen, ist es uns nun möglich, schneller und effizienter ein individuelles Set zur Datenqualitätsmessung für unsere Kunden aufzubauen.
Wir gratulieren Erik zum absolvierten Bachelorstudium!