Datenhaltung

Datenhaltung im Datawarehouse   

Beim Aufbau und Betrieb eines Datawarehouse konzentrieren sich Unternehmen meist auf die Technik. Wie Daten gesammelt, verwaltet und ausgewertet werden, muss sich jedoch vor allem nach dem Informationsbedarf der Nutzer richten.

Trotz hoher Investitionen in die zugrunde liegende Technik bleibt der Nutzen des Datawarehouse oder Datenlagers im Betriebsalltag oft hinter den Erwartungen zurück:

  • Die Beantwortung betriebswirtschaftlicher Fragen dauert zu lang. Bisweilen ist unklar, ob sich eine Frage überhaupt klären lässt.
  • Die Aussagekraft der Zahlen in Analysen und Berichten ist zweifelhaft. Kleine Abweichungen bei der Formulierung der Anfrage führen zu stark divergierenden Ergebnissen.
  • Die Bedeutung der gespeicherten Daten ist nirgends festgehalten, nur wenige Mitarbeiter kennen sich aus.
  • Extraktion, Transformation, Laden dauern zu lang, die Interdependenz der Ladevorgänge ist unzureichend dokumentiert.
  • Nach Ladehemmungen dauert es, bis das Datawarehouse wieder normal arbeitet – Analysen und Berichte verzögern sich.

Meist sind derlei Probleme nicht technisch bedingt, sondern durch Datenstrukturen und Prozesse. Die Schwierigkeit besteht beim Datawarehousing darin, dass dieses eine Querschnittfunktion erfüllt. Als Basis eines Business-Intelligence-Systems dient das Warehouse der Versorgung von Entscheidern mit aktuellen, geschäftlich verwertbaren Informationen. Demnach muss es strategisch relevante Objekte und Abläufe wie Kunde, Wertbeitrag oder Kontaktprozess abbilden.

Da solche strategischen Begriffe in den operativen Systemen keine Rolle spielen, muss man sie im Datawarehouse eigens modellieren. Dazu werden Datenelemente aus operativen Systemen zusammengeführt und etwaige Lücken geschlossen. Zudem empfiehlt es sich, die neuen Datenstrukturen auf die Erfordernisse der Auswertung hin zu optimieren. Insbesondere sollten die abgebildeten Objekte sowie ihre Merkmale leicht auffindbar und eindeutig sein.

 

Daten über Daten

Bei der technischen Umsetzung kommt es darauf an, dass sämtliche Transformationen von den Operativdaten über das Fachmodell bis in die Auswertungsschicht nachvollziehbar bleiben. Die Datenverantwortlichen müssen über die Feinheiten der Definitionen und Interdependenzen jederzeit Auskunft geben können. Ist dies nicht der Fall ist, geht das Vertrauen in die Verlässlichkeit der Informationen verloren.

Das Wissen über die Daten muss externalisiert, das heißt, aus den Köpfen der Mitarbeiter in ein allgemein zugängliches Beschreibungssystem übertragen werden. Dazu eignen sich Metadaten am besten. So wird die Beschreibung der abgebildeten Daten und Prozesse am selben Ort gepflegt wie diese selbst.

Metadaten unterstützen auch die Automation. Laderoutinen, Tabellen und eine strukturierte Dokumentation zum Nachschlagen im Intranet werden daraus generiert, Änderungen der Metadaten automatisch berücksichtigt. Auf diese Weise lässt sich das Datawarehouse schnell auf neue Informationsbedarfe einstellen.

Für die Innenarchitektur des Datawarehouse gilt das Prinzip Teile und herrsche: Daten und Prozesse sind möglichst klar abgegrenzten Modulen zuzuordnen, die etwa die Datenwelt horizontal, fachliche Einheiten hingegen vertikal unterteilen. Je höher der Organisationsgrad, desto leichter lässt sich das Warehouse neuen Anforderungen anpassen.


Ansprechpartner

Sebastian Sohr

Consileon Business Consultancy

Dr. Sebastian Sohr

Tel.: +49 721 35460-80

Projekte